《套装3本Spark快速大数据分析 Hive编程指南 Hadoop数据分析spark大数据处理教程书籍》[88M]百度网盘pdf下载

套装3本Spark快速大数据分析 Hive编程指南 Hadoop数据分析spark大数据处理教程书籍pdf下载

套装3本Spark快速大数据分析 Hive编程指南 Hadoop数据分析spark大数据处理教程书籍百度网盘pdf下载

作者:

简介:套装3本Spark快速大数据分析 Hive编程指南 Hadoop数据分析spark大数据处理教程书籍

出版社：

出版时间：

pdf下载价格：0.00￥

免费下载

前去下载

书籍下载

下载地址

内容介绍

商品参数

Spark快速大数据分析
	定价	59.00
	出版社	人民邮电出版社
	版次	1
	出版时间	2015年09月
	开本	16开
	作者	卡劳
	装帧	平装
	页数	210
	字数	343000
	ISBN编码	9787115403094

Hadoop数据分析
	定价	69.00
	出版社	人民邮电出版社
	版次	1
	出版时间	2015年09月
	开本	16开
	作者	卡劳
	装帧	平装
	页数	211
	字数
	ISBN编码	9787115479648

Hive编程指南
	定价	69.00
	出版社	人民邮电出版社
	版次	1
	出版时间	2013年12月
	开本	16开
	作者	卡普廖洛
	装帧	平装
	页数	318
	字数
	ISBN编码	9787115333834

序 xi

译者序 xiv

序 xvi

前言 xvii

D11章 Spark数据分析导论 1

1.1 Spark是什么 1

1.2 一个大一统的软件栈 2

1.2.1 Spark Core 2

1.2.2 Spark SQL 3

1.2.3 Spark Streaming 3

1.2.4 MLlib 3

1.2.5 GraphX 3

1.2.6 集群管理器 4

1.3 Spark的用户和用途 4

1.3.1 数据科学任务 4

1.3.2 数据处理应用 5

1.4 Spark简史 5

1.5 Spark的版本和发布 6

1.6 Spark的存储层次 6

D12章 Spark下载与入门 7

2.1 下载Spark 7

2.2 Spark中Python和Scala的shell 9

●前言ix

●XX部分分布式计算入门

●dy 章数据产品时代2

●1.1 什么是数据产品2

●1.2 使用Hadoop构建大规模数据产品4

●1.2.1 利用大型数据集4

●1.2.2 数据产品中的Hadoop5

●1.3 数据科学流水线和Hadoop生态6

●1.4 小结8

●第2章大数据操作9

●2.1 基本概念10

●2.2 Hadoop架构11

●2.2.1 Hadoop集群12

基础知识

1.1Hadoop和MapReduce综述

1.2Hadoop生态中的Hive

1.2.1Pig

1.2.2HBase

1.2.3Cascading、Crunch及其他

1.3Java和Hive：词频统计算法

1.4后续事情

第2章基础操作

2.1安装预先配置好的虚拟机

2.2安装详细步骤

2.2.1装Java

2.2.2安装Hadoop

2.2.3本地模式、伪分布式模式和分布式模式

2.2.4测试Hadoop

2.2.5安装Hive

2.3Hive内部是什么

2.4启动Hive

2.5配置Hadoop环境

2.5.1本地模式配置

内容介绍

本书由 Spark 开发者及核心成员共同打造，讲解了网络大数据时代应运而生的、能高效迅捷地分析处理数据的工具——Spark，它带领读者快速掌握用 Spark 收集、计算、简化和保存海量数据的方法，学会交互、迭代和增量式分析，解决分区、数据本地化和自定义序列化等问题。

通过提供分布式数据存储和并行计算框架，Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作。本书旨在通过以可读且直观的方式提供集群计算和分析的概览，为数据科学家深入了解特定主题领域铺平道路，从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分，部分从很好高的层次介绍分布式计算，讨论如何在集群上运行计算；第二部分则重点关注数据科学家应该了解的工具和技术，意在为各种分析和大规模数据管理提供动力。

编程指南》是一本ApacheHive的编程指南，旨在介绍如何使用Hive的SQL方法――HiveQL来汇总、查询和分析存储在Hadoop分布式文件上的大数据集合。《Hive编程指南》通过大量的实例，首先介绍如何在用户环境下安装和配置Hive，并对Hadoop和MapReduce进行详尽阐述，终演示Hive如何在Hadoop生态进行工作。

《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop的数据库管理员阅读使用。

作者介绍

Holden Karau，是Databricks的软件开发工程师，活跃于开源社区。她还著有《Spark快速数据处理》。

套装3本Spark快速大数据分析 Hive编程指南 Hadoop数据分析spark大数据处理教程书籍百度网盘pdf下载

免费下载

书籍下载

内容介绍

相关内容