Spark大数据处理技术pdf下载

Spark大数据处理技术百度网盘pdf下载

作者:
简介:Spark大数据处理技术
出版社:
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

书名:Spark大数据处理技术

定价:65.00元

作者:夏俊鸾 著

出版社:电子工业出版社

出版日期:2015-01

ISBN:9787121250811

字数:346千字

页码:336

版次:1

装帧:平装

开本:16开

商品标识:

[chatu]

编辑推荐


  《Spark大数据处理技术》是一本全面介绍Spark及Spark生态圈相关技术的书籍,是国内首本深入介绍Spark原理和架构的技术书籍。主要内容有Spark基础功能介绍及内部重要模块分析,包括部署模式、调度框架、存储管理以及应用监控;同时也详细介绍了Spark生态圈中其他的软件和模块,包括SQL处理引擎Shark和SparkSQL、流式处理引擎SparkStreaming、图计算框架Graphx以及分布式内存文件系统Tachyon。《Spark大数据处理技术》从概念和原理上对Spark核心框架和生态圈做了详细的解读,并对Spark的应用现状和未来发展做了一定的介绍,旨在为大数据从业人员和Spark爱好者提供一个更深入学习的平台。
  《Spark大数据处理技术》适合任何大数据、Spark领域的从业人员阅读,同时也为架构师、软件开发工程师和大数据爱好者展现了一个现代大数据框架的架构原理和实现细节。相信通过学习《Spark大数据处理技术》,读者能够熟悉和掌握Spark这一当前流行的大数据框架,并将其投入到生产实践中去。

内容提要


目录


第1章Spark系统概述
1.1大数据处理框架
1.2Spark大数据处理框架
1.2.1RDD表达能力
1.2.2Spark子系统
1.3小结

第2章SparkRDD及编程接口
2.1Spark程序“HelloWorld”
2.2SparkRDD
2.2.1RDD分区(partitions)
2.2.2RDD优先位置(preferredLocations)
2.2.3RDD依赖关系(dependencies)
2.2.4RDD分区计算(compute)
2.2.5RDD分区函数(partitioner)
2.3创建操作
2.3.1集合创建操作
2.3.2存储创建操作
2.4转换操作
2.4.1RDD基本转换操作
2.4.2键值RDD转换操作
2.4.3再论RDD依赖关系
2.5控制操作(controloperation)
2.6行动操作(actionoperation)
2.6.1集合标量行动操作
2.6.2存储行动操作
2.7小结

第3章Spark运行模式及原理
3.1Spark运行模式概述
3.1.1Spark运行模式列表
3.1.2Spark基本工作流程
3.1.3相关基本类
3.2Local模式
3.2.1部署及程序运行
3.2.2内部实现原理
3.3Standalone模式
3.3.1部署及程序运行
3.3.2内部实现原理
3.4Localcluster模式
3.4.1部署及程序运行
……
第4章Spark调度管理原理
第5章Spark的存储管理
第6章Spark监控管理
第7章Spark架构与安装配置
第8章SQL程序扩展
第9章SparkSQL
第10章SparkStreaming流数据处理框架
第11章GraphX计算框架
第12章Tachyon存储系统

作者介绍


文摘


[chatu]

媒体推荐