Spark权威指南美比尔·尚贝尔马特·扎哈里亚著张岩峰王方京陈晶晶译网络通信新pdf下载pdf下载

Spark权威指南美比尔·尚贝尔马特·扎哈里亚著张岩峰王方京陈晶晶译网络通信新百度网盘pdf下载

作者:
简介:本篇主要提供Spark权威指南美比尔·尚贝尔马特·扎哈里亚著张岩峰王方京陈晶晶译网络通信新pdf下载
出版社:墨马图书旗舰店
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍



商品参数

               

商品基本信息,请以下列介绍为准
图书名称:  Spark权威指南
作者:  Bill Chambers,Matei Zaharia
定价:  128.00
ISBN号:  9787519840099
出版社:  中国电力出版社


  内容简介

通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。

本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。

本书将Spark功能分解为若干独立主题来进行全面介绍。
本书的主要内容有:

  • 大数据技术和Spark概述。
  • 通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
  • 了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
  • 了解Spark如何在集群上运行。
  • Spark集群和应用程序的调试、监控、和调优。
  • 学习Spark强大的流处理引擎——结构化流处理。
  • 学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。


编辑推荐

通过本书你将了解到如何使用、部署和维护Apache Spark开源集群计算框架。

本书由Spark的创始人所撰写,重点介绍Spark*版本的新功能和新特点。

本书将Spark功能分解为若干独立主题来进行全面介绍。

 

你将接触到Spark的基本操作和常用函数,还包括一种全新的构建端到端流数据

应用的结构化流处理API。开发人员和系统管理员将了解到Spark的监控、调优,

以及调试的原则和方法,并通过使用Spark提供的可扩展机器学习库Mllib来了解

机器学习算法的实现技术。




  作者简介

Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助

客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客,

 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位,

 研究方向为数据科学。Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首

席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 

并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,

也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了

2014年美国计算机学会博士论文奖和VMware系统研究奖。



  目录