基本信*
书名:Spark快速 数据分析
定价:59.0元
作者:(美)卡劳(Karau,H.), 远
出版社:人 邮电出版社
出版日期:20*5-09-0*
ISBN:9787**5403094
字数:343000
页码:
版次:*
装帧: 装
开本:*6开
商品重量:0.4kg
编辑推荐
Spark开发者出品!
《Spark快速 数据分析》是一本为Spark初学者准备 书,它没有过多深入实现细节,而是更多关注上层 户 具 法。不过,本书 不仅仅限于Spark 法,它对Spark 核 概念 基本原理也有较为全面 介绍,让读者能够知其然且知其所以然。
本书介绍了开源 算系统Apache Spark,它可以加速数据分析 实现 运行。利 Spark,你可以 Python、Java以及Scala 简易API来快速 控 规模数据 。
本书由Spark开发者编写,可以让数据科学家 工程师即刻上手。你能学到如何使 简短 码实现复杂 并行作业,还能了解从简 处理作业到流处理以及 器学习等应 。
内容提要
本书由 Spark 开发者及核 成员共同打造,讲解了网络 数据时 应运而* 、能高效迅捷地分析处理数据 工具——Spark,它带领读者快速掌握 Spark 收 、 算、简化 保存海量数据 法,学会交互、迭 增量式分析,解决分区、数据本地化 自定义序列化等问题。
目录
作者介绍
Holden Karau是Da*bricks 软件开发工程师,活跃于开源社区。她还 有《Spark快速数据处理》。
Andy Konwinski是Da*bricks 合创始人,Apache Spark项目技*专家,还是Apache Mesos项目 合发起人。
Patrick Wendell是Da*bricks 合创始人,也是Apache Spark项目技*专家。他还负责维护Spark核 擎 几 子系统。
Matei Zaharia是Da*bricks CTO,同时也是Apache Spark项目发起人以及Apache基金会副 。
文摘
序言