Spark的流行不是一个偶然性,它像黏合剂一样整合了百花齐放的大数据生态系统的众多功能。无论你是想学习使用Spark,还是想深入了解Spark的内核原理,这本书都是你入门的较好选择。
-- 常雷博士,Apache HAWQ创始人
Apache Spark作为大数据的后起之秀,以其高效的迭代计算和完备的生态圈成为大数据处理的翘楚。本书从源代码角度深入浅出分析了Spark的核心原理,同时能够结合实例进行讲解,让读者能够理论联系实际,相信本书对于大数据及分布式系统研究,以及Spark系统学习人员是个很好的选择。
-- 祝军,中油瑞飞大数据架构师
Spark是一个优秀的大数据计算框架,随着云时代的来临,大数据的存储、处理、分析、应用逐渐成为各个行业必须要具备的能力。本书以图形化方式全面讲解了Spark生态系统,从入门应用到内核原理解析,并配合大量的实例,相信对你的学习总结和实际工作都有很好的帮助。
--付彩宝 京东服饰家居事业部商家研发部负责人
全书编排合理,初学者可以根据作者的引导一步步成长为Spark的开发高手,有经验的开发者也可以通过本书进一步了解Spark的内在机制,从而帮助读者去解决实际工作中的棘手问题,或者深入地优化应用的性能,在当前的市场上能做到如此深入浅出而又紧跟Spark社区步伐的图书实在不多,为此特向广大技术爱好力荐此书。
--何云龙,大规模机器学习专家 京东大数据架构师