大数据项目管理:从规划到实现pdf下载

大数据项目管理:从规划到实现百度网盘pdf下载

作者:
简介:大数据项目管理:从规划到实现
出版社:人民邮电出版社有限公司
出版时间:2020-01-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

编辑推荐
许多公司会在大数据项目的实施细节上下很多功夫,例如研究分布式处理引擎和数据分析算法。这并没有错,但不要因为一棵树而错过整片森林。本书将为你打开更广阔的视野,展示如何从大数据项目的规划阶段开始,一步步走向成功。无论是首席信息官、首席技术官、项目经理,还是架构师和开发人员,都能通过本书得到启迪。

- 开始规划:思考大数据项目的主要类型
- 评估和选择数据管理解决方案
- 降低与技术、团队、需求相关的风险
- 探索良好的接口设计模式
- 为项目选择合适的分布式存储系统
- 规划和实施元数据收集
- 使用数据管道确保数据完整性
- 根据并行处理引擎的特征评估处理框架
内容简介
本书提供了一个框架,从整体上介绍与大数据项目开发相关的基本概念,帮助读者评估大数据项目,理解成功的现代数据项目的基本要素。全书共8章,内容包括现代数据项目的主要类型、生命周期、风险管理、接口设计、分布式存储系统、元数据管理、数据处理等。本书旨在让读者厘清思路,顺利地从数据项目的规划阶段走到执行阶段,实现健壮、可维护的架构和解决方案。
作者简介
特德·马拉斯卡(Ted Malaska),Capital One的企业架构主管,曾在暴雪娱乐公司担任全球视野工程总监,负责为《魔兽世界》《守望先锋》《炉石传说》等游戏提供支持。他为众多开源项目贡献过代码,并与塞德曼等人合著有《Hadoop应用架构》。 乔纳森·塞德曼(Jonathan Seidman),Cloudera云计算团队的软件工程师。在加入Cloudera之前,他是Orbitz Worldwide大数据团队的技术负责人,负责为一个流量巨大的网站管理Hadoop集群。塞德曼与马拉斯卡等人合著有《Hadoop应用架构》。 【译者介绍】 薛命灯,InfoQ高级社区编辑,毕业于厦门大学软件学院,拥有十余年软件开发和架构经验,曾在多家大型软件公司任职,另译有《Kafka权威指南》等技术图书。
目录
版权声明
O'Reilly Media, Inc. 介绍
前言
第 1 章 数据项目的主要类型及考虑因素
第 2 章 评估和选择数据管理解决方案
第 3 章 数据项目的风险管理
第 4 章 接口设计
第 5 章 分布式存储系统
第 6 章 企业元数据
第 7 章 确保数据完整性
第 8 章 数据处理
关于作者
关于
前言
  既然你开始阅读本书,那么就应该知道,近几年来,数据管理领域发生了巨大的变化。我们已经看到了从第三方专有解决方案到新的开源分布式数据系统的转变。通常使用“大数据”来指代这些新的解决方案(我们发现这个词的指代作用越来越弱),但其实早期的很多专有系统也采用了可以存储和处理大量数据的分布式架构。尽管这些专有解决方案和新的开源解决方案都可以用来解决很多相同的问题,但它们之间存在一些明显的差异,这些差异促成了新系统的发展。这些差异不仅体现在开源的经济性方面,也与技术的发展有关。技术的发展促进了新系统的实现,而如果使用以前的解决方案来实现这些系统颇具挑战性。
  随着这些系统的发展,出现了很多相关的书、文章、培训、会议等。这些资源可以帮助你以及这个领域的其他从业者更好地使用这些系统。那么,为什么还要再写一本与“大数据”相关的书呢?我们想说的是:不要因为一棵树而错过整片森林。这些资源大都侧重于底层的细节,例如使用 MapReduce 或 Spark 之类的分布式处理引擎来实现应用程序,或者应用高级算法来分析数据。除此之外,也有一些资源关注更高层次的架构,例如由本书作者和另外两位作者合著的《Hadoop 应用架构》1。