《大数据系统构建 可扩展实时数据系统构建原理与 佳实践 大数据系统开发教程书籍 分布式》[58M]百度网盘|亲测有效|pdf下载
大数据系统构建 可扩展实时数据系统构建原理与 佳实践 大数据系统开发教程书籍 分布式
更新日期:2024-07-23 22:19:19
浏览量:1074
价格:0.0¥

书籍下载
内容介绍

大数据系统构建:可扩展实时数据系统构建原理与 佳实践

 

定价:¥79.00

作者:(美)南森·马茨(Nathan Marz),詹姆斯·沃伦(James Warren)

I S B N :978-7-111-55294-9条码书号:9787111552949上架日期:2016-12-13出版日期:2016-12-1版       次:1-1出 版 社:机械工业出版社原出版社:Waterside Productions,Inc.丛 书 名: 大数据技术丛书 页     数:282    

本书将教你充分利用集群硬件优势的架构,以及专门设计用来捕获和分析网络规模数据的新工具,来创建这些系统。其中描述了一个可扩展的、易于理解大数据系统的方法,可以由小团队构建并运行;并利用一个实际示例,基于大数据系统的理论在实践中实现它们来指导读者。本书共18章。第1章介绍了数据系统的原理,并对Lambda架构进行了概述;第2章到第9章集中阐述了Lambda架构的批处理层;第10章和第11章讲述服务层的内容;第12章到17章讲述速度层的内容;第18章再次巩固Lambda架构的相关知识,并进行查漏补缺

译者序

前  言

关于本书

致  谢

第1章大数据的新范式 

1.1本书是如何组织的 

1.2扩展传统数据库 

1.2.1用队列扩展 

1.2.2通过数据库分片进行扩展 

1.2.3开始处理容错问题 

1.2.4损坏问题 

1.2.5到底是哪里出错了 

1.2.6大数据技术是如何起到帮助

作用的 

1.3 NoSQL不是万能的 

1.4基本原理 

1.5大数据系统应有的属性 

1.5.1鲁棒性和容错性 

1.5.2低延迟读取和更新 

1.5.3可扩展性 

1.5.4通用性 

1.5.5延展性 

1.5.6即席查询 

1.5.7 少维护 

1.5.8可调试性 

1.6全增量架构的问题 

1.6.1操作复杂性 

1.6.2实现 终一致性的极端

复杂性 

1.6.3缺乏容忍人为错误 

1.6.4全增量架构解决方案与Lambda

架构解决方案 

1.7 Lambda架构 

1.7.1批处理层 

1.7.2服务层 

1.7.3批处理层和服务层满足几乎所有

属性 

1.7.4速度层 

1.8技术上的 新趋势 

1.8.1  CPU并不是越来越快 

1.8.2弹性云 

1.8.3大数据充满活力的开源生态

系统 

1.9示例应用:SuperWebAnalytics.com 

1.10总结 

,部分批处理层

第2章大数据的数据模型 

2.1数据的属性 

2.1.1数据是原始的 

2.1.2数据是不可变的 

2.1.3数据是永远真实的 

2.2基于事实的数据表示模型 

2.2.1事实的示例及属性 

2.2.2基于事实的模型的优势

2.3图模式 

2.3.1  图模式的元素 

2.3.2可实施模式的必要性 

2.4 SuperWebAnalytics.com的完整

数据模型 

2.5总结 

第3章大数据的数据模型:示例 

3.1为什么使用序列化框架 

3.2  ApaChe ThriR 

3.2.1节点

3.2.2边 

3.2.3属性

3.2.4把一切组合成数据对象 

3.2.5模式演变 

3.3序列化框架的局限性 

3.4总结 

第4章批处理层的数据存储 

4.1  主数据集的存储需求 

4.2为批处理层选择存储方案 

4.2.1使用键/值存储主数据集 

4.2.2分布式文件系统 

4.3分布式文件系统是如何工作的 

4.4使用分布式文件系统存储主数据集

4.5垂直分区 

4.6分布式文件系统的底层性质 

4.7在分布式文件系统上存储

SuperWebAnalytics.com的

主数据集 

4.8总结 

第5章批处理层的数据存储:

示例 

5.1使用HDFS 

5.1.1小文件问题 

5.1.2转向更高层次的抽象 

5.2使用Pail在批处理层存储数据 

5.2.1  Pail基本操作 

5.2.2序列化对象到Pail中 

5.2.3使用Pail进行批处理操作 

5.2.4使用Pail进行垂直分区 

5.2.5 Pail文件格式与压缩 

5.2.6 Pail优点的总结 

5.3  存储SuperWebAnalytics.com的

主数据集 

5.3.1  Thrift对象的结构化Pail 

5.3.2 SuperWebAnalytics.com的基础

Pail 

5.3.3用于垂直分区数据集的分片

Pail 

5.4总结 

第二部分服务层