云原生分布式存储基石:etcd深入解析pdf下载

云原生分布式存储基石:etcd深入解析百度网盘pdf下载

作者:
简介:云原生分布式存储基石:etcd深入解析
出版社:机械工业出版社
出版时间:2018-11-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介
  本书为读者深度解析分布式键值存储系统,全书分为3部分,第1部分是对分布式系统的概念和一致性协议的综述,重点解析Raft协议,使读者对分布式键值存储系统有初步了解;第2部分介绍etcd安装、部署、运维、安全等方面的知识,帮助读者进一步掌握分布式系统的使用方法,熟悉其常见功能和使用场景;第3部分是本书的特色部分,从代码层次深入探讨了etcd各大关键特性的具体设计与实现原理,读者读完本部分,会对整个etcd的架构有更加清晰的认识,可以从中汲取灵感,从而将一些实用的经验应用到自己的分布式系统中。
目录
前言
第一部分 基础篇
第1章 分布式系统与一致性协议
1.1 CAP原理
1.2 一致性
1.3 Paxos协议
1.4 Raft协议:为可理解性而生
第二部分 实战篇
第2章 为什么使用etcd
2.1 etcd是什么
2.2 etcd架构简介
2.3 etcd典型应用场景举例[1]
2.4 etcd性能测试
2.5 etcd与其他键值存储系统的对比
2.6 使用etcd的项目
2.7 etcd概念词汇表
2.8 etcd发展里程碑
第3章 etcd初体验
3.1 单机部署
3.2 多节点集群化部署
3.3 etcdctl常用命令行
3.4 etcd常用配置参数
第4章 etcd开放API之v2
4.1 API保证
4.2 etcd v2API
4.3 统计数据
4.4 member API
第5章 etcd开放API之v3
5.1 从etcd v2到etcd v3
5.2 gRPC服务
5.3 请求和响应
5.4 KV API
5.5 watch API
5.6 Lease API
5.7 API使用示例
第6章 etcd集群运维与稳定性
6.1 etcd升级
6.2 从etcd v2切换到v3
6.3 运行时重配置
6.4 参数调优
6.5 监控
6.6 维护
6.7 灾难恢复
6.8 etcd网关
6.9 gRPC代理
6.10 故障恢复
6.11 硬件
第7章 etcd安全
7.1 访问安全
7.2 etcd访问控制实践
7.3 传输安全
第三部分 高级篇
第8章 多版本并发控制
8.1 为什么选择MVCC
8.2 etcd v2存储机制实现
8.3 etcd v3数据模型
8.4 etcd v3的MVCC的实现
8.5 etcd v3MVCC源码分析
8.6 为什么选择BoltDB作为底层的存储引擎
第9章 etcd的日志和快照管理
9.1 数据的持久化和复制
9.2 etcd的日志管理
9.3 etcd v2的快照管理
第10章 etcd v3的事务和隔离
10.1 事务ACID
10.2 事务的隔离性
10.3 etcd的事务
第11章 etcd watch机制详解
11.1 etcd v2的watch机制详解
11.2 etcd v3的watch实现机制
前言
  前言
  为什么要写这本书
  近年来,容器和云原生生态蓬勃发展,我们正身处于一波云原生的浪潮中。随着我们习惯于在云端产生和收集的数据,云端积累了海量的数据并继续以惊人的速度增长。如何实现数据分布式、一致性存储,确保云原生环境的可扩展性和高可用性,是各组织亟须解决的现实问题。
  云计算时代,etcd必将成为云原生和分布式系统的基石!而奠定etcd基石地位的三个关键因素是Raft协议、Go语言和生态。
  etcd从一开始就摒弃了以复杂和难以理解著称的Paxos,而是另辟蹊径地通过Raft化繁为简,实现了一套健壮的分布式一致性协议的SDK,这套SDK被很多其他分布式数据库/系统采用,甚至包括etcd兄弟项目rkt的竞争对手Docker。
  至于被誉为云时代C语言的Go语言,具备天然的高并发能力、易安装和可读性好等优点,成就了etcd的高性能和项目的易维护性,极大地激发了来自全世界的开源工程师参与etcd的热情。云原生领域用Go语言编写的重量级项目不胜枚举,例如Docker、Kubernetes和Istio等。
  etcd相对于Zookeeper是一个年轻且更加轻量的项目,它拥有更加健康和有活力的社区。截至这本书出版前夕,etcd在Github上的star数是20000+,fork数是4000+,拥有超过400名活跃的代码贡献者。不能忽视的一点是,etcd已经被Kubernetes和Cloud Foundry等顶级云原生项目采用,并借势经过了Google、华为云、Red Hat、IBM、阿里等IT巨头大规模生产环境的考验。随着etcd进入CNCF社区孵化,成为由CNCF治理的顶级项目,厂商中立的运作模式将进一步繁荣etcd的开源生态。
  顺势而为,再加上合理的架构设计,恰如其分的实现,完全让人有理由相信etcd的成功。
  在我最开始接触Kubernetes的时候,就和etcd打过交道了。etcd在华为PaaS平台作为关键组件应用在分布式数据协同与更新观察等架构中。犹记得那时etcd刚发布,我们希望它提升华为PaaS平台的扩展性、性能和稳定性。因此,我们团队还专门成立etcd特别攻关小组,吃透了etcd的内部运作机制和核心技术。我很荣幸成为这个小组的成员。从那时起,我便对etcd着了迷,一口气翻看了etcd的源码,同时也向etcd社区提交了若干个patch。
  对于我们团队来说,我们很荣幸见证了etcd在技术和社区的持续进步并成长为Kubernetes项目的一部分。etcd v3的正式发布延续了这个势头,我们期待将来有更多的功能和特性被引入华为云容器平台的产品中。我们也很高兴过去能够与etcd团队和技术社区一起工作,并将持续与etcd技术社区协作,将这项技术推到一个更高的层面。
  至于为什么要在工作之余抽空写这本书,我们在容器和Kubernetes技术布道的过程中发现,国内从事该领域的工程师普遍对etcd了解不多,出了问题鲜有定位手段,而etcd官网又没有中文资料,因特网上也缺少深入解析etcd原理的文章。本着回馈社区和普及云原生技术的原则,我们华为云容器服务团队决定编写这本书,做第一个“吃螃蟹”的人。
  毕竟“源码面前,了无秘密”。
  读者对象
  这里我们可以根据软件需求划分出本书的受众:
  ·分布式系统工作者
  ·Raft算法研究者
  ·etcd各个程度的学习者
  ·Kubernetes用户与开发者
  如何阅读本书
  本书分为三部分,其中第二部分以接近实战的实例来讲解etcd的使用,相较于其他两部分更独立。如果你是一名分布式系统的初学者,请一定从第1章的基础理论知识开始学习。
  第一部分为基础篇,包括第1章,我们将简单地介绍分布式系统的基本理论,并且详解Raft算法的工作原理,帮助读者了解一些掌握etcd的基础背景知识。
  第二部分为实战篇,包括第2~7章,我们将着重讲解etcd的常见功能和使用场景,包括etcd的架构分析、命令行使用、API调用、运维部署等。
  第三部分为高级篇,包括第8~11章,我们将直接打开etcd的源码,为喜欢刨根问底的读者深度剖析etcd的实现原理。
  勘误和支持
  由于作者的水平有限,编写的时间也很仓促,书中不妥之处在所难免,恳请读者批评指正。如果你发现了书中的错误或者有更多的宝贵意见,欢迎发送邮件至我的邮箱m1093782566@163.com,我很期待能够获得你们的真挚反馈。
  致谢
  我首先要感谢etcd的工程师团队,他们编写并开源了这么一款足以成为云原生基石的分布式存储系统——etcd。
  感谢华为云容器服务团队的高级架构师、Kubernetes社区核心维护者Kevin老师,他为这本书的出版提供了良好的技术氛围和宝贵的实战经验支持。
  感谢CMU在读硕士研究生梁明强同学,在写作过程中为我提供了犀利而宝贵的意见和文字。
  感谢机械工业出版社华章公司的编辑杨绣国老师,感谢你的魄力和远见,在这一年多的时间中始终支持我的写作,你的鼓励和帮助引导我能顺利完成全部书稿。
  我要感谢我的爸爸、妈妈、外公、外婆,感谢你们将我培养成人,并时时刻刻为我灌输着信心和力量!
  我要感谢我的爱人,你的陪伴和鼓励使得这本书得以顺利完成。
  谨以此书,献给我最亲爱的家人,以及众多热爱云原生与分布式技术的朋友们。
  杜军
  中国,华为杭州研究所,2018年9月
精彩书摘
  第1章 分布式系统与一致性协议
  现如今,摩尔定律的影响已经严重衰减甚至近于失效,但我们却实实在在地看到了计算能力的大幅度提升。在围棋人机大战里,人工智能AlphaGo打败李世石、柯洁的事实仍历历在目。计算能力的提升在很多时候都是源于系统(大数据、人工智能、云计算、区块链等)采用了分布式架构。《分布式系统概念与设计》一书中对分布式系统概念的定义如下:
  分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。
  简单来说,分布式系统就是一组计算机节点和软件共同对外提供服务的系统。但对于用户来说,操作分布式系统就好像是在请求一个服务器。因为在分布式系统中,各个节点之间的协作是通过网络进行的,所以分布式系统中的节点在空间分布上几乎没有任何限制,可以分布于不同的机柜、机房,甚至是不同的国家和地区。
  分布式系统的设计目标一般包括如下几个方面。
  ·可用性:可用性是分布式系统的核心需求,其用于衡量一个分布式系统持续对外提供服务的能力。
  ·可扩展性:增加机器后不会改变或极少改变系统行为,并且能获得近似线性的性能提升。
  ·容错性:系统发生错误时,具有对错误进行规避以及从错误中恢复的能力。
  ·性能:对外服务的响应延时和吞吐率要能满足用户的需求。
精彩插图