包邮 云原生敏捷运维从入门到精通+大数据定义智能运维+智能运维从0搭建大规模分布式AIOps系统pdf下载

包邮 云原生敏捷运维从入门到精通+大数据定义智能运维+智能运维从0搭建大规模分布式AIOps系统百度网盘pdf下载

作者:
简介:包邮 云原生敏捷运维从入门到精通+大数据定义智能运维+智能运维从0搭建大规模分布式AIOps系统
出版社:
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍




9787111641308 9787111642695 9787121346637

定价 99.00
出版社 机械工业出版社
版次 1
出版时间 2020年01月
开本 16开
作者 王宇 张乐 侯皓星 编著
装帧 平装
页数
字数
ISBN编码 9787111642695


云原生敏捷运维从入门到精通》共8章。1章介绍云化产品的需求分析以及云资源的规划和选型;2章通过对开源工具Redmine的讲解,提出云化产品的项目管理解决方案;3章对版本控制系统Git的使用原理、基本作和场景进行了详细的阐述,并简单介绍了两大Git代码托管服务GitHub和GitLab;4章详细讲解了流行的持续集成系统Jenkins;5章主要讨论如何在云原生的环境下规划测试计划,从而对产品的功能、性能、安全等方面进行可重复、可迭代的质量评估;6章以实例的方式讲解Ansible和Kubernetes在产品部署到云环境中所发挥出的高效和灵活的作用;7章介绍云化应用的性能检测的相关概念以及定义性能监测指标数据的各种方法;8章对智能运维(AIOps)的概念和潜在的应用场景进行简单介绍,并展望了未来AIOps的发展方向。

  《云原生敏捷运维从入门到精通》并未深究运维中的单个环节,而是对IT服务云化过程中开发运维工作的方方面面都有所涉及,以期读者能够对云运维的整个生产周期具备全局的认知。

  《云原生敏捷运维从入门到精通》非常适合正在考虑IT服务云化的企业运维人员阅读,也对企图进一步改进现有云开发运维流程的相关人士有一定启发作用。






前言

1章  云时代客户需求的及时响应

1.1  客户需求与竞争对手产品分析驱动的行动框架

   1.1.1  云应用客户需求的收集分析决策

   1.1.2  云应用竞争对手产品分析与敏捷应对

1.2  实施应用决策—预算规划下的云资源投入

   1.2.1  预算规划下的云资源投入计算和优化

   1.2.2  快速迭代与优化客户反馈和市场反应

1.3  小结



2章  产品项目生命周期的开始—Redmine

2.1  从创建开始—Redmine入门

   2.1.1  体验Redmine

   2.1.2  使用Redmine定义产品项目

   2.1.3  众人的合力—Redmine角色定义与产品预期沟通

2.2  产品管理—进度与反馈

   2.2.1  TodoList应用项目总览

   2.2.2  Redmine问题跟踪

   2.2.3  Redmine活动管理

2.3  深入阶段—Redmine日历与进度表

   2.3.1  Redmine日历记录与管理

   2.3.2  使用甘特图实施进度把控

   2.3.3  综合使用日历与进度把控的讨论区管理

2.4  基于需求的扩展—使用Redmine高级管理功能

   2.4.1  组功能和任务指派

   2.4.2  项目权限和角色管理

2.5  小结



3章  管理代码—从分布式版本控制系统Git出发

3.1  版本控制系统构建与管理—Git

   3.1.1  Git如何工作

   3.1.2  Git作场景

   3.1.3  Git协作开发的经典模式

3.2  管理分享代码宝库—GitHub

   3.2.1  GitHub基本简介

   3.2.2  GitHub其他功能

   3.2.3  快速找到你感兴趣的项目

3.3  企业的内部代码仓库管理—GitLab

   3.3.1  GitLab基本简介

   3.3.2  搭建GitLab服务

3.4  小结



4章  让需求和质量持续得到满足—快速交付中的Jenkins

4.1  精良的工作流设计—Jenkins定制

   4.1.1  简单的开始—安装和使用容器化的Jenkins

   4.1.2  选择合适的工具—Jenkins插件的搜索和使用

   4.1.3  Jenkins崭新的用户体验—BlueOcean

4.2  跟踪问题—Gerrit

   4.2.1  Gerrit简介和使用

   4.2.2  Gerrit与Jenkins集成

4.3  更健全的Jenkins系统及维护实践

   4.3.1  Jenkins分布式节点的构建

   4.3.2  Jenkins用户管理

   4.3.3  Jenkins安全配置

   4.3.4  管理及监控Jenkins

4.4  小结



5章  迭代—持续集成的自动化测试

5.1  自动化测试与Jenkins

   5.1.1   代码片段能工作吗—单元测试

   5.1.2  发现局部的问题—集成测试

   5.1.3  持续交付—端到端测试

5.2  全面的考虑—规划Jenkins测试

   5.2.1  规划回归测试

   5.2.2  规划端到端测试

   5.2.3  用户可以使用吗—定义功能测试

   5.2.4  可以做到足够好—定义性能测试

   5.2.5  预防可能出现的安全问题—定义安全性测试

5.3  用户可以使用吗—定义功能测试

   5.3.1  面向图形用户界面的测试

   5.3.2  面向系统互联接口(RESTAPI)的功能测试

5.4  可以做到足够好—定义性能测试

   5.4.1  预先准备—Web性能KPI定义

   5.4.2  LOCUST的安装和配置

   5.4.3  LOCUST测试代码

   5.4.4  运行LOCUST进行性能测试

   5.4.5  LOCUST测试在云端

5.5  预防可能出现的安全问题—定义安全性测试

   5.5.1  如何安装Metasploit

   5.5.2  如何使用Metasploit

   5.5.3  基于Metasploit的自动化测试

   5.5.4  Metasploit在云端

5.6  小结



6章  尽快让客户看到改进和得到反馈—端到端的交付部署Kubernetes和Ansible

6.1  规划云原生端到端的域部署—流程域的划分

6.2  实现部署—使用Ansible配置管理

   6.2.1  Ansible的安装和使用

   6.2.2  测试区域/预生产区域/生产区域的Ansible配置

   6.2.3  跨域部署—Ansible如何应对跳转机

6.3  构建容器式交付部署环境—使用Kubernetes集

   6.3.1  即插即用—容器运行环境

   6.3.2  部署和管理容器集—Kubernetes集构建

   6.3.3  注入应用—在交付部署环境中使用容器工具

6.4  让一切动起来—持续集成交付部署

   6.4.1  整体流程的自动化

   6.4.2  Redmine流程信息自动化查询与更新

   6.4.3  Jenkins + Redmine集成

   6.4.4  Jenkins + Ansible集成

6.5  小结



7章  对一切了如指掌—应用性能监测

7.1  应用性能管理概述

   7.1.1  应用性能管理过程

   7.1.2  产品生命周期中的应用性能管理

7.2  深入应用性能监测

   7.2.1  根据性能数据类型探索性能监测

   7.2.2  覆盖端到端的性能监测维度

   7.2.3  服务器性能数据监测分类

7.3  使用InfluxDB管理应用性能数据

   7.3.1  时间序列数据库的结构和原理介绍

   7.3.2  InfluxDB数据库管理

   7.3.3  应用性能数据表作

7.4  小结



8章  新的开始—拥抱机器学习与人工智能的明天

8.1  人工智能的新课题—AIOps

   8.1.1  AIOps的诞生

   8.1.2  AIOps的现状

8.2  AIOps的应用场景和典型案例

8.3  AIOps的未来展望



附录A  公有云提供商的相关服务列




商品名称:

大数据定义智能运维

作者:

汤滨

市场价:

88.00

ISBN号:

9787111641308

版次:

1-1

出版日期:

2019-12

页数:

220

字数:

162

出版社:

机械工业出版社








无数据,不AI。

而没有统一完整的基础数据资源平台管理,AIOps也无从谈起。

基础运维数据资源平台是AIOps的数据基石,也是未来支撑企业数据战略的两大数据平台之一。

构建数据平台需要数据治理工作的保驾护航。然而在运维数据治理领域开展数据治理工作尚属空白,缺乏理论体系支撑和值得借鉴的成功经验。

本书在分析运维数据治理与传统数据治理的差异化特点基础上,对于数据治理的DAMA理论体系在运维数据管理领域实现了在广义元数据管理、广义数据标准、广义数据模型等理论突破,创造性的提出运维数据模型建设,为运维数据治理构建了体系化理论并提供了具有方支撑的完整蓝图。

同时,就运维数据平台建设本书也分享了基于数据模型实体库的概要设计,以数据湖为基础,包含运维数据中台建设的架构规划。

本书还在工业运维领域略作延展,分析工业运维数据模型的差异化特点,就包括数字孪生、时空数据等关键工业技术为核心的物理融合技术做了介绍,提出了开展智能工业运维的必要内容。










章 总论11

1 运维管理的现状11

2 AIOps为什么会成为公认的运维管理的方向13

3 AIOps对于运维数据管理提出的需求与挑战17

二章 需求分析24

1 企业数据治理概论24

2 运维数据治理的差异化分析46

3 运维数据治理工作的策略与原则49

4 运维数据治理工作的创新思路51

三章 解决方案—企业基础数据平台建设56

1 运维数据管理58

2 运维数据模型建设思路69

3 企业统一基础数据管理平台84

章 实施规划与案例分享118

1 案例分享118

2 运维知识图谱125

3 实施规划128

4 对AI的认知149

五章 运维数据资产化与运维管理数字化转型155

六章 智能工业运维探索164

1 数字孪生技术173

2 时空数据181

3 工业运维数据模型186

4 基于物联网的工业运维数据平台188

5 物理信息融合197

七章 结语203

智能运维:从0搭建大规模分布式AIOps系统

内容简介
《智能运维:从0搭建大规模分布式AIOps系统》结合大企业的智能运维实践,全面完整地介绍智能运维的技术体系,让读者更加了解运维技术的现状和发展。同时,帮助运维工程师在一定程度上了解机器学习的常见算法模型,以及如何将它们应用到运维工作中。

《智能运维:从0搭建大规模分布式AIOps系统》共分4篇。1篇运维发展史,重点阐述当前运维的发展现状及面临的技术挑战;2篇智能运维基础设施,重点讲述大数据场景下的数据存储、大数据处理和分析的方法与经验,以及海量数据多维度多指标的处理分析技术;3篇智能运维技术详解,重点关注在新时期大数据时代下智能化的运维技术,包括数据聚合与关联、数据异常点检测、故障诊断和分析、趋势预测算法;4篇技术案例详解,为大家梳理了通过开源框架ELK快速构建智能监控系统的整体方案,还将分享微博平台和微博广告两个不同业务场景下智能监控系统的技术实践。

《智能运维:从0搭建大规模分布式AIOps系统》适合运维、开发、架构、DevOps工程师及广大互联网技术爱好者研读和借鉴。

目录


1篇 开门见山:运维发展史


1章 运维现状 2
1.1 运维工程 2
1.1.1 认识运维 2
1.1.2 主要职责 4
1.1.3 运维技术 5
1.2 运维发展历程 6
1.2.1 人工阶段 6
1.2.2 工具和自动化阶段 7
1.2.3 平台化阶段 7
1.2.4 智能运维阶段 8
1.3 运维现状 9
1.3.1 故障频发 9
1.3.2 系统复杂性 10
1.3.3 大数据环境 12
1.4 本章小结 14
1.5 参考文献 14


2章 智能运维 15
2.1 海量数据的存储、分析和处理 16
2.2 多维度、多数据源 18
2.3 信息过载 19
2.4 复杂业务模型下的故障定位 21
2.5 本章小结 22
2.6 参考文献 22


2篇 站在巨人肩上:智能运维基础设施


3章 开源数据采集技术 25
3.1 数据采集工具对比 25
3.2 轻量级采集工具Filebeat 26
3.2.1 Filebeat工作原理 26
3.2.2 Filebeat的安装与配置 28
3.2.3 启动和运行Filebeat 38
3.3 日志采集解析工具 38
3.3.1 Logstash工作原理 39
3.3.2 安装Logstash 40
3.3.3 配置Logstash 41
3.3.4 启动Logstash 49
3.4 本章小结 49
3.5 参考文献 50


4章 分布式消息队列 51
4.1 开源消息队列对比与分析 51

4.1.1 概述 51
4.1.2 ZeroMQ 51
4.1.3 ActiveMQ 52
4.1.4 RocketMQ 52
4.1.5 Kafka 53
4.2 Kafka安装与使用 53
4.2.1 组件概念 53
4.2.2 基本特性 53
4.2.3 安装与使用 54
4.2.4 Java API使用 55
4.3 案例分析 57
4.3.1 日志采集 58
4.3.2 实时结算 58
4.3.3 实时计算 58
4.4 本章小结 58
4.5 参考文献 59


5章 大数据存储技术 60
5.1 传统数据存储 60
5.1.1 传统应用的架构 60
5.1.2 传统存储的运行机制 61
5.1.3 传统存储带来的问题 62
5.2 基于HDFS的分布式存储 63
5.2.1 分布式存储的定义 63
5.2.2 HDFS的基本原理 64
5.2.3 HDFS架构解析 65
5.2.4 HDFS优势 66
5.2.5 HDFS不适合的场景 67
5.3 分层存储 68
5.3.1 数据仓库 68
5.3.2 数据仓库分层架构 70
5.3.3 分层存储的好处 73
5.4 案例分析 73
5.4.1 数据存储架构 73
5.4.2 数据仓库建模 74
5.4.3 常见的存储问题及解决方案 80
5.5 本章小结 80
5.6 参考文献 80


6章 大规模数据离线计算分析 82
6.1 经典的离线计算 82
6.1.1 Linux神级工具sed和awk 82
6.1.2 Python数据处理Pandas基础 84
6.1.3 Python的优势和不足 88
6.2 分布式离线计算 89
6.2.1 MapReduce离线计算 89
6.2.2 离线计算的数据倾斜问题 97
6.2.3 分布式离线计算的技术栈 100
6.3 案例分析 101
6.3.1 离线计算管理 102
6.3.2 离线计算原子控制 103
6.3.3 离线计算的数据质量 103
6.4 本章小结 104
6.5 参考文献 105


7章 实时计算框架 106
7.1 关于实时流计算 106
7.1.1 如何提高实时流计算的实时性 106
7.1.2 如何提高实时流计算结果的准确性 107
7.1.3 如何提高实时流计算结果的响应速度 107
7.2 Spark Streaming计算框架介绍 107
7.2.1 概述 107
7.2.2 基本概念 108
7.2.3 运行原理 108
7.2.4 编程模型 109
7.2.5 Spark Streaming的使用 110
7.2.6 优化运行时间 114
7.3 Flink计算框架 115
7.3.1 基本概念 116
7.3.2 Flink特点 116
7.3.3 运行原理 118
7.3.4 Java API的使用 121
7.4 案例分析 124
7.4.1 背景介绍 125
7.4.2 架构设计 126
7.4.3 效果分析 126
7.5 本章小结 126
7.6 参考文献 126


8章 时序数据分析框架 127
8.1 时序数据库简介 127
8.1.1 什么是时序数据库 127
8.1.2 时序数据库的特点 128
8.1.3 时序数据库对比 130
8.2 时序数据库Graphite 131
8.2.1 Graphite简介 131
8.2.2 Graphite在微博广告监控系统中的应用 137
8.3 多维分析利器Druid 139
8.3.1 什么是Druid 139
8.3.2 Druid架构 140
8.3.3 Druid在微博广告监控平台中的应用 144
8.4 性能神器ClickHouse 147
8.4.1 什么是ClickHouse 147
8.4.2 ClickHouse的特性 148
8.4.3 ClickHouse的不足 149
8.4.4 安装配置ClickHouse 149
8.4.5 表引擎 153
8.4.6 函数支持 157
8.5 本章小结 160
8.6 参考文献 160


9章 机器学习框架 161
9.1 简介 161
9.2 TensorFlow介绍 162
9.2.1 什么是TensorFlow 162
9.2.2 下载安装 162
9.2.3 “Hello TensorFlow”示例 166
9.3 TensorFlow进阶 166
9.3.1 基础理论 167
9.3.2 模型准备 169
9.3.3 训练数据 169
9.3.4 模型训练 171
9.3.5 生成seq2seq句子 174
9.3.6 运行演示 175
9.4 本章小结 178
9.5 参考文献 179


3篇 运维新时代:智能运维技术详解


10章 数据聚合与关联技术 182
10.1 数据聚合 182
10.1.1 聚合运算 183
10.1.2 多维度聚合 186
10.2 降低维度 188
10.2.1 将告警聚合成关联“事件” 189
10.2.2 减少误报:告警分类 190
10.3 数据关联 192
10.4 实时数据关联案例 193
10.4.1 设计方案 193
10.4.2 效果 195
10.5 本章小结 195
10.6 参考文献 195


11章 数据异常点检测技术 196
11.1 概述 196
11.2 异常检测方法 198
11.2.1 基于统计模型的异常点检测 199
11.2.2 基于邻近度的异常点检测 202
11.2.3 基于密度的异常点检测 203
11.3 独立森林 204
11.4 本章小结 207
11.5 参考文献 207


12章 故障诊断和分析策略 208
12.1 日志标准化 209
12.2 全链路追踪 210
12.3 SLA的统一 210
12.4 传统的故障定位方法 211
12.4.1 监控告警型 211
12.4.2 日志分析型 212
12.5 人工智能在故障定位领域的应用 213
12.5.1 基于关联规则的相关性分析 213
12.5.2 基于决策树的故障诊断 217
12.6 本章小结 222
12.7 参考文献 222


13章 趋势预测算法 223
13.1 移动平均法 223
13.2 指数平滑法 224
13.3 ARIMA模型 226
13.3.1 简介 226
13.3.2 重要概念 226
13.3.3 参数解释 228
13.3.4 建模步骤 230
13.3.5 ARIMA模型案例 232
13.4 神经网络模型 236
13.4.1 卷积神经网络 236
13.4.2 循环神经网络 238
13.4.3 长短期记忆网络 239
13.4.4 应用说明 241
13.5 本章小结 241
13.6 参考文献 242


4篇 智能运维架构实践:技术案例详解


14章 快速构建日志监控系统 244
14.1 Elasticsearch分布式搜索引擎 244
14.1.1 基本概念 244
14.1.2 分布式文档存储与读取 248
14.1.3 分布式文档检索 250
14.1.4 分片管理 252
14.1.5 路由策略 254
14.1.6 映 255
14.2 可视化工具Kibana 258
14.2.1 Management 260
14.2.2 Discover 260
14.2.3 Visualize 262
14.2.4 Dashboard 263
14.2.5 Timelion 263
14.2.6 Dev Tools 264
14.3 ELK搭建实践 264
14.3.1 Logstash安装配置 264
14.3.2 Elasticsearch集安装配置 266
14.3.3 Kibana安装配置 272
14.4 本章小结 274
14.5 参考文献 274


15章 微博广告智能监控系统 275
15.1 背景介绍 275
15.1.1 监控指标体系 275
15.1.2 功能设计原则 276
15.2 整体架构 277
15.3 核心功能分析 278
15.3.1 全景监控 278
15.3.2 趋势预测 281
15.3.3 动态阈值 285
15.3.4 服务治理 285
15.4 本章小结 288


16章 微博平台通用监控系统 289
16.1 背景 290
16.2 整体架构 291
16.3 核心模块 292
16.3.1 数据采集(Logtailer) 292
16.3.2 数据路由(Statsd-proxy) 295
16.3.3 聚合运算(Statsd) 295
16.3.4 数据分发(C-Relay)和数据存储 295
16.3.5 告警模块 297
16.3.6 API设计 300
16.3.7 数据可视化 301
16.4 三方应用 302
16.4.1 决策支持系统 302
16.4.2 运维自动化 303
16.4.3 成本分析和容量日报 303
16.4.4 机器学习 303
16.5 本章小节 303
附录A 中国大数据技术大会2017(BDTC 2017)CSDN专访实录 305


暂时没有目录,请见谅!