深入理解XGBoost:高效机器学习算法与进阶pdf下载

深入理解XGBoost:高效机器学习算法与进阶百度网盘pdf下载

作者:
简介:深入理解XGBoost:高效机器学习算法与进阶
出版社:机械工业出版社
出版时间:2020-01-01
pdf下载价格:9.00¥


预览


内容介绍

内容简介
  本书主要介绍:XGBoost相关的机器学习基础算法;XGBoost安装编译与简单使用;XGBoost的实现原理与理论证明;XGBoost基于CPU多线程的实现以及分布式训练方法;剖析XGBoost源码,从代码层面洞彻XGBoost的实现原理,以及XGBoost的应用与调优,通过典型示例为读者提供使用参考,掌握实战技能。通过阅读本书,不仅能使读者理解XGBoost的原理,将XGBoost应用到业务场景中,更能从源码的角度深入学习XGBoost的并行化和分布式实现等优化技术,以更短的时间训练出高准确度的模型,使XGBoost成为学习和工作中的一把利剑。
目录
前言
第1章 机器学习概述
1.1 何谓机器学习
1.1.1 机器学习常用基本概念
1.1.2 机器学习类型
1.1.3 机器学习应用开发步骤
1.2 集成学习发展与XGBoost提出
1.2.1 集成学习
1.2.2 XGBoost
1.3 小结
第2章 XGBoost骊珠初探
2.1 搭建Python机器学习环境
2.1.1 Jupyter Notebook
2.1.2 NumPy
2.1.3 Pandas
2.1.4 Matplotlib
2.1.5 scikit-learn
2.2 搭建XGBoost运行环境
2.3 示例:XGBoost告诉你蘑菇是否有毒
2.4 小结
第3章 机器学习算法基础
3.1 KNN
3.1.1 KNN关键因素
3.1.2 用KNN预测鸢尾花品种
3.2 线性回归
3.2.1 梯度下降法
3.2.2 模型评估
3.2.3 通过线性回归预测波士顿房屋价格
3.3 逻辑回归
3.3.1 模型参数估计
3.3.2 模型评估
3.3.3 良性/恶性乳腺肿瘤预测
3.3.4 softmax
3.4 决策树
3.4.1 构造决策树
3.4.2 特征选择
3.4.3 决策树剪枝
3.4.4 决策树解决肿瘤分类问题
3.5 正则化
3.6 排序
3.6.1 排序学习算法
3.6.2 排序评价指标
3.7 人工神经网络
3.7.1 感知器
3.7.2 人工神经网络的实现原理
3.7.3 神经网络识别手写体数字
3.8 支持向量机
3.8.1 核函数
3.8.2 松弛变量
3.8.3 通过SVM识别手写体数字
3.9 小结
第4章 XGBoost小试牛刀
4.1 XGBoost实现原理
4.2 二分类问题
4.3 多分类问题
4.4 回归问题
4.5 排序问题
4.6 其他常用功能
4.7 小结
第5章 XGBoost原理与理论证明
5.1 CART
5.1.1 CART生成
5.1.2 剪枝算法
5.2 Boosting算法思想与实现
5.2.1 AdaBoost
5.2.2 Gradient Boosting
5.2.3 缩减
5.2.4 Gradient Tree Boosting
5.3 XGBoost中的Tree Boosting
5.3.1 模型定义
5.3.2 XGBoost中的Gradient Tree Boosting
5.4 切分点查找算法
5.4.1 精确贪心算法
5.4.2 基于直方图的近似算法
5.4.3 快速直方图算法
5.4.4 加权分位数概要算法
5.4.5 稀疏感知切分点查找算法
5.5 排序学习
5.6 DART
5.7 树模型的可解释性
5.7.1 Saabas
5.7.2 SHAP
5.8 线性模型原理
5.8.1 Elastic Net回归
5.8.2 并行坐标下降法
5.8.3 XGBoost线性模型的实现
5.9 系统优化
5.9.1 基于列存储数据块的并行学习
5.9.2 缓存感知访问
5.9.3 外存块计算
5.10 小结
第6章 分布式XGBoost
6.1 分布式机器学习框架Rabit
6.1.1 AllReduce
6.1.2 Rabit
6.1.3 Rabit应用
6.2 资源管理系统YARN
6.2.1 YARN的基本架构
6.2.2 YARN的工作流程
6.2.3 XGBoost on YARN
6.3 可移植分布式XGBoost4J
6.4 基于Spark平台的实现
6.4.1 Spark架构
6.4.2 RDD
6.4.3 XGBoost4J-Spark
6.5 基于Flink平台的实现
6.5.1 Flink原理简介
6.5.2 XGBoost4J-Flink
6.6 基于GPU加速的实现
6.6.1 GPU及其编程语言简介
6.6.2 XGBoost GPU加速原理
6.6.3 XGBoost GPU应用
6.7 小结
第7章 XGBoost进阶
7.1 模型训练、预测及解析
7.1.1 树模型训练
7.1.2 线性模型训练
7.1.3 模型预测
7.1.4 模型解析
7.2 树模型更新
7.2.1 updater_colmaker
7.2.2 updater_histmaker
7.2.3 updater_fast_hist
7.2.4 其他更新器
7.3 目标函数
7.3.1 二分类
7.3.2 回归
7.3.3 多分类
7.3.4 排序学习
7.4 评估函数
7.4.1 概述
7.4.2 二分类
7.4.3 多分类
7.4.4 回归
7.4.5 排序
7.5 小结
第8章 模型选择与优化
8.1 偏差与方差
8.2 模型选择
8.2.1 交叉验证
8.2.2 Bootstrap
8.3 超参数优化
8.3.1 网格搜索
8.3.2 随机搜索
8.3.3 贝叶斯优化
8.4 XGBoost超参数优化
8.4.1 XGBoost参数介绍
8.4.2 XGBoost调参示例
8.5 小结
第9章 通过XGBoost实现广告分类器
9.1 PCA
9.1.1 PCA的实现原理
9.1.2 通过PCA对人脸识别数据降维
9.1.3 利用PCA实现数据可视化
9.2 通过XGBoost实现广告分类器
9.3 小结
第10章 基于树模型的其他研究与应用
10.1 GBDT、LR融合提升广告点击率65
10.2 mGBDT
10.3 DEF
10.4 一种基于树模型的强化学习方法
10.5 小结
前言
  前言
  大数据时代的今天,基于规则解决具体业务问题的传统方式已无法满足企业需求,机器学习与人工智能逐渐走入人们的视野,并迅速得到了众多企业的广泛关注。各大互联网公司相继成立了自己的机器学习研究院,或建立机器学习团队。然而,随着企业业务规模、数据规模日益扩大,业务类型越来越复杂,怎样在短时间内训练出高准确率的模型,成为许多企业面对的挑战。
  在机器学习与人工智能的浪潮中,XGBoost凭借高效、便捷、扩展性强等优势,在众多开源机器学习库中脱颖而出,广受各大企业青睐。目前XGBoost已成为热门的机器学习开源项目之一,拥有强大的社区支持,技术也日趋成熟。
精彩书摘
  第1章 机器学习概述
  本章首先介绍何谓机器学习,以及与机器学习相关的基本概念,这是学习和理解机器学习的基础。按照学习方式的不同,机器学习可以分为不同类型,如监督学习、无监督学习、强化学习等,1.1.2节详细介绍了它们各自的特点和使用场景。其次,借助本章对机器学习应用开发步骤的详细说明,读者能够清晰地了解机器学习应用的开发流程。最后,1.2节概述了集成学习,以及XGBoost如何被提出并在业界广泛应用。