9787000050359
9787121370403 9787121365201 9787121280702
推荐系统算法实践
本书主要讲解推荐系统中的召回算法和排序算法,以及各个算法在主流工具Sklearn、Spark、TensorFlow等中的实现和应用。 书中本着循序渐进的原则进行讲解。首先,介绍推荐系统中推荐算法的数学基础,推荐算法的平台、工具基础,以及具体的推荐系统。其次,对推荐系统中的召回算法进行讲解,主要包括基于行为相似的协同过滤召回和基于内容相似的Word2vec 召回,并且介绍其在Spark、TensorFlow 主流工具中的实现与应用。再次,讲解推荐系统中的排序算法,包括线性模型、树模型和深度学习模型,分别介绍逻辑回归、FM、决策树、随机森林、GBDT、GBDT+LR、集成学习、深度森林、DNN、Wide & Deep、DeepFM、YouTube推荐等模型的原理,以及其在Sklearn、Spark、TensorFlow 主流工具中的实现与应用。后,介绍推荐算法的4 个实践案例,帮助读者进行工程实践和应用,并且介绍如何在Notebook 上进行代码开发和算法调试,以帮助读者提升工作效率。
目 录
1部分 推荐系统的算法基础
1章 数学基础 2
1.1 线性代数 2
1.2 概率与统计 5
1.3 损失函数 7
1.4 优化方法 8
1.4.1 SGD 8
1.4.2 动量 8
1.4.3 Nesterov动量 9
1.4.4 AdaGrad 9
1.4.5 Adam 10
1.4.6 L-BFGS 10
1.4.7 梯度法和牛顿法的比较 11
1.5 评价方法 11
1.5.1 混淆矩阵 11
1.5.2 ROC曲线 13
2章 推荐系统介绍 17
2.1 推荐系统背景 17
2.2 推荐系统的典型案例 18
2.2.1 推荐 19
2.2.2 Facebook推荐 21
2.2.3 YouTube推荐 22
2.3 推荐系统原理 23
3章 推荐算法工具 26
3.1 Python Sklearn机器学习库 26
3.1.1 Sklearn介绍 26
3.1.2 Sklearn建模流程 27
3.2 Spark MLlib机器学习库 28
3.2.1 MLlib介绍 28
3.2.2 MLlib建模流程 29
3.3 TensorFlow 31
3.3.1 TensorFlow介绍 31
3.3.2 TensorFlow建模流程 31
3.4 Notebook介绍 32
3.4.1 Zeppelin Notebook介绍 32
3.4.2 Jupyter Notebook介绍 36
2部分 推荐系统的召回算法
4章 协同过滤——基于行为相似的召回 40
4.1 协同过滤算法 40
4.1.1 协同过滤推荐概述 40
4.1.2 用户评分 41
4.1.3 相似度计算 41
4.1.4 推荐计算 43
4.2 协同过滤推荐算法实现 44
4.2.1 相似度计算及推荐计算 47
4.2.2 协同推荐 54
4.2.3 运行结果 59
5章 Word2vec——基于内容相似的召回 65
5.1 Word2vec算法 65
5.1.1 语言模型 65
5.1.2 CBOW One-Word Context模型 66
5.1.3 CBOW Multi-Word Context 模型 71
5.1.4 Skip-Gram模型 72
5.1.5 Hierarchical Softmax 74
5.1.6 Negative Sampling 74
5.2 Word2vec实例 75
5.2.1 Spark实现 75
5.2.2 TensorFlow实现 80
3部分 推荐系统的排序算法——线性模型
6章 逻辑回归 86
6.1 逻辑回归算法 86
6.1.1 二元逻辑回归模型 86
6.1.2 模型参数估计 88
6.1.3 多元逻辑回归模型(Softmax回归) 88
6.1.4 逻辑回归的网络结构 89
6.1.5 梯度下降算法 90
6.1.6 正则化 91
6.2 逻辑回归实现 93
6.2.1 Sklearn实现 93
6.2.2 Spark实现 98
6.2.3 TensorFlow实现 108
6.2.4 效果总结 114
7章 因子分解机(FM) 115
7.1 FM算法 115
7.1.1 FM模型 115
7.1.2 FFM模型 118
7.1.3 FM模型的网络结构 119
7.2 FM实现 120
7.2.1 Sklearn实现 120
7.2.2 TensorFlow实现 122
7.2.3 效果总结 128
4部分 推荐系统的排序算法——树模型
8章 决策树 130
8.1 决策树算法 130
8.1.1 决策树模型 130
8.1.2 特征选择 131
8.1.3 决策树的生成 133
8.1.4 决策树的生成实例 134
8.1.5 决策树的剪枝 135
8.2 决策树的集成算法 136
8.2.1 集成分类器 136
8.2.2 随机森林 137
8.2.3 GBDT 137
8.3 决策树集成算法实例 139
8.3.1 Spark实现 139
8.3.2 Sklearn实现 149
8.3.3 效果总结 154
9章 集成学习 155
9.1 GBDT+LR算法 155
9.1.1 背景 155
9.1.2 GBDT+LR网络结构 156
9.2 深度森林算法 159
9.2.1 深度森林介绍 159
9.2.2 级联森林 160
9.2.3 多粒度扫描 161
9.3 决策树集成分类器 162
9.4 集成学习实例 164
9.4.1 GBDT+LR实现 164
9.4.2 深度森林实现 167
9.4.3 效果总结 175 .................
过程完整:从基本原理到实际项目开发 实例丰富:将理论学习落实到具体实践(共34个实例)简洁流畅:采用短段、短句,读来有顺流而下般流畅感实战性强:搭建新闻推荐系统、音乐推荐系统、图书推荐系统学习无忧:免费提供书中用到的素材和源代码后继服务:读者可加入本书QQ学习群在线交流
内容简介
如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。