用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用+大数据架构详解书籍pdf下载

用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用+大数据架构详解书籍百度网盘pdf下载

作者:
简介:用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用+大数据架构详解书籍
出版社:
出版时间:2016-10
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍







版 次:页 数:字 数:印刷时间:2016年03月01日开 本:16开纸 张:轻型纸包 装:平装是否套装:否国际标准书号ISBN:9787121280702

所属分类:

图书>计算机/网络>网络与数据通信>网络配置与管理

快速直达

内容简介

作者简介

目 录

前 言

下载免费当当读书

内容简介

如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这个问题的方法就是推荐系统。本书分为上中下三篇,共13章,上篇为用户画像知识工程基础,包括表征建模、画像计算、存储及各种更新维护等管理操作;中篇为推荐系统与用户画像,包括传统协同过滤等经典推荐算法的介绍,以及涉及用户画像的推荐方法;下篇为应用案例分析,包括Netflix、阿里等数据竞赛的经典数据案例,以及在具体工程开发过程的具体案例,分别从系统需求、总体结构、算法设计、运行流程及测试结果等五个方面提供详细案例指导。

作者简介

牛温佳,男,博士,中国科学院信息工程研究所副研究员。主持国家自然科学基金青年基金项目和广西可信软件重点实验室开放课题各一项,作为骨干先后参与了多个重要项目,包括工信部重大专项、973、863和中科院战略先导专项等。

目 录

目 录上 篇第1章 用户画像概述    31.1 用户画像数据来源    31.1.1 用户属性    51.1.2 用户观影行为    51.2 用户画像特性    51.2.1 动态性    51.2.2 时空局部性    61.3 用户画像应用领域    61.3.1 搜索引擎    61.3.2 推荐系统    71.3.3 其他业务定制与优化    71.4 大数据给用户画像带来的机遇与挑战    8第2章 用户画像建模    92.1 用户定量画像    92.2 用户定性画像    102.2.1 标签与用户定性画像    102.2.2 基于知识的用户定性画像分析    122.2.3 用户定性画像的构建    162.2.4 定性画像知识的存储    222.2.5 定性画像知识的推理    262.3 本章参考文献    29第3章 群体用户画像分析    313.1 用户画像相似度    323.1.1 定量相似度计算    323.1.2 定性相似度计算    343.1.3 综合相似度计算    353.2 用户画像聚类    36第4章 用户画像管理    414.1 存储机制    414.1.1 关系型数据库    424.1.2 NoSQL数据库    434.1.3 数据仓库    454.2 查询机制    464.3 定时更新机制    474.3.1 获取实时用户信息    474.3.2 更新触发条件    484.3.3 更新机制    49中 篇第5章 视频推荐概述    555.1 主流推荐方法的分类    565.1.1 协同过滤的推荐方法    565.1.2 基于内容的推荐方法    575.1.3 基于知识的推荐方法    595.1.4 混合推荐方法    605.2 推荐系统的评测方法    615.3 视频推荐与用户画像的逻辑关系    61第6章 协同过滤推荐方法 656.1 概述    656.2 关系矩阵及矩阵计算    676.2.1 U-U矩阵    676.2.2 V-V矩阵    706.2.3 U-V矩阵    726.3 基于记忆的协同过滤算法 746.3.1 基于用户的协同过滤算法    756.3.2 基于物品的协同过滤算法    786.4 基于模型的协同过滤算法    816.4.1 基于隐因子模型的推荐算法    826.4.2 基于朴素贝叶斯分类的推荐算法    856.5 小结    886.6 本章参考文献    88第7章 基于内容的推荐方法    917.1 概述 917.2 CB推荐中的特征向量    947.2.1 视频推荐中的物品画像    947.2.2 视频推荐中的用户画像    967.3 基础CB推荐算法    977.4 基于TF-IDF的CB推荐算法    997.5 基于KNN的CB推荐算法    1027.6 基于Rocchio的CB推荐算法    1047.7 基于决策树的CB推荐算法 1067.8 基于线性分类的CB推荐算法    1077.9 基于朴素贝叶斯的CB推荐算法    1097.10 小结    1117.11 本章参考文献    111第8章 基于知识的推荐方法    1138.1 概述    1138.2 约束知识与约束推荐算法    1148.2.1 约束知识示例    1148.2.2 约束满足问题    1158.2.3 约束推荐算法流程    1178.3 关联知识与关联推荐算法    1188.3.1 关联规则描述    1188.3.2 关联规则挖掘    1218.3.3 关联推荐算法流程 1238.4 小结    1248.5 本章参考文献    124第9章 混合推荐方法    1259.1 概述    1259.2 算法设计层面的混合方法    1269.2.1 并行式混合    1269.2.2 整体式混合    1299.2.3 流水线式混合    1319.2.4 典型混合应用系统    1339.3 混合式视频推荐实例    1369.3.1 MoRe系统概览    1369.3.2 MoRe算法介绍    1379.3.3 MoRe算法混合    1399.3.4 MoRe实验分析    1409.4 小结    1429.5 本章参考文献    142第10章 视频推荐评测    14510.1 概述    14510.2 视频推荐试验方法    14610.2.1 在线评测    14710.2.2 离线评测    14910.2.3 用户调查    15010.3 视频离线推荐评测指标    15110.3.1 准确度指标    15110.3.2 多样性指标    15910.4 小结    16110.5 本章参考文献    162下 篇第11章 系统层面的快速推荐构建    16511.1 概述    16511.2 本章主要内容    16611.3 系统部署    16611.3.1 Hadoop2.2.0系统部署    16611.3.2 Hadoop运行时环境设置    16911.3.3 Spark与Mahout部署    17511.4 Mahout推荐引擎介绍    18111.4.1 Item-based算法    18111.4.2 矩阵分解    18511.4.3 ALS算法    18711.4.4 Mahout的Spark实现    19011.5 快速实战    19311.5.1 概述 19311.5.2 日志数据    19411.5.3 运行环境    19611.5.4 基于Mahout Item-based算法实践    20111.5.5 基于Mahout ALS算法实践    20511.6 小结    20811.7 本章参考文献    208第12章 数据层面的分析与推荐案例    21112.1 概述    21112.2 本章主要内容 21212.3 竞赛内容和意义    21212.3.1 竞赛简介    21212.3.2 竞赛任务和意义    21312.4 客户-商户数据    21512.4.1 数据描述 21512.4.2 数据理解与分析    21712.5 算法流程设计    21912.5.1 特征提取    21912.5.2 分类器设计    22012.5.3 算法流程总结 22212.6 小结    22212.7 本章参考文献    223

 

版 次:1页 数:字 数:印刷时间:2016年10月01日开 本:16开纸 张:胶版纸包 装:平装-胶订是否套装:否国际标准书号ISBN:9787121300004

所属分类:

图书>计算机/网络>数据库>数据仓库与数据挖掘

快速直达

编辑推荐

内容简介

作者简介

目 录

前 言

书摘插画

免费下载读书APP

编辑推荐

这是一个数据信息时代,每分每秒都在产生数不尽的数据。这些数据如何获取,有什么用途,如何与前沿的深度学习、机器学习等相结合,如何为我们所用,尽在本书中。

更多计算机好书请关注:电子工业出版社当当自营店

 

内容简介

本书从架构、业务、技术三个维度深入浅出地介绍了大数据处理领域端到端的知识。主要内容包括三部分:*部分从数据的产生、采集、计算、存储、消费端到端的角度介绍大数据技术的起源、发展、关键技术点和未来趋势,结合生动的业界*产品,以及学术界*的研究方向和成果,让深奥的技术浅显易懂;第二部分从业务和技术角度介绍实际案例,让读者理解大数据的用途及技术的本质;第三部分介绍大数据技术不是孤立的,讲解如何与前沿的云技术、深度学习、机器学习等相结合。

作者简介

朱洁,2008年加入华为,具有8年大数据研发管理经验,现任华为大数据服务首席规划师。专注于大数据服务平台建设、规划和实践应用,同时参与多项企业级大数据项目解决方案的规划、设计和实施工作,在深化大数据行业落地方面有诸多实践经验,对解读大数据垂直行业的技术创新与开发有诸多独到的见解和心得。

罗华霖,2002年加入华为,华为大数据首席规划师,主导完成华为大数据平台DataSight和华为电信大数据解决方案SmartCare技术规划和架构设计,支持电信运营商数字化战略转型,完成浙江移动、上海联通、沙特STC等200 电信大数据解决方案项目落地。曾任华为软交换首席设计师,华为大型电信大数据解决方案SmartCare首席架构师。

目 录

目 录

部分 大数据的本质

第1章 大数据是什么    2

1.1 大数据导论    2

1.1.1 大数据简史    2

1.1.2 大数据现状    3

1.1.3 大数据与BI    3

1.2 企业数据资产    4

1.3 大数据挑战    5

1.3.1 成本挑战    6

1.3.2 实时性挑战    6

1.3.3 安全挑战    6

1.4 小结    6

第2章 运营商大数据架构    7

2.1 架构驱动的因素    7

2.2 大数据平台架构    7

2.3 平台发展趋势    8

2.4 小结    8

第3章 运营商大数据业务    9

3.1 运营商常见的大数据业务    9

3.1.1 SQM(运维质量管理)    9

3.1.2 CSE(客户体验提升)    9

3.1.3 MSS(市场运维支撑)    10

3.1.4 DMP(数据管理平台)    10

3.2 小结    11

第二部分 大数据技术

第4章 数据获取    14

4.1 数据分类    14

4.2 数据获取组件    14

4.3 探针    15

4.3.1 探针原理    15

4.3.2 探针的关键能力    16

4.4 网页采集    26

4.4.1 网络爬虫    26

4.4.2 简单爬虫Python代码示例    32

4.5 日志收集    33

4.5.1 Flume    33

4.5.2 其他日志收集组件    47

4.6 数据分发中间件    47

4.6.1 数据分发中间件的作用    47

4.6.2 Kafka架构和原理    47

4.7 小结    82

第5章 流处理    83

5.1 算子    83

5.2 流的概念    83

5.3 流的应用场景    84

5.3.1 金融领域    84

5.3.2 电信领域    85

5.4 业界两种典型的流引擎    85

5.4.1 Storm    85

5.4.2 Spark Streaming    89

5.4.3 融合框架    102

5.5 CEP    108

5.5.1 CEP是什么    108

5.5.2 CEP的架构    109

5.5.3 Esper    110

5.6 实时结合机器学习    110

5.6.1 Eagle的特点    111

5.6.2 Eagle概览    111

5.7 小结    116

第6章 交互式分析    117

6.1 交互式分析的概念    117

6.2 MPP DB技术    118

6.2.1 MPP的概念    118

6.2.2 典型的MPP数据库    121

6.2.3 MPP DB调优实战    131

6.2.4 MPP DB适用场景    162

6.3 SQL on Hadoop    163

6.3.1 Hive    163

6.3.2 Phoenix    165

6.3.3 Impala    166

6.4 大数据仓库    167

6.4.1 数据仓库的概念    167

6.4.2 OLTP/OLAP对比    168

6.4.3 大数据场景下的同与不同    168

6.4.4 查询引擎    169

6.4.5 存储引擎    170

6.5 小结    171

第7章 批处理技术    172

7.1 批处理技术的概念    172

7.2 MPP DB技术    172

7.3 MapReduce编程框架    173

7.3.1 MapReduce起源    173

7.3.2 MapReduce原理    173

7.3.3 Shuffle    174

7.3.4 性能差的主要原因    177

7.4 Spark架构和原理    177

7.4.1 Spark的起源和特点    177

7.4.2 Spark的核心概念    178

7.5 BSP框架    217

7.5.1 什么是BSP模型    217

7.5.2 并行模型介绍    218

7.5.3 BSP模型基本原理    220

7.5.4 BSP模型的特点    222

7.5.5 BSP模型的评价    222

7.5.6 BSP与MapReduce对比    222

7.5.7 BSP模型的实现    223

7.5.8 Apache Hama简介    223

7.6 批处理关键技术    227

7.6.1 CodeGen    227

7.6.2 CPU亲和技术    228

7.7 小结    229

第8章 机器学习和数据挖掘    230

8.1 机器学习和数据挖掘的联系与区别    230

8.2 典型的数据挖掘和机器学习过程    231

8.3 机器学习概览    232

8.3.1 学习方式    232

8.3.2 算法类似性    233

8.4 机器学习&数据挖掘应用案例    235

8.4.1 尿布和啤酒的故事    235

8.4.2 决策树用于电信领域故障快速定位    236

8.4.3 图像识别领域    236

8.4.4 自然语言识别    238

8.5 交互式分析    239

8.6 深度学习    240

8.6.1 深度学习概述    240

8.6.2 机器学习的背景    241

8.6.3 人脑视觉机理    242

8.6.4 关于特征    244

8.6.5 需要有多少个特征    245

8.6.6 深度学习的基本思想    246

8.6.7 浅层学习和深度学习    246

8.6.8 深度学习与神经网络    247

8.6.9 深度学习的训练过程    248

8.6.10 深度学习的框架    248

8.6.11 深度学习与GPU    255

8.6.12 深度学习小结与展望    256

8.7 小结    257

第9章 资源管理    258

9.1 资源管理的基本概念    258

9.1.1 资源调度的目标和价值    258

9.1.2 资源调度的使用限制及难点    258

9.2 Hadoop领域的资源调度框架    259

9.2.1 YARN    259

9.2.2 Borg    260

9.2.3 Omega    262

9.2.4 本节小结    263

9.3 资源分配算法    263

9.3.1 算法的作用    263

9.3.2 几种调度算法分析    263

9.4 数据中心统一资源调度    271

9.4.1 Mesos Marathon架构和原理    271

9.4.2 Mesos Marathon小结    283

9.5 多租户技术    284

9.5.1 多租户概念    284

9.5.2 多租户方案    284

9.6 基于应用描述的智能调度    287

9.7 Apache Mesos架构和原理    288

9.7.1 Apache Mesos背景    288

9.7.2 Apache Mesos总体架构    288

9.7.3 Apache Mesos工作原理    290

9.7.4 Apache Mesos关键技术    295

9.7.5 Mesos与YARN比较    304

9.8 小结    305

第10章 存储是基础    306

10.1 分久必合,合久必分    306

10.2 存储硬件的发展    306

10.2.1 机械硬盘的工作原理    306

10.2.2 SSD的原理    307

10.2.3 3DXPoint    309

10.2.4 硬件发展小结    309

10.3 存储关键指标    309

10.4 RAID技术    309

10.5 存储接口    310

10.5.1 文件接口    311

10.5.2 裸设备    311

10.5.3 对象接口    312

10.5.4 块接口    316

10.5.5 融合是趋势    328

10.6 存储加速技术    328

10.6.1 数据组织技术    328

10.6.2 缓存技术    335

10.7 小结    336

第11章 大数据云化    337

11.1 云计算定义    337

11.2 应用上云    337

11.2.1 Cloud Native概念    338

11.2.2 微服务架构    338

11.2.3 Docker配合微服务架构    342

11.2.4 应用上云小结    348

11.3 大数据上云    348

11.3.1 大数据云服务的两种模式    348

11.3.2 集群模式AWSEMR    349

11.3.3 服务模式Azure Data Lake Analytics    352

11.4 小结    354

第三部分 大数据文化

第12章 大数据技术开发文化    356

12.1 开源文化    356

12.2 DevOps理念    356

12.2.1 Development和Operations的组合    357

12.2.2 对应用程序发布的影响    357

12.2.3 遇到的问题    358

12.2.4 协调人    358

12.2.5 成功的关键    359

12.3 速度远比你想的重要    359

12.4 小结    361

显示部分信息

前 言

前 言

大数据这几年真的很火,于是有越来越多的人开始学习大数据技术。很多人会误以为大数据是一门技术,其实不然,大数据更多的是一门市场宣传语言,也可以理解为一种思考方式。从技术角度来看,大数据是一系列技术的组合,所以真正全面掌握大数据技术也是一件很困难的事情。编写这本书的初衷就是总结这些年的工作和学习经验,希望可以分享给更多人,同时对自己而言也是一个提高、总结和升华的过程。

总的来说,本书围绕一个通用技术栈来组织章节,主要聚焦大数据平台的一些知识。主要分为三部分。

部分:第1~3章,主要讲述大数据的本质、运营商大数据的架构和一些基本的业务知识。

? 第1章:阐述大数据的本质和面临的挑战。

? 第2章:概述大数据架构及背后的驱动因素,以及未来发展的趋势。

? 第3章:介绍运营商领域的业务,让读者对大数据能做什么有一个直观的感受