Python数据分析与挖掘实战(第2版)pdf下载

Python数据分析与挖掘实战(第2版)百度网盘pdf下载

作者:
简介:Python数据分析与挖掘实战(第2版)
出版社:机械工业出版社
出版时间:2019-11-01
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介
  本书是Python数据分析与挖掘领域的公认的事实标准,第1版销售超过10万册,销售势头依然强劲,被国内100余所高等院校采用为教材,同时也被广大数据科学工作者奉为经典。作者在大数据挖掘与分析等领域有10余年的工程实践、教学和创办企业的经验,不仅掌握行业的最新技术和实践方法,而且洞悉学生和老师的需求与痛点,这为本书的内容和形式提供了强有力的保障,这是本书第1版能大获成功的关键因素。全书共13章,分为三个部分,从技术理论、工程实践和进阶提升三个维度对数据分析与挖掘进行了详细的讲解。
目录
前言
基础篇
第1章 数据挖掘基础
1.1 某知名连锁餐饮企业的困惑
1.2 从餐饮服务到数据挖掘
1.3 数据挖掘的基本任务
1.4 数据挖掘建模过程
1.4.1 定义挖掘目标
1.4.2 数据取样
1.4.3 数据探索
1.4.4 数据预处理
1.4.5 挖掘建模
1.4.6 模型评价
1.5 常用数据挖掘建模工具
1.6 小结
第2章 Python数据分析简介
2.1 搭建Python开发平台
2.1.1 所要考虑的问题
2.1.2 基础平台的搭建
2.2 Python使用入门
2.2.1 运行方式
2.2.2 基本命令
2.2.3 数据结构
2.2.4 库的导入与添加
2.3 Python数据分析工具
2.3.1 NumPy
2.3.2 SciPy
2.3.3 Matplotlib
2.3.4 pandas
2.3.5 StatsModels
2.3.6 scikit-learn
2.3.7 Keras
2.3.8 Gensim
2.4 配套附件使用设置
2.5 小结
第3章 数据探索
3.1 数据质量分析
3.1.1 缺失值分析
3.1.2 异常值分析
3.1.3 一致性分析
3.2 数据特征分析
3.2.1 分布分析
3.2.2 对比分析
3.2.3 统计量分析
3.2.4 周期性分析
3.2.5 贡献度分析
3.2.6 相关性分析
3.3 Python主要数据探索函数
3.3.1 基本统计特征函数
3.3.2 拓展统计特征函数
3.3.3 统计绘图函数
3.4 小结
第4章 数据预处理
4.1 数据清洗
4.1.1 缺失值处理
4.1.2 异常值处理
4.2 数据集成
4.2.1 实体识别
4.2.2 冗余属性识别
4.2.3 数据变换
4.2.4 简单函数变换
4.2.5 规范化
4.2.6 连续属性离散化
4.2.7 属性构造
4.2.8 小波变换
4.3 数据归约
4.3.1 属性归约
4.3.2 数值归约
4.4 Python主要数据预处理函数
4.5 小结
第5章 挖掘建模
5.1 分类与预测
5.1.1 实现过程
5.1.2 常用的分类与预测算法
5.1.3 回归分析
5.1.4 决策树
5.1.5 人工神经网络
5.1.6 分类与预测算法评价
5.1.7 Python分类预测模型特点
5.2 聚类分析
5.2.1 常用聚类分析算法
5.2.2 K-Means聚类算法
5.2.3 聚类分析算法评价
5.2.4 Python主要聚类分析算法
5.3 关联规则
5.3.1 常用关联规则算法
5.3.2 Apriori算法
5.4 时序模式
5.4.1 时间序列算法
5.4.2 时间序列的预处理
5.4.3 平稳时间序列分析
5.4.4 非平稳时间序列分析
5.4.5 Python主要时序模式算法
5.5 离群点检测
5.5.1 离群点的成因及类型
5.5.2 离群点检测方法
5.5.3 基于模型的离群点检测方法
5.5.4 基于聚类的离群点检测方法
5.6 小结
实战篇
第6章 财政收入影响因素分析及预测
6.1 背景与挖掘目标
6.2 分析方法与过程
6.2.1 分析步骤与流程
6.2.2 数据探索分析
6.2.3 数据预处理
6.2.4 模型构建
6.3 上机实验
6.4 拓展思考
6.5 小结
第7章 航空公司客户价值分析
7.1 背景与挖掘目标
7.2 分析方法与过程
7.2.1 分析步骤与流程
7.2.2 数据探索分析
7.2.3 数据预处理
7.2.4 模型构建
7.2.5 模型应用
7.3 上机实验
7.4 拓展思考
7.5 小结
第8章 商品零售购物篮分析
8.1 背景与挖掘目标
8.2 分析方法与过程
8.2.1 数据探索分析
8.2.2 数据预处理
8.2.3 模型构建
8.3 上机实验
8.4 拓展思考
8.5 小结
第9章 基于水色图像的水质评价
9.1 背景与挖掘目标
9.2 分析方法与过程
9.2.1 分析步骤与流程
9.2.2 数据预处理
9.2.3 模型构建
9.2.4 水质评价
9.3 上机实验
9.4 拓展思考
9.5 小结
第10章 家用热水器用户行为分析与事件识别
10.1 背景与挖掘目标
10.2 分析方法与过程
10.2.1 数据探索分析
10.2.2 数据预处理
10.2.3 模型构建
10.2.4 模型检验
10.3 上机实验
10.4 拓展思考
10.5 小结
第11章 电子商务网站用户行为分析及服务推荐
11.1 背景与挖掘目标
11.2 分析方法与过程
11.2.1 分析步骤与流程
11.2.2 数据抽取
11.2.3 数据探索分析
11.2.4 数据预处理
11.2.5 构建智能推荐模型
11.3 上机实验
11.4 拓展思考
11.5 小结
第12章 电商产品评论数据情感分析
12.1 背景与挖掘目标
12.2 分析方法与过程
12.2.1 评论预处理
12.2.2 评论分词
12.2.3 构建模型
12.3 上机实验
12.4 拓展思考
12.5 小结
提高篇
第13章 基于Python引擎的开源数据挖掘建模平台(TipDM)
13.1 平台简介
13.1.1 模板
13.1.2 数据源
13.1.3 工程
13.1.4 系统组件
13.1.5 TipDM数据挖掘建模平台的本地化部署
13.2 快速构建数据挖掘工程
13.2.1 导入数据
13.2.2 配置输入源组件
13.2.3 配置缺失值处理组件
13.2.4 配置记录选择组件
13.2.5 配置数据标准化组件
13.2.6 配置K-Means组件
13.3 小结
前言
  前言
  为什么要写这本书
  LinkedIn通过对全球超过3.3亿用户的工作经历和技能进行分析后得出,在目前炙手可热的25项技能中,数据挖掘人才需求排名第一。那么数据挖掘是什么呢?
  数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此,数据挖掘已成为企业保持竞争力的必要方法。
  与国外相比,我国信息化程度仍不算高,企业内部信息也不完整,零售、银行、保险、证券等行业对数据挖掘的应用还不太理想。但随着市场竞争的加剧,各行业对数据挖掘技术的需求越来越强烈,可以预计,未来几年各行业的数据分析应用一定会从传统的统计分析发展到大规模的数据挖掘应用。在大数据时代,数据过剩、人才短缺,数据挖掘专业人才的培养将离不开专业知识和职业经验积累。所以,本书注重数据挖掘理论与项目案例实践相结合,让读者获得真实的数据挖掘学习与实践环境,更快、更好地学习数据挖掘知识并积累职业经验。
  总的来说,随着云时代的来临,大数据技术将具有越来越重要的战略意义。大数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产要素,人们对于海量数据的运用将预示着新一轮生产率增长和消费者盈余浪潮的到来。大数据分析技术将帮助企业用户在合理的时间内攫取、管理、处理、整理海量数据,为企业经营决策提供积极帮助。大数据分析作为数据存储和挖掘分析的前沿技术,广泛应用于物联网、云计算、移动互联网等战略性新兴产业。虽然目前大数据在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的大数据分析人才更是各企业争夺的焦点。为了满足日益增长的大数据分析人才需求,很多高校开始尝试开设不同程度的大数据分析课程。“大数据分析”作为大数据时代的核心技术,必将成为高校数学与统计学专业的重要课程之一。
精彩书摘
  1.1 某知名连锁餐饮企业的困惑
  国内某餐饮连锁有限公司(以下简称T餐饮)成立于1998年,主要经营粤菜,兼具湘菜、川菜等菜系。至今已经发展成为在国内具有一定知名度、美誉度,多品牌、立体化的大型餐饮连锁企业。该公司拥有员工1000多人,拥有16家直营分店,经营总面积近13000平方米,年营业额近亿元。旗下各分店均坐落在繁华市区主干道,雅致的装潢,配之以精致的饰品、灯具、器物,菜品精美,服务规范。
  近年来,餐饮行业面临较为复杂的市场环境,与其他行业一样,餐饮企业也遇到了原材料成本升高、人力成本升高、房租成本升高等问题,这也使得整个行业的利润率急剧下降。人力成本和房租成本的上升是必然趋势,如何在保持产品质量的同时提高企业效率,成为T餐饮急需解决的问题。从2000年开始,T餐饮通过加强信息化管理来提高效率,目前已上线的管理系统包括以下几个:
  (1)客户关系管理系统
  该系统详细记录了每位客人的喜好,为顾客提供个性化服务,满足客户的个性化需求。通过客户关怀,提高客户的忠诚度。比如,企业能随时查询今天哪位客人过生日或其他纪念日,根据客人的价值分类给予相应关怀,如送鲜花、生日蛋糕、寿面等。通过本系统,还可对客户行为进行深入分析,包括客户价值分析、新客户分析与发展,并根据其价值情况将有关信息提供给管理者,为企业提供决策支持。
  (2)前厅管理系统
  该系统通过掌上电脑无线点菜方式,改变了传统“饭店点菜、下单、结账,一支笔、一张纸,服务员来回跑的局面”,可以快速完成点菜过程。通过厨房自动送达信息,服务员不需要再手写点菜单,写菜速度加快,同时传菜部也轻松不少,菜单会通过电脑自动打印出来,降低差错率,也不存在厨房人员看不清服务员字迹而出现错误的问题。
  (3)后厨管理系统
  信息化技术可实现后厨与前厅无障碍沟通,客人菜单可瞬间传到厨房。服务员只需点击掌上电脑的发送键,客人的菜单即被传送到收银管理系统中,由系统的电脑发出指令,设在厨房等处的打印机立即打印出相应的菜单,然后厨师按单做菜。与此同时,收银台也打印出一张同样的菜单放在客人桌上,作为客人查询及结账凭据,使客人清楚消费明细。