Python数据挖掘与机器学习实战计算机与互联网pdf下载pdf下载

Python数据挖掘与机器学习实战计算机与互联网百度网盘pdf下载

作者:
简介:本篇主要提供Python数据挖掘与机器学习实战计算机与互联网pdf下载
出版社:互动出版网图书专营店
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

 书名:  (正版特价)Python数据挖掘与机器学习实战|232578
 图书定价:  79元
 图书作者:  方巍
 出版社:  机械工业出版社
 出版日期:  2019/5/17 0:00:00
 ISBN号:  9787111626817
 开本:  16开
 页数:  280
 版次:  1-1
 内容简介
本书作为数据挖掘入门读物,基于真实数据集进行案例实战,使用Python数据科学库,从数据预处理开始一步步介绍数据建模和数据挖掘的过程。主要介绍了数据挖掘的基础知识、基本工具和实践方法,通过循序渐进地讲解算法,带领读者轻松踏上数据挖掘之旅。本书采用理论与实践相结合的方式,呈现了如何使用逻辑回归进行环境数据检测,如何使用HMM进行中文分词,如何利用卷积神经网络识别雷达剖面图,如何使用循环神经网络构建聊天机器人,如何使用朴素贝叶斯算法进行破产预测,如何使用DCGAN网络进行人脸生成等。本书也涉及神经网络、在线学习、强化学习、深度学习、大数据处理等内容。
本书适合对传统数据挖掘和机器学习算法开发感兴趣的读者阅读,也适合需要系统掌握深度学习的开发人员阅读。
 目录

前言
第1章 机器学习基础 1
1.1 机器学习概述 2
1.2 机器学习的发展历程 2
1.3 机器学习分类 3
1.3.1 监督学习 3
1.3.2 无监督学习 3
1.3.3 强化学习 4
1.3.4 深度学习 4
1.4 机器学习的应用 4
1.5 开发机器学习的步骤 7
1.6 Python语言的优势 8
1.6.1 可执行伪代码 8
1.6.2 Python语言使用广泛 8
1.6.3 Python语言特色 8
1.6.4 Python语言的缺点 9
1.7 Python开发工具介绍 9
1.7.1 IDLE简介 10
1.7.2 IPython简介 11
1.7.3 PyCharm简介 11
1.7.4 Jupyter Notebook简介 12
1.7.5 Anaconda和Spyder简介 13
1.8 本章小结 15
第2章 Python语言简介 16
2.1 搭建Python开发环境 16
2.1.1 安装Anaconda 16
2.1.2 安装Spyder 18
2.1.3 运行和保存Python程序 19
2.2 Python计算与变量 19
2.2.1 用Python做简单的计算 20
2.2.2 Python的运算符 20
2.2.3 Python的变量 21
2.3 Python的字符串 22
2.4 Python的列表 23
2.5 Python的元组 25
2.6 Python的字典 27
2.7 网络爬虫的发展历史和分类 28
2.7.1 网络爬虫的发展历史 28
2.7.2 网络爬虫的分类 30
2.8 网络爬虫的原理 30
2.8.1 理论概述 30
2.8.2 爬虫的工作流程 31
2.9 爬虫框架介绍 36
2.9.1 Scrapy介绍 36
2.9.2 XPath介绍 39
2.10 网络爬虫的设计与实现 40
2.10.1 网络爬虫的总体设计 40
2.10.2 具体实现过程 40
2.10.3 爬虫结果与分析 45
2.11 本章小结 49
第3章 回归分析 50
3.1 回归分析概述 50
3.1.1 基本概念 50
3.1.2 可以解决的问题 51
3.1.3 回归分析的步骤 51
3.2 线性回归 51
3.2.1 简单线性回归分析 51
3.2.2 多元线性回归分析 52
3.2.3 非线性回归数据分析 52
3.3 用Python实现一元线性回归 53
3.4 用Python实现多元线性回归 56
3.4.1 使用pandas读取数据 56
3.4.2 分析数据 57
3.4.3 线性回归模型 58
3.5 基于线性回归的股票预测 62
3.5.1 数据获取 62
3.5.2 数据预处理 63
3.5.3 编码实现 64
3.5.4 结果分析 65
3.6 逻辑回归 66
3.6.1 构造预测函数 67
3.6.2 构造损失函数J 68
3.6.3 梯度下降法求解最小值 69
3.7 基于逻辑回归的环境数据检测 71
3.7.1 数据来源 71
3.7.2 数据处理 72
3.7.3 异常数据分析 72
3.7.4 数据预测 74
3.8 本章小结 76
第4章 决策树与随机森林 77
4.1 决策树 77
4.1.1 决策树的基本原理 77
4.1.2 决策树的分类 78
4.1.3 决策树的优缺点 81
4.2 使用决策树对鸢尾花分类 82
4.2.1 Iris数据集简介 82
4.2.2 读取数据 83
4.2.3 鸢尾花类别 83
4.2.4 数据可视化 84
4.2.5 训练和分类 85
4.2.6 数据集多类分类 86
4.2.7 实验结果 86
4.3 随机森林 87
4.3.1 随机森林的基本原理 87
4.3.2 随机森林的收敛性 88
4.3.3 随机森林的OOB估计 89
4.3.4 随机森林的随机特征选取 89
4.3.5 随机森林的优缺点 90
4.4 葡萄酒数据集的随机森林分类 91
4.4.1 数据收集 91
4.4.2 相关库函数简介 92
4.4.3 数据基本分析 93
4.4.4 使用随机森林构建模型 97
4.4.5 实验结果 98
4.5 本章小结 99
第5章 支持向量机 100
5.1 SVM的工作原理及分类 100
5.1.1 支持向量机的原理 100
5.1.2 线性可分的支持向量机 101
5.1.3 非线性可分的支持向量机 102
5.2 核函数 103
5.2.1 核函数简介 103
5.2.2 几种常见的核函数 104
5.2.3 核函数如何处理非线性数据 104
5.2.4 如何选择合适的核函数 105
5.3 SVR简介 106
5.3.1 SVR原理 106
5.3.2 SVR模型 106
5.4 时间序列曲线预测 107
5.4.1 生成训练数据集 107
5.4.2 运用不同的核函数进行支持向量回归 108
5.4.3 生成测试数据集 109
5.4.4 预测并生成图表 110
5.4.5 获取预测误差 111
5.4.6 创建数据集 112
5.4.7 选取**参数 112
5.4.8 预测并生成图表 112
5.4.9 获取预测误差 113
5.5 本章小结 114
第6章 隐马尔可夫模型 115
6.1 隐马尔可夫模型简介 115
6.1.1 隐马尔可夫模型的概念 115
6.1.2 详例描述 116
6.1.3 HMM流程 117
6.2 Viterbi算法 117
6.3 HMM模型用于中文分词 119
6.3.1 UI界面 119
6.3.2 数据及其编码 119
6.3.3 HMM模型 121
6.3.4 实验结果 122
6.4 本章小结 124
第7章 BP神经网络模型 125
7.1 背景介绍 125
7.2 结构特点 126
7.3 网络模型 126
7.4 人工神经网络简介 127
7.4.1 神经元 127
7.4.2 单层神经网络 128
7.4.3 双层神经网络 129
7.4.4 多层神经网络 130
7.5 BP神经网络 131
7.6 通过TensorFlow实现BP神经网络 132
7.7 本章小结 134
第8章 卷积神经网络 135
8.1 传统图像识别技术 135
8.1.1 图像预处理 135
8.1.2 图像特征提取 136
8.1.3 图像分类方法 136
8.2 卷积神经网络结构简介 137
8.2.1 卷积神经网络发展历程 137
8.2.2 卷积神经网络结构简介 137
8.3 卷积神经网络的结构及原理 139
8.3.1 卷积层 139
8.3.2 池化层 140
8.3.3 激活函数 142
8.3.4 全连接层 144
8.3.5 反馈运算 144
8.4 卷积神经网络的优点 146
8.5 雷达剖面图识别模型 148
8.5.1 数据准备 148
8.5.2 构建模型 150
8.6 模型测试分析 157
8.6.1 部署基本模块 157
8.6.2 创建项目结构 157
8.6.3 训练网络 158
8.6.4 自动化测试 158
8.7 本章小结 160
第9章 循环神经网络 161
9.1 自然语言处理 161
9.1.1 自然语言处理概述 161
9.1.2 自然语言处理应用 162
9.2 对话系统 163
9.2.1 对话系统分类 163
9.2.2 聊天机器人分类 164
9.3 基于LSTM结构的循环神经网络 165
9.3.1 循环神经网络 165
9.3.2 通过时间反向传播 166
9.3.3 长短期记忆网络(LSTM) 169
9.4 Seq2Seq模型 172
9.4.1 Encoder-Decoder框架 173
9.4.2 Attention机制 174
9.5 聊天机器人的程序实现 176
9.5.1 准备数据 176
9.5.2 创建模型 178
9.5.3 训练模型 179
9.5.4 测试模型 180
9.6 本章小结 181
第10章 聚类与集成算法 182
10.1 聚类方法简介 182
10.1.1 聚类定义 183
10.1.2 聚类要求 183
10.2 聚类算法 184
10.2.1 划分方法 184
10.2.2 层次方法 184
10.2.3 基于密度的方法 184
10.2.4 基于网格的方法 185
10.2.5 基于模型的方法 185
10.3 K-Means算法 185
10.3.1 K-Means算法概述 185
10.3.2 K-Means算法流程 185
10.3.3 K-Means算法实现 186
10.3.4 实验结果及分析 188
10.3.5 K-Means算法存在的问题 188
10.4 K-Means++算法 189
10.4...
 编辑推荐
大咖力荐
一本好的计算机专业书籍不但需要有翔实的理论介绍,而且更需要有丰富的实战案例讲解和演示。本书结合炙手可热的Python语言,由浅入深地介绍了数据挖掘和机器学习领域**的理论和方法,用通俗易懂的语言循序渐进地介绍了当前的技术热点。本书内容丰富,实用性强,涵盖了多个数据挖掘和机器学习实战案例,是一本不可多得的好书。
——美国阿肯色州大学教授 盛胜利
深度学习在过去的几年间赋予了人工智能领域更强的算法和算力,以及更多的应用场景,深刻地改变了该领域的技术方法论。这本书涵盖了数据挖掘在各个主流领域的诸多应用,并介绍了**的机器学习技术和方法,是一本很好的入门读物。读者朋友可以通过阅读本书快速理解深度学习的基本原理和相关技术,并可以跟随作者的引领动手实践书中给出的多个实战案例,在实践中提高自己的水平。
——浙江大学CAD和CG国家重点实验室博导/教授 林海
本书主要介绍了机器学习领域近几年的一些**进展,并详细阐述了如何完成工业界一些实用且通用的数据挖掘任务。本书行文风格简洁,内容通俗易懂,案例典型而丰富,实用性很强,适合对机器学习和深度学习研究感兴趣的初学者阅读和实践,也适合对相关技术方向感兴趣的从业人员参考和借鉴。
——北京以利天诚人工智能首席专家/大蛇智能创始人 李金洪