《机器学习实战：基于Scikit-Learn、Keras和TensorFlow第2版》[44M]百度网盘|亲测有效|pdf下载

书籍详情

机器学习实战：基于Scikit-Learn、Keras和TensorFlow第2版
出版社:机械工业出版社
出版时间:2020-10
热度:8741
上架时间:2024-06-30 08:52:20
价格:9.0

书籍下载

9.0元标准版 8.9元简单版

书籍预览

查看预览查看链接

免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源，一旦发现资源涉及侵权，将立即删除。希望所有用户一同监督并反馈问题，如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

适读人群：1、机器学习、深度学习从业者； 2、机器学习或者深度学习算法工程师； 3、从初级到高级的各级学生、教师、研究人员； 4、其他对机器学习和Scikit-Learn、Keras、TensorFlow感兴趣的人员

1）“美亚”人工智能图书畅销榜首图书，基于TensorFlow 2和Scikit-Learn的新版本全面升级；

2）Keras之父和TensorFlow移动端负责人鼎力推荐；

3）从实践出发，通过具体的示例、较少的理论和可用于生产环境的Python框架来帮助你直观地理解并掌握构建智能系统所需要的概念和工具；

4）实用性强。没有太多复杂的数学公式推导，每章都附有练习题和代码，可以帮助你应用所学的知识。

内容简介

这本机器学习畅销书基于TensorFlow 2和Scikit-Learn的新版本进行了全面更新，通过具体的示例、非常少的理论和可用于生产环境的Python框架，从零帮助你直观地理解并掌握构建智能系统所需要的概念和工具。

全书分为两部分。第一部分介绍机器学习基础，涵盖以下主题：什么是机器学习，它试图解决什么问题，以及系统的主要类别和基本概念；第二部分介绍神经网络和深度学习，涵盖以下主题：什么是神经网络以及它们有什么用，使用TensorFlow和Keras构建和训练神经网络的技术，以及如何使用强化学习构建可以通过反复试错，学习好的策略的代理程序。第一部分主要基于Scikit-Learn，而第二部分则使用TensorFlow和Keras。

通过本书，你会学到一系列可以快速使用的技术。每章的练习可以帮助你应用所学的知识，你只需要有一些编程经验。所有代码都可以在GitHub上获得。

代码获取方式：

1、微信关注“华章计算机”

2、在后台回复关键词：新版蜥蜴书

作者简介

奥雷利安·杰龙（Aurélien Géron）是机器学习方面的顾问。他曾就职于Google，在2013年到2016年领导过YouTube视频分类团队。他是Wifirst公司的创始人并于2002年至2012年担任该公司的首席技术官。2001年，他创办Ployconseil公司并任首席技术官。

精彩书评

“学习机器学习的优秀资源。你会找到清晰的思路、直观的解释以及大量的实用技巧。”
——弗朗索瓦·肖莱（Francois Chollet），Keras之父，《Python深度学习》的作者

“本书很好地介绍使用神经网络解决问题的相关理论和实践，我向任何有兴趣应用机器学习来解决实际问题的人强烈推荐本书。”
——皮特·沃登（Pete Warden），TensorFlow移动端负责人，TensorFlow团队创始成员

精彩书摘

◆ 前言◆

机器学习海啸

2006 年，Geoffrey Hinton 等人发表了一篇论文，展示了如何训练能够以最先进的精度（> 98%）识别手写数字的深度神经网络。他们将这种技术称为“深度学习”。深度神经网络是（非常）简化的大脑皮层的模型，由一堆人工神经元层组成。当时人们普遍认为，训练深度神经网络是不可能的，并且大多数研究人员在20世纪90年代后期就放弃了这一想法。该论文重新激发了科学界的兴趣，不久之后，许多新论文证明了（在强大的计算能力和大量数据的帮助下）深度学习不仅是可能的，而且还具有令人难以置信的成就，这是其他机器学习（ML）技术无法企及的。这种热情很快扩展到了机器学习的许多其他领域。

大约十年后，机器学习征服了整个工业界：它是当今高科技产品诸多魔力的核心，可以为你的网络搜索结果排名，为智能手机的语音识别提供支持，可以推荐视频，并在围棋比赛中击败世界冠军。在不知不觉中，它将驾驶你的汽车。

你的项目中的机器学习

因此，你自然会对机器学习感到兴奋，并很乐意加入这场盛宴！

也许你想让你的自制机器人拥有自己的大脑，使它能够识别人脸，或者学会走路。

也许你的公司拥有大量数据（用户日志、财务数据、生产数据、机器传感器数据、热线统计信息、人力资源报告等），如果你知道在哪里看，很有可能会发现一些隐藏的宝石。

借助机器学习，你可以完成以下和更多任务：

? 细分客户并为每个群体找到最佳的营销策略。

? 根据类似客户的购买记录，为每个客户推荐产品。

? 检测哪些交易可能是欺诈性的。

? 预测明年的收入。

无论出于何种原因，你都决定学习机器学习并将其实现在你的项目中。好主意！

目标与方法

本书假设你对机器学习一无所知，其目标是为你提供实现能够从数据中学习的程序所需的概念、工具和直觉。

我们将介绍大量技术，从最简单和最常用的技术（例如线性回归）到一些经常赢得比赛的深度学习技术。

本书不是实现每种算法的玩具版本，而是使用可用于生产环境的Python框架：

? Scikit-Learn非常易于使用，它有效地实现了许多机器学习算法，因此成为学习机器学习的重要切入点。Scikit-Learn由 David Cournapeau于2007 年创建，现在由法国计算机科学和自动化研究所的一个研究小组领导。

? TensorFlow是用于分布式数值计算的更复杂的库。通过将计算分布在数百个GPU（图形处理单元）服务器上，它可以有效地训练和运行大型神经网络。TensorFlow（TF）是由 Google创建的，并支持许多大型机器学习应用程序。它于 2015 年 11 月开源，2.0 版本于 2019 年 11 月发布。

? Keras是高层深度学习API，使训练和运行神经网络变得非常简单。它可以在TensorFlow、Theano或微软 Cognitive Toolkit（以前称为 CNTK）之上运行。TensorFlow 附带了该 API 自己的实现，称为 tf.keras，支持某些高级 TensorFlow 功能（例如有效加载数据的能力）。

本书主张动手实践，通过具体的示例和一点点理论就可以对机器学习有一个直观的了解。虽然你无须拿起笔记本电脑就可以阅读本书，但我强烈建议你尝试用 Jupyter notebook试验在 https://github.com/ageron/handson-ml2 上在线获得的代码示例。

先决条件

本书假定你具有一些Python 编程经验，并且熟悉Python 的主要科学库，尤其是NumPy、pandas 和 Matplotlib。

另外，如果你关心一些比较深入的内容，那么你应该对大学水平的数学知识（如微积分、线性代数、概率和统计）有一定的了解。

如果你还不了解Python，那么http://learnpython.org/ 是一个不错的起点。Python.org 上的官方教程也相当不错。

如果你从未使用过 Jupyter，则第 2 章将指导你完成安装并学习基础知识。它是工具箱中的一个强大工具。

如果你不熟悉Python 的科学库，Jupyter notebook里面有一些教程。还有一个关于线性代数的快速数学教程。

路线图

本书分为两部分。第一部分涵盖以下主题：

? 什么是机器学习，它试图解决什么问题，以及其系统的主要类别和基本概念 ? 典型机器学习项目中的步骤 ? 通过将数据与模型进行拟合来学习 ? 优化成本函数 ? 处理、清洁和准备数据 ? 选择和工程化特征 ? 选择模型并使用交叉验证调整超参数 ? 机器学习的挑战，特别是欠拟合和过拟合（偏差 / 方差的权衡） ? 最常见的学习算法：线性和多项式回归、逻辑回归、k-近邻算法、支持向量机、决策树、随机森林和集成方法 ? 降低训练数据的维度以应对“维度的诅咒” ? 其他无监督学习技术，包括聚类、密度估计和异常检测

第二部分涵盖以下主题：

? 什么是神经网络以及它们的作用 ? 使用 TensorFlow 和 Keras 构建和训练神经网络 ? 最重要的神经网络架构，包括用于表格数据的前馈神经网络、用于计算机视觉的卷积网络、用于序列处理的递归网络和长短期记忆（LSTM）网络、用于自然语言处理的编码器 / 解码器和 Transformer、自动编码器和用于生成学习的生成式对抗网络（GAN） ? 训练深度神经网络的技术 ? 如何使用强化学习构建可以通过反复试错学习好的策略的代理程序（例如游戏中的机器人） ? 有效地加载和预处理大量数据 ? 大规模训练和部署 TensorFlow 模型

第一部分主要基于 Scikit-Learn，而第二部分则使用 TensorFlow 和 Keras。

不要草率地跳入深水：尽管深度学习无疑是机器学习中最令人兴奋的领域之一，但你应该首先掌握基础知识。而且，大多数问题可以使用更简单的技术（如第一部分中讨论的随机森林和集成学习方法）来很好地解决。如果你有足够的数据、计算能力和耐心，则深度学习最适合诸如图像识别、语音识别或自然语言处理之类的复杂问题。

第2版的变化第 2 版有 6 个主要变化：

1.　涵盖其他ML 主题：更多的无监督学习技术（包括聚类、异常检测、密度估计和混合模型）；训练深度网络（包括自归一化网络）的更多技术；其他计算机视觉技术（包括 Xception、SENet、使用YOLO 进行物体检测，以及使用R-CNN 进行语义分割）；使用卷积神经网络（CNN，包括 WaveNet）处理序列；使用递归神经网络（RNN）、 CNN 和 Transformer 进行自然语言处理；GAN。 2.　涵盖其他库和 API（Keras、Data API、用于强化学习的 TF-Agents），以及使用分布式策略API、TF-Serving 和 Google Cloud AI Platform 大规模训练和部署TF 模型；还简要介绍 TF Transform、TFLite、TF Addons/Seq2Seq 和 TensorFlow.js。 3.　讨论深度学习研究的一些最新重要成果。 4.　将所有TensorFlow 章节迁移到TensorFlow 2，并尽可能使用TensorFlow 的 Keras API （tf.keras）实现。 5.　更新代码示例，使用最新版本的 Scikit-Learn、NumPy、pandas、Matplotlib 和其他库。 6.　得益于读者的大量反馈，一些章节更加明晰，并修正了一些错误。

添加了一些章节，有些章节被重写，有些则被重新排序。有关第 2 版更新的更多详细信息请参见 https://homl.info/changes2。

其他资源

许多优秀的资源可用于学习机器学习。例如，吴恩达（Andrew Ng）在 Coursera 上的机器学习课程虽然很好，但它需要投入大量的时间（数月）。

还有许多有趣的关于机器学习的网站，当然包括Scikit-Learn出色的用户指南。你可能还喜欢Dataquest（它提供了非常不错的交互式教程），以及机器学习博客（例如Quora 上列出的那些博客）。最后，深度学习网站上有不错的资源清单，可供你了解更多信息。

最后，加入像Kaggle.com 这样的机器学习竞赛网站，将使你在一些实际的问题上获得实践技能，并获得一些顶尖机器学习专业人员的帮助和见解。

致谢

我从未想象过我的第一本书会吸引如此众多的读者。我收到了读者的大量反馈，很多人提出了许多问题，有些人指出了书中的差错，大多数人给了我鼓励。我对所有读者的大力支持表示感谢。非常感谢大家！如果你在代码示例中发现错误（或只是提出问题），请毫不犹豫地在GitHub 上提交问题。如果在文本中发现错误，请提交勘误。一些读者还分享了本书如何帮助他们获得了第一份工作，或者它如何帮助他们解决了正在处理的具体问题。这种反馈极大地激励了我。如果你认为本书对你有所帮助，可以与我分享你的故事，无论是私下还是公开地与我分享。

我也非常感谢那些百忙之中抽出时间审阅本书的专家。特别要感谢François Chollet 审阅了所有基于Keras和TensorFlow 的章节，并给了我一些深入的反馈。由于Keras是第2版的主要新增内容之一，因此请Keras 的作者审阅本书是非常值得的。还要特别感谢 Ankur Patel，他审阅了第 2 版的每一章，并给了我很好的反馈，特别是第9 章（涵盖了无监督学习技术）。关于该主题，他可以写一本书，请查看 Hands-On UnsupervisedLearning Using Python: How to Build Applied Machine Learning Solutions from Unlabeled Data（O’Reilly）。还要感谢Olzhas Akpambetov，他审阅了本书第二部分的所有章节，测试了许多代码，并提出了许多很好的建议。我非常感谢 Mark Daoust、Jon Krohn、Dominic Monn 和 Josh Patterson 如此全面地审阅了本书的第二部分，并用他们的专业知识提供了非常有用的反馈。

查看全部↓

前言/序言

◆推荐序◆

最近几年人工智能技术的突破性进展，比如AlphaGo战胜围棋世界冠军柯洁，Waymo开始部署自动驾驶出租车，都表明深度学习极大地推动了整个机器学习的发展。现在，即使对深度学习技术几乎一无所知的工程师和程序员，也可以使用简单而有效的工具来实现从数据中学习的复杂应用程序。本书就向你展示了具体应该如何来实现各种人工智能的应用，如计算机视觉、自然语言处理等。

本书作者是一位出色的机器学习顾问和培训师，前Google 资深工程师，从2013年至2016 年领导YouTube的视频分类团队，不仅具有深厚的理论功底，还有最前沿的工业界实战操作经验。作者通过使用简洁的理论和细致具体的示例，运用两个Python 框架（Scikit-Learn和 TensorFlow/Keras），帮助你直观地了解构建智能系统的相关概念和工具。你将从本书中学到各种机器学习技术（从简单的线性回归到各种神经网络结构）。每章都附有练习题，可以帮助你应用所学的知识，你所需要的只是编程练习。

本书内容广博，覆盖了机器学习的各个领域，不仅介绍了传统的机器学习模型，包括支持向量机、决策树、随机森林和集成方法，还提供了使用Scikit-Learn 进行机器学习的端到端训练示例。作者尤其对深度神经网络进行了深入的探讨，包括各种神经网络架构（如卷积神经网络、递归神经网络等）、强化学习，以及如何使用TensorFlow/Keras 库来构建和训练神经网络。

本书英文版在Amazon 上的评分是4.7 分（满分 5 分），近 90% 的读者给予了5 星好评，在国内豆瓣读书上也得到 91.5% 的读者的5 星好评，国内外同时有这么高的好评率，足以证明本书的价值及其良好可读性。

如果你正打算学习机器学习和深度学习，正在寻求一个切入点，那么我强烈建议你把本书当作入门教材。需要使用机器学习或者深度学习算法解决实际问题的工程师可将本书当作实战手册，它可以让你了解很多深度学习的最新研究成果和实用技巧。

张明清

布朗大学计算机系博士，

纽约州立大学阿尔巴尼分校计算机科学系副教授，

计算机视觉和机器学习实验室（CVML Lab）主任，

前通用电气公司全球研发中心计算机视觉实验室首席计算机科学家

译者序

随着AlphaGo在人机大战中一举成名，关于人工智能的研究开始广受关注，人工智能科学家也一跃成为“21 世纪热门的人才”。人工智能，特别是机器学习和深度神经网络的广泛应用虽然兴起不久，但是对这两个密切关联的领域的研究其实已经持续了好几十年，早已形成了系统化的知识体系。对于想要踏入机器学习和深度学习领域的初学者和工程师而言，一本理论和实践相结合的书籍是必不可少的，本书就是这样一本书。

本书分为两部分：第一部分介绍机器学习的基础知识；第二部分介绍神经网络与深度学习。附录部分的内容也非常丰富。本书兼顾理论与实战，既适合在校学生，又适合有经验的工程师。

从理论上讲，本书最大的特色就是有深度，覆盖面广，但是书中并没有太多复杂的数学公式推导，很容易看懂。这在现在很多机器学习书籍中是不多见的。

从实战来说，本书使用了当前热门的机器学习框架Scikit-Learn及深度学习框架 TensorFlow和Keras，每一章都配备相应的项目示例，代码的实操性和可读性非常好。本书也是为有经验的工程师而写的，是一本实用指南。特别是附录 B 给出的机器学习项目清单，如果工业界想做一套机器学习的解决方案，完全可以按照这个清单去做。

读者朋友可能非常关心第2 版相比第1 版有何区别，作者在第2 版中不仅重写了大部分章节，还增加了很多机器学习的前沿知识，代码示例采用了 Keras 深度学习框架。

作者将本书所有章节的详细代码都发布在GitHub 上。项目地址为：

https://github.com/ageron/handson-ml2。

译者现在在比利时某科研机构从事深度学习处理器、嵌入式实时人工智能、计算机视觉和深度学习异构平台上的编程框架等研究工作，虽有多年的机器学习和计算机视觉研究和开发经验，但本书中所涉及的专业术语与概念较多，部分概念及术语尚无公认的中文译法，因此我们参考了一些网络上和研究论文中常用的译法。在翻译过程中虽然力求准确地反映原著内容，但由于译者水平有限，可能有错误或者遗漏之处，恳请读者批评指正。读者可以通过电子邮件songnh@outlook.com和译者取得联系。

感谢机械工业出版社华章公司的编辑们，特别是刘锋编辑，他们为保证本书的质量做了大量的编辑和审校工作，在此深表谢意。

还要感谢Ivannie，她在我翻译本书的过程中，给了我最大的快乐。

宋能辉

查看全部↓

相关推荐

深度探索Linux系统虚拟化：原理与实现

游戏设计艺术

游戏设计、原型与开发：基于Unity与C#从构思到实现

机器学习实战：基于Scikit-Learn、Keras和TensorFlow第2版