书Java数据科学指南Java数据科学指南pdf下载pdf下载

书Java数据科学指南Java数据科学指南百度网盘pdf下载

作者:
简介:本篇主要提供书Java数据科学指南Java数据科学指南pdf下载
出版社:华智书源图书专营店
出版时间:2018-06
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

书名:Java数据科学指

定价:79.00元

作者: 什迪·夏姆斯(Rushdi Shams)

出版社:人 邮电出版社

出版日期:2018-06-01

ISBN:9787115481634

字数:

页码:

版次:1

装帧: 装-胶订

开本:16开

商品重量:0.4kg

编辑


如果你想创建适用 实际生产环境的数据科学模型,那么Java 是你的。Java可以调用各 强大的库(例如MLlib、Weka、DL4*等)。借助这些库,你可以使用Java高效 完成各 数据科学 务。 之,通过学习本书的内容,读者能 握各 处理问题的 法,学会如何把数据科学知识应用到实际生产环境中,以及编 分布式数据科学应用等。本书讲解的内容 在实际工作中 大用场。

内容提要


如今,数据科学已经成为一个热 的技* 域,它涵盖了人工智能的各个 面,例如数据处理、信息检 、机 学习、自然语言处理、数据可 化等。而Java作为一 经 的编程语言,在数据科学 域也有着杰出的表 。本书旨在通过Java编程来 导读者更好 完成数据科学 务。本书通过9章内容,详细 介绍了数据获取与清洗、 的建立 检 数据、统 分析、数据学习、信息的提取、大数据处理、深度学习、数据可 化等重要 题。本书适合想通过Java解决数据科学问题的读者,也适合数据科学 域的 人士以及普通Java开发人员阅读。

目录


1章 获取数据与清洗数据11.1 简介 21.2 使用Java从分层目录中提取所有文件名 3准备工作 3 作步骤 31.3 使用Apache Commons IO从多层目录中提取所有文件名 5准备工作 5 作步骤 51.4 使用Java 8从文本文件一次性读取所有内容 6 作步骤 71.5 使用Apache Commons IO从文本文件一次性读取所有内容 7准备工作 7 作 法 81.6 使用Apache Tika提取PDF文本 8准备知识 9 作步骤 91.7 使用 则表达式清洗ASCII文本文件 11 作步骤 111.8 使用Univocity解析CSV文件 12准备工作 13 作步骤 131.9 使用Univocity解析TSV文件 15准备工作 15 作步骤 161.10 使用OM解析XML文件 17准备工作 17 作步骤 181.11 使用JSON.simple编 JSON文件 20准备工作 20 作步骤 211.12 使用JSON.simple读取JSON文件 23准备工作 24 作步骤 241.13 使用JSoup从一个URL提取Web数据 26准备工作 26 作步骤 261.14 使用Selenium Webdriver从网站提取Web数据 29准备工作 29 作步骤 291.15 从MySQL数据库读取表 数据 32准备工作 32 作步骤 32  2章 为数据建立 与搜 数据 352.1 简介 352.2 使用Apache Lucene为数据建立  35准备工作 36 作步骤 40工作原理 472.3 使用Apache Lucene搜 带 的数据 50准备工作 50 作步骤 51 3章 数据统 分析 563.1 简介 573.2 生成描述性统  59 作步骤 593.3 生成概要统  60 作步骤 603.4 从多 分布生成概要统  61 作步骤 62更多内容 633.5  算 率分布 64 作步骤 643.6  算字符串中的词  65 作步骤 65工作原理 673.7 使用Java 8 算字符串中的词  67 作步骤 673.8  算简单回归 68 作步骤 693.9  算普通小二乘回归 70 作步骤 703.10  算 义小二乘回归 72 作步骤 723.11  算 组数据点的 差 74 作步骤 743.12 为 组数据点 算皮尔逊相关系数 75 作步骤 753.13  行 对t检验 76 作步骤 763.14  行 检验 77 作步骤 783.15  行单因素 差分析(one-way ANOVA test) 79 作步骤 793.16  行K-S检验 81 作步骤 81 4章 数据学习 834.1 简介 834.2 创建与保存ARFF文件 84 作步骤 874.3 对机 学习模型进行交*验证 91 作步骤 914.4 对新的测试数据进行分类 95准备工作 95 作步骤 964.5 使用过滤分类 对新测试数据分类 102 作步骤 1024.6 创建线性回归模型 105 作步骤 1064.7 创建逻辑回归模型 108 作步骤 1084.8 使用K均值算法对数据点进行聚类 110 作步骤 1104.9 依据类别对数据进行聚类处理 113 作 法 1134.10 学习数据间的关 则 116准备工作 116 作步骤 1164.11 使用低层 法、过滤 法、元分类 法选择 征/属性 118准备工作 119 作步骤 119 5章 数据学习 1255.1 简介 1255.2 使用Java机 学习库(Java-ML)向数据应用机 学习 126准备工作 126 作步骤 1285.3 使用斯坦福分类 对数据点分类 137准备工作 137 作步骤 140工作原理 1415.4 使用MOA对数据点分类 142准备工作 142 作步骤 1445.5 使用Mulan对多标 数据点进行分类 147准备工作 147 作步骤 150 6章 从文本数据提取信息 1546.1 简介 1546.2 使用Java检测标 (单词) 155准备工作 155 作步骤 1556.3 使用Java检测句子 160准备工作 160 作步骤 1606.4 使用OpenNLP检测标 (单词)与句子 161准备工作 162 作步骤 1636.5 使用Stanford CoreNLP从标 中提取词根、词性,以及识别命名实  167准备工作 167 作步骤 1696.6 使用Java 8借助余弦相似性测度测量文本相似度 171准备工作 172 作步骤 1726.7 使用Mallet从文本文档提取 题 176准备工作 177 作步骤 1796.8 使用Mallet对文本文档进行分类 184准备工作 184 作步骤 1856.9 使用Weka对文本文档进行分类 189准备工作 190 作步骤 191 7章 处理大数据 1947.1 简介 1947.2 使用Apache Mahout训练在线逻辑回归模型 195准备工作 195 作步骤 1987.3 使用Apache Mahout应用在线逻辑回归模型 202准备工作 202 作步骤 2037.4 使用Apache Spark解决简单的文本挖掘问题 207准备工作 208 作步骤 2107.5 使用MLib的K均值算法 聚类 214准备工作 214 作步骤 2147.6 使用MLib创建线性回归模型 217准备工作 217 作步骤 2187.7 使用MLib的森林模型对数据点进行分类 222准备工作 222 作步骤 223 8章 数据深度学习 2298.1 简介 2298.2 使用DL4*创建Word2vec 经网络 241 作 法 241工作原理 243更多内容 2468.3 使用DL4*创建深度信念 经网络 246 作步骤 246工作原理 2508.4 使用DL4*创建深度自动编码  254 作步骤 254工作原理 256 9章 数据可 化 2599.1 简介 2599.2 绘 2D 弦曲线 260准备工作 260 作步骤 2629.3 绘 直 图 266准备工作 266 作步骤 2689.4 绘 条形图 273准备工作 274 作步骤 2759.5 绘 箱线图或箱须图 279准备工作 279 作步骤 2819.6 绘 散点图 285准备工作 285 作步骤 2869.7 绘 甜圈图 289准备工作 289 作步骤 2909.8 绘 面积图 294准备工作 294 作步骤 295

作者介绍


Rushdi Shams毕 加拿大韦仕敦大学,获得了机 学习应用 士学位, 攻 向是自然语言处理(N*ural Language Processing,NLP)。在成为机 学习与NLP 域的 家之前,他讲授本科生与研究生课程。在YouTube ,他一直运营着一个名为“跟Rushdi一 学”(Learn with Rushdi)的 ,并且 得有声有*,该 要面向想学习 算机技*的朋友。

文摘


序言



^_^:45264e3d0aa3e8d6c3219e87f1ee2f69