JAVA自然语言处理全新pdf下载pdf下载

JAVA自然语言处理全新百度网盘pdf下载

作者:
简介:本篇主要提供JAVA自然语言处理全新pdf下载
出版社:美文图书专营店
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

  • 作者:(美)理查德M.里斯
  • 著:(美)理查德M.里斯
  • 装帧:简装
  • 印次:暂无
  • 定价:59.0
  • ISBN:9787111592112
  • 出版社:机械工业出版社
  • 开本:其他
  • 印刷时间:暂无
  • 语种:中文
  • 出版时间:2018-03-01
  • 页数:193
  • 外部编号:1201673963
  • 版次:1

CONTENTS目 录译者序作者简介审校者简介前言**章 NLP简介 11.1 什么是NLP 21.2 为何使用NLP 31.3 NLP的难点 41.4 NLP工具汇总 51.4.1 Apache OpenNLP 61.4.2 Stanford NLP 71.4.3 LingPipe 91.4.4 GATE 101.4.5 UIMA 101.5 文本处理概览 101.5.1 文本分词 111.5.2 文本断句 121.5.3 人物识别 141.5.4 词*判断 161.5.5 文本分类 171.5.6 关系提取 181.5.7 方法组合 201.6 理解NLP模型 201.6.1 明确目标 201.6.2 *择模型 211.6.3 构建、训练模型 211.6.4 验*模型 221.6.5 使用模型 221.7 准备数据 221.8 本章小结 24第2章 文本分词 252.1 理解文本分词 252.2 什么是分词 262.3 一些简*的Java分词器 282.3.1 使用Scanner类 292.3.2 使用split方法 302.3.3 使用BreakIterator类 312.3.4 使用StreamTokenizer类 322.3.5使用StringTokenizer类 342.3.6使用Java核心分词法的*能考虑 342.4NLP分词器的API 342.4.1使用OpenNLPTokenizer类分词器 352.4.2使用Stanford分词器 372.4.3训练分词器进行文本分词 412.4.4分词器的比较 442.5理解标准化处理 452.5.1转换为小写字母 452.5.2去除停用词 462.5.3词干化 492.5.4词形还原 512.5.5使用流水线进行标准化处理 542.6本章小结 55第3章 文本断句 563.1SBD方法 563.2SBD难在何处 573.3理解LingPipe的HeuristicSen-tenceModel类的SBD规则 593.4简*的Java SBD 603.4.1使用正则表达式 603.4.2使用BreakIterator类 623.5使用NLP API 633.5.1使用OpenNLP 643.5.2使用Stanford API 663.5.3使用LingPipe 743.6训练文本断句模型 783.6.1使用训练好的模型 803.6.2使用SentenceDetector-Evaluator类评估模型 813.7本章小结 82第4章 人物识别 834.1NER难在何处 844.2NER的方法 844.2.1列表和正则表达式 854.2.2统计分类器 854.3使用正则表达式进行NER 864.3.1使用Java的正则表达式来寻找实体 864.3.2使用LingPipe的RegEx-Chunker类 884.4使用NLP API 894.4.1使用OpenNLP进行NER 894.4.2使用Stanford API进行NER 954.4.3使用LingPipe进行NER 964.5训练模型 1004.6本章小结 103第5章 词*判断 1045.1词*标注 1045.1.1词*标注器的重要* 1075.1.2词*标注难在何处 1075.2使用NLP API 1095.2.1使用OpenNLP词*标注器 1105.2.2使用Stanford词*标注器 1185.2.3使用LingPipe词*标注器 1255.2.4训练OpenNLP词*标注模型 1295.3本章小结 131第6章 文本分类 1326.1文本分类问题 1326.2情感分析介绍 1346.3文本分类技术 1356.4使用API进行文本分类 1366.4.1OpenNLP的使用 1366.4.2Stanford API的使用 1406.4.3使用LingPipe进行文本分类 1456.5本章小结 152第7章 关系提取 1537.1关系类型 1547.2理解解析树 1557.3关系提取的应用 1567.4关系提取 1597.5使用NLP API 1597.5.1OpenNLP的使用 1597.5.2使用Stanford API 1627.5.3判断共指消解的实体 1667.6问答系统的关系提取 1687.6.1判断*词依赖关系 1697.6.2判断问题类型 1707.6.3搜索** 1717.7本章小结 173第8章 方法组合 1748.1准备数据 1758.1.1使用Boilerpipe从HTML中提取文本 1758.1.2使用POI从Word文档中提取文本 1778.1.3使用PDFBox从PDF文档中提取文本 1818.2流水线 1828.2.1使用Stanford流水线 1828.2.2在Standford流水线中使用多核处理器 1878.3创建一个文本搜索的流水线 1888.4本章小结 193

Richard M. Reese曾就职于学术界和工业界。他曾在电信和航天工业领域工作17年,期间曾担任研发、软件开发、监督和培训等多个职位。他目前任教于塔尔顿州立大学,运用他多年来积累的行业经验来完善他的课程。
Richard曾出版过关于Java和C的书籍,他使用简洁易用的方*讨*主题,这些书籍包括《E 3.1 Cookbook》,有关Java 7和Java 8的新功能、Java认*以及jMonkey引擎,以及一本关于C指针的书。

自然语言处理(NLP)是应用程序开发的重要领域,在解决实际问题中起着越来越重要的作用。NLP任务支持的自然语言可访问应用程序需求显著增。本书将探索如何使用诸如全文本搜索、专有名称识别、聚类、标记、信息提取、汇总等方法自主组织文本。书中涵盖了NLP的概念,即使没有统计或自然语言处理背景的人也可以理解它。