在线客服
精通Python自然语言处理图书
人气:164

精通Python自然语言处理

用Python开发令人惊讶的NLP项目 自然语言处理任务 掌握利用Python设计和构建给予NLP的应用的实践
  • 所属分类:图书 >计算机/网络>程序设计>其他  
  • 作者:[印度] [Deepti] [Chopra], [Nisheeth] [Joshi], Iti
  • 产品参数:
  • 丛书名:--
  • 国际刊号:9787115459688
  • 出版社:人民邮电出版社
  • 出版时间:2017-07
  • 印刷时间:2017-07-01
  • 版次:1
  • 开本:16开
  • 页数:--
  • 纸张:胶版纸
  • 包装:平装-胶订
  • 套装:

内容简介

自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。 本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。

编辑推荐

自然语言处理(NLP)是有关计算语言学与人工智能的研究领域之一。NLP主要关注人机交互,它提供了计算机和人类之间的无缝交互,使得计算机在机器学习的帮助下理解人类语言。 本书详细介绍如何使用Python执行各种自然语言处理(NLP)任务,并帮助读者掌握利用Python设计和构建基于NLP的应用的zui佳实践。本书引导读者应用机器学习工具来开发各种各样的模型。对于训练数据的创建和主要NLP应用的实现,例如命名实体识别、问答系统、语篇分析、词义消歧、信息检索、情感分析、文本摘要以及指代消解等,本书都进行了清晰的介绍。本书有助于读者使用NLTK创建NLP项目并成为相关领域的专家。 通过阅读本书,你将能够: ● 实现字符串匹配算法以及标准化技术; ● 实现统计语言建模技术; ● 深刻理解词干提取器、词形还原器、形态分析器以及形态生成器的开发; ● 开发搜索引擎并实现词性标注和统计建模(包含n-gram方法)等相关概念; ● 熟悉诸如树型库建设、CFG建设、CYK以及Earley线图解析算法等相关概念; ● 开发基于NER的系统并理解和应用情感分析的相关概念; ● 理解并实现信息检索和文本摘要等相关概念; ● 开发语篇分析系统以及基于指代消解的系统。

作者简介

对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员对自然语言处理理论和算法感兴趣的读者,Python程序员

目录

第1章 字符串操作 1

1.1切分 1

1.1.1将文本切分为语句 2

1.1.2其他语言文本的切分 2

1.1.3将句子切分为单词 3

1.1.4使用TreebankWordTokenizer

执行切分 4

1.1.5使用正则表达式实现

切分 5

1.2标准化 8

1.2.1消除标点符号 8

1.2.2文本的大小写转换 9

1.2.3处理停止词 9

1.2.4计算英语中的停止词 10

1.3替换和校正标识符 11

1.3.1使用正则表达式替换

单词 11

1.3.2用另一个文本替换文本的

示例 12

1.3.3在执行切分前先执行替换操作 12

1.3.4处理重复字符 13

1.3.5去除重复字符的示例 13

1.3.6用单词的同义词替换 14

1.3.7用单词的同义词替换的

示例 15

1.4在文本上应用Zipf定律 15

1.5相似性度量 16

1.5.1使用编辑距离算法执行相似性度量 16

1.5.2使用Jaccard系数执行相似性度量 18

1.5.3使用Smith Waterman距离算法执行相似性度量 19

1.5.4其他字符串相似性度量 19

1.6小结 20

第2章 统计语言建模 21

2.1理解单词频率 21

2.1.1为给定的文本开发

MLE 25

2.1.2隐马尔科夫模型估计 32

2.2在MLE模型上应用平滑 34

2.2.1加法平滑 34

2.2.2Good Turing平滑 35

2.2.3Kneser Ney平滑 40

2.2.4Witten Bell平滑 41

2.3为MLE开发一个回退机制 41

2.4应用数据的插值以便获取混合

搭配 42

2.5通过复杂度来评估语言模型 42

2.6在语言建模中应用

Metropolis-Hastings算法 43

2.7在语言处理中应用Gibbs

采样法 43

2.8小结 46

第3章 形态学:在实践中学习 47

3.1形态学简介 47

3.2理解词干提取器 48

3.3理解词形还原 51

3.4为非英文语言开发词干

提取器 52

3.5形态分析器 54

3.6形态生成器 56

3.7搜索引擎 56

3.8小结 61

第4章 词性标注:单词识别 62

4.1词性标注简介 62

默认标注 67

4.2创建词性标注语料库 68

4.3选择一种机器学习算法 70

4.4涉及n-gram的统计建模 72

4.5使用词性标注语料库开发

分块器 78

4.6小结 80

第5章 语法解析:分析训练资料 81

5.1语法解析简介 81

5.2Treebank建设 82

5.3从Treebank提取上下文无关

文法规则 87

5.4从CFG创建概率上下文无关

文法 93

5.5CYK线图解析算法 94

5.6Earley线图解析算法 96

5.7小结 102

第6章 语义分析:意义很重要 103

6.1语义分析简介 103

6.1.1NER简介 107

6.1.2使用隐马尔科夫模型的

NER系统 111

6.1.3使用机器学习工具包训练

NER 117

6.1.4使用词性标注执行

NER 117

6.2使用Wordnet生成同义词

集id 119

6.3使用Wordnet进行词义消歧 122

6.4小结 127

第7章 情感分析:我很快乐 128

7.1情感分析简介 128

7.1.1使用NER执行情感

分析 134

7.1.2使用机器学习执行情感

分析 134

7.1.3NER系统的评估 141

7.2 小结 159

第8章 信息检索:访问信息 160

8.1 信息检索简介 160

8.1.1停止词删除 161

8.1.2使用向量空间模型进行

信息检索 163

8.2向量空间评分及查询操作符

关联 170

8.3使用隐性语义索引开发IR

系统 173

8.4文本摘要 174

8.5问答系统 176

8.6小结 177

第9章 语篇分析:理解才是可信的 178

9.1语篇分析简介 178

9.1.1使用中心理论执行语篇

分析 183

9.1.2指代消解 184

9.2小结 188

第10章 NLP系统评估:性能分析 189

10.1NLP系统评估要点 189

10.1.1NLP工具的评估(词性标注器、词干提取器及形态分析器) 190

10.1.2使用黄金数据执行解析器

评估 200

10.2IR系统的评估 201

10.3错误识别指标 202

10.4基于词汇搭配的指标 202

10.5基于句法匹配的指标 207

10.6使用浅层语义匹配的指标 207

10.7小结 208

网友评论(不代表本站观点)

来自gzl2h**的评论:

ok ok

2017-08-28 18:02:27
来自匿名用**的评论:

不错的书,虽然还没看,看起来不错哈

2017-11-05 12:15:14
来自无昵称**的评论:

很好很强大

2017-11-05 17:16:54

免责声明

更多相关图书