《驾驭文本:文本的发现、组织和处理》书评-杂志之家

欢迎来到杂志之家！股权代码 102064

[登录] 经营许可杂志订阅

首页> 图书> 图书介绍(非官网)

驾驭文本:文本的发现、组织和处理图书

驾驭文本:文本的发现、组织和处理

文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面，包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本...

所属分类：图书 >计算机/网络>计算机理论
作者：(美)[英格索尔],(美)[莫顿],(美)[法里斯],[王斌]
产品参数：
丛书名：--
国际刊号：9787121252303
出版社：电子工业出版社
出版时间：2015-07
印刷时间：--
版次：1
开本：16开
页数：318
纸张：胶版纸
包装：平装
套装：否

图书详情内容简介作者简介目录热门图书累计评价（0）

内容简介

文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面，包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术，读者利用现有的开源工具就可以自己实现这些实例。

编辑推荐

总编荐书，经典与你同行

目录

第1章开始驾驭文本

1.1 驾驭文本重要的原因

1.2 预览：一个基于事实的问答系统

1.2.1 嗨，弗兰肯斯坦医生

1.3 理解文本很困难

1.4 驾驭的文本

1.5 文本及智能应用：搜索及其他

1.5.1 搜索和匹配

1.5.2 抽取信息

1.5.3 对信息分组

1.5.4 一个智能应用

1.6 小结

1.7 相关资源

第2章驾驭文本的基础

2.1 语言基础知识

2.1.1 词语及其类别

2.1.2 短语及子句

2.1.3 词法

2.2 文本处理常见工具

2.2.1 字符串处理工具

2.2.2 词条及切词

2.2.3 词性标注

2.2.4 词干还原

2.2.5 句子检测

2.2.6 句法分析和文法

2.2.7 序列建模

2.3 从常见格式文件中抽取内容并做预处理

2.3.1 预处理的重要性

2.3.2 利用Apache Tika抽取内容

2.4 小结

2.5 相关资源

第3章搜索

3.1 搜索和多面示例：Amazon.com

3.2 搜索概念入门

3.2.1 索引内容

3.2.2 用户输入

3.2.3 利用向量空间模型对文档排名

3.2.4 结果展示

……

第4章模糊字符串匹配

第5章命名实体识别

第6章文本聚类

第7章分类及标注

第8章构建示例问答系统

第9章未驾驭的文本：探索未来前沿

看过该图书的还看过

相关图书

网友评论(不代表本站观点)

免责声明

本站合法持有《出版物经营许可证》，仅销售经国家新闻出版署批准的合法期刊，不是任何杂志、图书官网，不涉及出版事务。本站仅提供有限咨询服务，需要用户自己向出版商投稿且没有绿色通道，是否录用一切以出版商通知为准。提及的第三方名称或商标，其知识产权均属于相应的出版商或期刊，本站与上述机构无从属关系，所有引用均出于解释服务内容的考量，符合商标法规范。本页信息均由法务团队进行把关，若期刊信息有任何问题，请联系在线客服，我们会认真核实处理。若用户需要出版服务，请联系相关出版商。

更多出版社

你好，需要期刊咨询服务吗？

了解期刊
选刊建议
杂志订阅
投稿政策解读

在线咨询

了解我们: 获奖信息; 挂牌上市; 版权说明

杂志之家服务支持: 在线客服; 工作时间 8：00－24：00

期刊咨询服务: 服务流程; 网站特色; 常见问题

经营许可: 出版物经营许可证; 企业营业执照

客服服务: 期刊咨询; 订阅咨询; 投诉留言

其它: 公文范文; 期刊知识

特别声明：本站持有《出版物经营许可证》，主要从事期刊杂志零售，不是任何杂志官网，不涉及出版事务，特此申明。
工信部备案：蜀ICP备09010985号-11 川公网安备：51092202000082 统一信用码：91510922MACX24HU41
出版物经营许可证：射行审新出发2023字第016号股权代码：102064© 版权所有：四川博文网络科技有限责任公司太和分公司