天天看点

python自然语言处理_Python自然语言处理

python自然语言处理_Python自然语言处理

Python自然语言处理

作者:(印)雅兰·萨纳卡(Jalaj Thanaki) 著

出版日期:2018年08月

文件大小:30.79M

支持设备:

¥50.00在线试读

适用客户端:

python自然语言处理_Python自然语言处理

言商书局

iPad/iPhone客户端:下载 Android客户端:下载PC客户端:下载更多详情:查看

?对图书下载、阅读卡购买有疑问:立即进入帮助中心>>

图书简介

目录

本书旨在回答三个问题:第一个,什么是自然语言处理;第二个,为什么大多数人会使用Python来开发自然语言处理应用程序;最后一个也很重要的问题,在学习自然语言处理的时候,有哪些Python相关资源可用。读完本书,读者便会对此了然于胸。

译者序

推荐序

作者介绍

关于审校人员

前言

第1章 引言

1.1 自然语言处理

1.2 基础应用

1.3 高级应用

1.4 NLP和Python相结合的优势

1.5 nltk环境搭建

1.6 读者提示

1.7 总结

第2章 实践理解语料库和数据集

2.1 语料库

2.2 语料库的作用

2.3 语料分析

2.4 数据属性的类型

2.4.1 分类或定性数据属性

2.4.2 数值或定量数据属性

2.5 不同文件格式的语料

2.6 免费语料库资源

2.7 为NLP应用准备数据集

2.7.1 挑选数据

2.7.2 预处理数据集

2.8 网页爬取

2.9 总结

第3章 理解句子的结构

3.1 理解NLP的组成

3.1.1 自然语言理解

3.1.2 自然语言生成

3.1.3 NLU和NLG的区别

3.1.4 NLP的分支

3.2 上下文无关文法

3.3 形态分析

3.3.1 形态学

3.3.2 词素

3.3.3 词干

3.3.4 形态分析

3.3.5 词

3.3.6 词素的分类

3.3.7 词干和词根的区别

3.4 词法分析

3.4.1 词条

3.4.2 词性标注

3.4.3 导出词条的过程

3.4.4 词干提取和词形还原的区别

3.4.5 应用

3.5 句法分析

3.6 语义分析

3.6.1 语义分析概念

3.6.2 词级别的语义

3.6.3 上下位关系和多义词

3.6.4 语义分析的应用

3.7 消歧

3.7.1 词法歧义

3.7.2 句法歧义

3.7.3 语义歧义

3.7.4 语用歧义

3.8 篇章整合

3.9 语用分析

3.10 总结

第4章 预处理

4.1 处理原始语料库文本

4.1.1 获取原始文本

4.1.2 小写化转换

4.1.3 分句

4.1.4 原始文本词干提取

4.1.5 原始文本词形还原

4.1.6 停用词去除

4.2 处理原始语料库句子

4.2.1 词条化

4.2.2 单词词形还原

4.3 基础预处理

4.3.1 正则表达式

4.4 实践和个性化预处理

4.4.1 由你自己决定

4.4.2 预处理流程

4.4.3 预处理的类型

4.4.4 理解预处理的案例

4.5 总结

第5章 特征工程和NLP算法

5.1 理解特征工程

5.1.1 特征工程的定义

5.1.2 特征工程的目的

5.1.3 一些挑战

5.2 NLP中的基础特征

5.2.1 句法分析和句法分析器

5.2.2 词性标注和词性标注器

5.2.3 命名实体识别

5.2.4 n元语法

5.2.5 词袋

5.2.6 语义工具及资源

5.3 NLP中的基础统计特征

5.3.1 数学基础

5.3.2 TF-IDF

5.3.3 向量化

5.3.4 规范化

5.3.5 概率模型

5.3.6 索引

5.3.7 排序

5.4 特征工程的优点

5.5 特征工程面临的挑战

5.6 总结

第6章 高级特征工程和NLP算法

6.1 词嵌入

6.2 word2vec基础

6.2.1 分布语义

6.2.2 定义word2vec

6.2.3 无监督分布语义模型中的必需品

6.3 word2vec模型从黑盒到白盒

6.4 基于表示的分布相似度

6.5 word2vec模型的组成部分

6.5.1 word2vec的输入

6.5.2 word2vec的输出

6.5.3 word2vec模型的构建模块

6.6 word2vec模型的逻辑

6.6.1 词汇表构建器

6.6.2 上下文环境构建器

6.6.3 两层的神经网络

6.6.4 算法的主要流程

6.7 word2vec模型背后的算法和数学理论

6.7.1 word2vec算法中的基本数学理论

6.7.2 词汇表构建阶段用到的技术

6.7.3 上下文环境构建过程中使用的技术

6.8 神经网络算法

6.8.1 基本神经元结构

6.8.2 训练一个简单的神经元

6.8.3 单个神经元的应用

6.8.4 多层神经网络

6.8.5 反向传播算法

6.8.6 word2vec背后的数学理论

6.9 生成最终词向量和概率预测结果的技术

6.10 word2vec相关的一些事情

6.11 word2vec的应用

6.11.1 实现一些简单例子

6.11.2 word2vec的优势

6.11.3 word2vec的挑战

6.11.4 在实际应用中使用word2vec

6.11.5 何时使用word2vec

6.11.6 开发一些有意思的东西

6.11.7 练习

6.12 word2vec概念的扩展

6.12.1 para2vec

6.12.2 doc2vec

6.12.3 doc2vec的应用

6.12.4 GloVe

6.12.5 练习

6.13 深度学习中向量化的重要性

6.14 总结

第7章 规则式自然语言处理系统

7.1 规则式系统

7.2 规则式系统的目的

7.2.1 为何需要规则式系统

7.2.2 使用规则式系统的应用

7.2.3 练习

7.2.4 开发规则式系统需要的资源

7.3 规则式系统的架构

7.3.1 从专家系统的角度来看规则式系统的通用架构

7.3.2 NLP应用中的规则式系统的实用架构

7.3.3 NLP应用中的规则式系统的定制架构

7.3.4 练习

7.3.5 Apache UIMA架构

7.4 规则式系统的开发周期

7.5 规则式系统的应用

7.5.1 使用规则式系统的NLP应用

7.5.2 使用规则式系统的通用AI应用

7.6 使用规则式系统来开发NLP应用

7.6.1 编写规则的思维过程

7.6.2 基于模板的聊天机器人应用

7.7 规则式系统与其他方法的对比

7.8 规则式系统的优点

7.9 规则式系统的缺点

7.10 规则式系统面临的挑战

7.11 词义消歧的基础

7.12 规则式系统近期发展的趋势

7.13 总结

第8章 自然语言处理中的机器学习方法

8.1 机器学习的基本概念

8.2 自然语言处理应用的开发步骤

8.2.1 第一次迭代时的开发步骤

8.2.2 从第二次到第N次迭代的开发步骤

8.3 机器学习算法和其他概念

8.3.1 有监督机器学习方法

8.3.2 无监督机器学习方法

8.3.3 半监督机器学习算法

8.3.4 一些重要概念

8.3.5 特征选择

8.3.6 维度约减

8.4 自然语言处理中的混合方法

8.5 总结

第9章 NLU和NLG问题中的深度学习

9.1 人工智能概览

9.1.1 人工智能的基础

9.1.2 人工智能的阶段

9.1.3 人工智能的种类

9.1.4 人工智能的目标和应用

9.2 NLU和NLG之间的区别

9.2.1 自然语言理解

9.2.2 自然语言生成

9.3 深度学习概览

9.4 神经网络基础

9.4.1 神经元的第一个计算模型

9.4.2 感知机

9.4.3 理解人工神经网络中的数学概念

9.5 实现神经网络

9.5.1 单层反向传播神经网络

9.5.2 练习

9.6 深度学习和深度神经网络

9.6.1 回顾深度学习

9.6.2 深度神经网络的基本架构

9.6.3 NLP中的深度学习

9.6.4 传统NLP和深度学习NLP技术的区别

9.7 深度学习技术和NLU

9.8 深度学习技术和NLG

9.8.1 练习

9.8.2 菜谱摘要和标题生成

9.9 基于梯度下降的优化

9.10 人工智能与人类智能

9.11 总结

第10章 高级工具

10.1 使用Apache Hadoop作为存储框架

10.2 使用Apache Spark作为数据处理框架

10.3 使用Apache Flink作为数据实时处理框架

10.4 Python中的可视化类库

10.5 总结

第11章 如何提高你的NLP技能

11.1 开始新的NLP职业生涯

11.2 备忘列表

11.3 确定你的领域

11.4 通过敏捷的工作来实现成功

11.5 NLP和数据科学方面一些有用的博客

11.6 使用公开的数据集

11.7 数据科学领域需要的数学知识

11.8 总结

第12章 安装指导

12.1 安装Python、pip和NLTK

12.2 安装PyCharm开发环境

12.3 安装依赖库

12.4 框架安装指导

12.5 解决你的疑问

12.6 总结