diff --git a/translated/tech/20200807 An advanced guide to NLP analysis with Python and NLTK.md b/translated/tech/20200807 An advanced guide to NLP analysis with Python and NLTK.md
index 37ea3744c9..8223727f4b 100644
--- a/translated/tech/20200807 An advanced guide to NLP analysis with Python and NLTK.md
+++ b/translated/tech/20200807 An advanced guide to NLP analysis with Python and NLTK.md
@@ -24,7 +24,7 @@
### WordNet 和同义词集
-[WordNet][4] 是 NLTK 里的一个大型词典数据库。WordNet 包含各单词的诸多认知同义词 (一个认知同义词常被称作 synset)。
+[WordNet][4] 是 NLTK 里的一个大型词典数据库。WordNet 包含各单词的诸多认知同义词 (一个认知同义词常被称作 synset)。在 WordNet 里,名词、动词、形容词和副词,各自被组织成一个同义词的网络。
WordNet 是文本分析的一个很有用的工具。它有面向多种语言的版本 (汉语、英语、日语、俄语和西班牙语等),也使用多种许可证 (从开源许可证到商业许可证都有)。初代版本的 WordNet 由普林斯顿大学研发,面向英语,使用类 MIT 许可证。
@@ -34,13 +34,13 @@ WordNet 是文本分析的一个很有用的工具。它有面向多种语言的
|---|---|---|
|名称| 此 synset 的名称 | 单词 code 有 5 个 synset,名称分别是 `code.n.01`、 `code.n.02`、 `code.n.03`、`code.v.01` 和 `code.v.02`|
|词性| 此 synset 的词性 | 单词 code 有 3 个名词词性的 synset 和 2 个动词词性的 synset|
-|定义| 该词作对应词性时的定义 | 动词 code 的一个定义是: (计算机科学)数据或计算机程序指令的象征性排列|
+|定义| 该词作对应词性时的定义 | 动词 code 的一个定义是:(计算机科学) 数据或计算机程序指令的象征性排列|
|例子| 使用该词的例子 | code 一词的例子:为了安全,我们应该给信息编码。|
-|词元| 与该词向关联的其他 synset (包括那些不一定严格地是该词的同义词,但可以大体看作同义词的);词元直接与其他词元连关联,而不是直接与单词相关联| `code.v.02` 的词元是`code.v.02.encipher`、`code.v.02.cipher`、`code.v.02.cypher`、`code.v.02.encrypt`、`code.v.02.inscribe` 和 `code.v.02.write_in_code`|
-|反义词| 意思相反的词 | 词元`encode.v.01.encode` 的反义词是 `decode.v.01.decode`|
-|上义词|该词所属的一个范畴更大的词 | `code.v.01` 的一个上义词是 `tag.v.01`|
-|分项词| 属于该词组成部分的词 | 计算机的一个分项词是芯片|
-|总项词| 该词作为组成部分所属的词 | 窗的一个总项词是电脑屏幕|
+|词元| 与该词相关联的其他 synset (包括那些不一定严格地是该词的同义词,但可以大体看作同义词的);词元直接与其他词元相关联,而不是直接与单词相关联|`code.v.02` 的词元是`code.v.02.encipher`、`code.v.02.cipher`、`code.v.02.cypher`、`code.v.02.encrypt`、`code.v.02.inscribe` 和 `code.v.02.write_in_code`|
+|反义词| 意思相反的词 | 词元 `encode.v.01.encode` 的反义词是 `decode.v.01.decode`|
+|上义词|该词所属的一个范畴更大的词 | `code.v.01` 的一个上义词是 `tag.v.01`|
+|分项词| 属于该词组成部分的词 | computer 的一个分项词是 chip |
+|总项词| 该词作为组成部分所属的词 | window 的一个总项词是 computer screen|
synset 还有一些其他属性,在 `<你的 Python 安装路径>/Lib/site-packages` 下的 `nltk/corpus/reader/wordnet.py`,你可以找到它们。
@@ -116,7 +116,7 @@ Part Holonyms: []
Part Meronyms: []
```
-同义词集和词元在 WordNet 里是按照树状结构组织起来的,下面的代码会给出直观的展现:
+同义词集和词元在 WordNet 里是按照树状结构组织起来的,下面的代码会给出直观的展现:
```
def hypernyms(synset):
@@ -194,7 +194,7 @@ Synset('soccer.n.01') ( n ) [ a football game in which two teams of 11 players t
is 0.05
```
-两个词各个 synset 之间路径相似度最大的是 0.5,表明它们关联性很大 (路径相似度指两个词的意义在上下义关系的词汇分类结构中的最短距离)。
+两个词各个 synset 之间路径相似度最大的是 0.5,表明它们关联性很大 ([路径相似度][6]指两个词的意义在上下义关系的词汇分类结构中的最短距离)。
那么 code 和 bug 呢?这两个计算机领域的词的相似度是:
@@ -226,7 +226,7 @@ NLTK 提供多种相似度计分器,
* jcn_similarity
* lin_similarity
-要进一步了解这个相似度计分器,请查看 [WordNet Interface][6] 的 Similarity 部分。
+要进一步了解这些相似度计分器,请查看 [WordNet Interface][6] 的 Similarity 部分。
#### 自主尝试
@@ -408,7 +408,7 @@ tree.draw()
```
-`sentence = 'Peterson first suggested the name "open source" at Palo Alto, California'`
+sentence = 'Peterson first suggested the name "open source" at Palo Alto, California'
```
验证这个句子里的人名和地名有没有被识别出来。照例先预处理:
@@ -488,18 +488,18 @@ NLTK 也可以使用其他标注器,比如 [Stanfo
使用 Python 库,下载维基百科的 [Category: Computer science page][18],然后:
- * 找出其中频率最高的单词、二元搭配和三元搭配,将它们作为一个关键词列表或者技术列表。相关领域的学生或者工程师需要了解这样一份列表里的内容。
+ * 找出其中频率最高的单词、二元搭配和三元搭配,将它们作为一个关键词列表或者技术列表。相关领域的学生或者工程师需要了解这样一份列表里的内容。
* 图形化地显示这个领域里重要的人名、技术、日期和地点。这会是一份很棒的信息图。
- * 构建一个搜索引擎。你的搜索引擎性能能够超过维基百科吗?
+ * 构建一个搜索引擎。你的搜索引擎性能能够超过维基百科吗?
-### 接下来可以做什么?
+### 下一步?
-自然语言处理是应用构建的典型支柱。NLTK 是经典、丰富且强大的工具集,提供了为现实世界构建有吸引力、目标明确的应用的工作坊。
+自然语言处理是应用构建的典型支柱。NLTK 是经典、丰富且强大的工具集,提供了为现实世界构建有吸引力、目标明确的应用的工作坊。
在这个系列的文章里,我用 NLTK 作为例子,展示了自然语言处理可以做什么。自然语言处理和 NLTK 还有太多东西值得探索,这个系列的文章只是帮助你探索它们的切入点。
-如果你的需求慢慢增长到 NLTK 已经满足不了了,你可以训练新的模型或者向 NLTK 添加新的功能。基于 NLTK 构建的新的自然语言处理库正在不断涌现,机器学习也正被深度用于自然语言处理。
+如果你的需求增长到 NLTK 已经满足不了了,你可以训练新的模型或者向 NLTK 添加新的功能。基于 NLTK 构建的新的自然语言处理库正在不断涌现,机器学习也正被深度用于自然语言处理。
--------------------------------------------------------------------------------