wordnet 包的使用
- 下载nltk包,运行下方代码
在import nltk nltk.download() # OR nltk.download("wordnet")
中选择wordnet相关包下载corpora
- 导入包
from nltk.corpus import wordnet as wn
- 查找一个词所在的所有词集
wn.synsets('cat') # 可以指定所需要词集的形式 wn.synsets('cats', pos=wn.VERB) # pos 确定词集的属性 # pos 还可以是 NOUN, ADV, ADJ,
- 查找一个词的定义
wn.synset('cat.n.01').definition() # cat -> 表示需要查询的词 # n -> 表示名词 # 另外 a -> ADJ r -> ADV n -> NOUN v-> VERB # 01 -> 取第一个名词(由n定义)的意思
- 由一个词造句
- 获取一个词的词性
cat = wn.synset("cat.n.01") cat.pos()
- 定义一个词条
- 获取一个词的词条
- 获取一个词的词条名
- 获取一个词的上位词
- 获取一个词的下位词
- 获取一个事物可以组成的整体
- 获取两个词在分类树中的距离
cat = wn.synset("cat.n.01") dog = wn.synset("dog.n.01") cat.shortest_path_distance(dog)
- 获取与对应词相似的词(对副词和形容词比上方方法更有效)
good = wn.synset("good.a.1") good.similar_tos()
- 查询两个词之间的语义相似度
- 使用词条查询反义词
# 不能直接使用synset 进行查询 good.lemmas()[0].antonyms()
- 查询一个词的组成部分
- 查询一个物质的材质
- 查询一个词蕴含的关系