天天看点

python wordnet 常用方法使用

wordnet 包的使用

  1. 下载nltk包,运行下方代码
    import nltk
    nltk.download()
    # OR
    nltk.download("wordnet")
               

    corpora

    中选择wordnet相关包下载
  2. 导入包
    from nltk.corpus import wordnet as wn
               
  3. 查找一个词所在的所有词集
    wn.synsets('cat')
    # 可以指定所需要词集的形式
    wn.synsets('cats', pos=wn.VERB)  # pos 确定词集的属性
    # pos 还可以是 NOUN, ADV, ADJ, 
               
  4. 查找一个词的定义
    wn.synset('cat.n.01').definition()
    # cat -> 表示需要查询的词
    # n -> 表示名词
    # 另外 a -> ADJ  r -> ADV  n -> NOUN  v-> VERB
    # 01 -> 取第一个名词(由n定义)的意思
               
  5. 由一个词造句
  6. 获取一个词的词性
    cat = wn.synset("cat.n.01")
    cat.pos()
               
  7. 定义一个词条
  8. 获取一个词的词条
  9. 获取一个词的词条名
  10. 获取一个词的上位词
  11. 获取一个词的下位词
  12. 获取一个事物可以组成的整体
  13. 获取两个词在分类树中的距离
    cat = wn.synset("cat.n.01")
    dog = wn.synset("dog.n.01")
    cat.shortest_path_distance(dog)
               
  14. 获取与对应词相似的词(对副词和形容词比上方方法更有效)
    good = wn.synset("good.a.1")
    good.similar_tos()
               
  15. 查询两个词之间的语义相似度
  16. 使用词条查询反义词
    # 不能直接使用synset 进行查询
    good.lemmas()[0].antonyms()
               
  17. 查询一个词的组成部分
  18. 查询一个物质的材质
  19. 查询一个词蕴含的关系