天天看点

wordcloud—根据文本生成词云—Python第三方库

wordcloud库是专门用于根据文本生成词云的Python第三方库。词云以词语为基本单位。

wordcloud安装命令,在cmd中输入pip install wordcloud。

wordcloud的核心是WordCloud类,所有功能都封装在WordCloud类中。

例:

from wordcloud import WordCloud

txt = "I like python,I am learning python"

wordcloud = WordCloud().generate(txt)

wordcloud.to_file("testcloud.png")        即在文件的目录中会生成一个txt内容的testcloud.png图片

wordcloud—根据文本生成词云—Python第三方库

可以使用wordcloud与中文分词jieba结合使用:

wordcloud—根据文本生成词云—Python第三方库

WordCloud对象创建的常用参数

参数 功能
font_path 指定字体文件的完整路径,默认None
width 生成图片宽度,默认400像素
height 生成图片高度,默认200像素
mask 词云形状,默认None,即方形图
min_font_size 词云中最小的字体字号,默认4号
font_step 字号步进间隔,默认1
max_font_size 词云中最大的字体字号,默认None,根据高度自动调节
max_words 词云图中最大词数,默认200
stopwords 被排除词列表,排除词不在词云中显示
background_color 图片背景颜色

WordCloud类的常用方法

方法 功能
generate(text) 由text文本生成词云
to_file(filename) 将词云图保存为名为filename的文件

只要注意顺序,就可以轻松生成词云图片。

格式为:

from wordcloud import WordCloud

txt = "..."         #txt为字符串

words = WordCloud().generate(txt)        #words是根据txt内容生成的词云

words.to_file("词云例子图.png")        #将words词云保存为名为词云例子图.png的图片

继续阅读