天天看点

Python词云学习之旅

上次看知乎的时候,看到了一位python大神爬取了一些人们在疫情结束后第一件事要干嘛的评论,并做成了云图,当时就觉得特别有意思,所以就来学习一下。

下载的话就不过多介绍了,百度上都有,主要说一下编辑云词很好用的工具以及如何去制作词云。

工具的介绍以及下载可以查知乎大神写的

https://zhuanlan.zhihu.com/p/33105153

安装好之后,更改一下默认目录,之后运行的话只需输入

即可运行

Python词云学习之旅
Python词云学习之旅

因为默认是无法加载汉字的,所以需要复制一下本地字体进行导入

Python词云学习之旅

复制一个到你设置的jupyter notebook目录,导入即可

背景图片

Python词云学习之旅

生成的词云图

Python词云学习之旅

但如果想要透明背景的话应该怎么做

Python词云学习之旅

去掉之后,再运行就OK了

Python词云学习之旅

这里我设置的字符串是

如果是这么长的一段话,又该怎么处理那?

使用<code>\</code>进行分割

Python词云学习之旅

也可以导入一个第三方自然语言处理库

Python词云学习之旅

空格、符号会被自动去掉,但是<code>wcd.generate(text)</code>需要传入的是字符串不是列表,而且传入的字符串需要每个字间隔都要有空格,可以改成如下的格式

Python词云学习之旅

这样generate方法就可以进行处理了

Python词云学习之旅

这个只是一个最简单的例子,之后会每天进行学习做一个不同的云图!!!

未完待续!!!