上次看知乎的时候,看到了一位python大神爬取了一些人们在疫情结束后第一件事要干嘛的评论,并做成了云图,当时就觉得特别有意思,所以就来学习一下。
下载的话就不过多介绍了,百度上都有,主要说一下编辑云词很好用的工具以及如何去制作词云。
工具的介绍以及下载可以查知乎大神写的
https://zhuanlan.zhihu.com/p/33105153
安装好之后,更改一下默认目录,之后运行的话只需输入
即可运行
![](https://img.laitimes.com/img/9ZDMuAjOiMmIsIjOiQnIsISPrdEZwZ1Rh5WNXp1bwNjW1ZUba9VZwlHdsATOfd3bkFGazxCMx8VesATMfhHLlN3XnxCMwEzX0xiRGZkRGZ0Xy9GbvNGLpZTY1EmMZVDUSFTU4VFRR9Fd4VGdsYTMfVmepNHLrJXYtJXZ0F2dvwVZnFWbp1zczV2YvJHctM3cv1Ce-cmbw5yM1IDM1QWNxY2M0QGNhFzNxYzX2ETNzEDMyIzLcBTMxIDMy8CXn9Gbi9CXzV2Zh1WavwVbvNmLvR3YxUjL3M3Lc9CX6MHc0RHaiojIsJye.png)
因为默认是无法加载汉字的,所以需要复制一下本地字体进行导入
复制一个到你设置的jupyter notebook目录,导入即可
背景图片
生成的词云图
但如果想要透明背景的话应该怎么做
去掉之后,再运行就OK了
这里我设置的字符串是
如果是这么长的一段话,又该怎么处理那?
使用<code>\</code>进行分割
也可以导入一个第三方自然语言处理库
空格、符号会被自动去掉,但是<code>wcd.generate(text)</code>需要传入的是字符串不是列表,而且传入的字符串需要每个字间隔都要有空格,可以改成如下的格式
这样generate方法就可以进行处理了
这个只是一个最简单的例子,之后会每天进行学习做一个不同的云图!!!
未完待续!!!