天天看點

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

大前天我們通過Python網絡爬蟲對朋友圈的資料進行了抓取,感興趣的朋友可以點選進行檢視,

如何利用Python網絡爬蟲抓取微信朋友圈的動态(上)

如何利用Python網絡爬蟲爬取微信朋友圈動态——附代碼(下)

。今天小編帶大家通過詞雲去将其進行可視化,具體的教程如下。

1、在Python中做詞雲,需要用到wordcloud庫和jieba分詞庫,沒有安裝的夥伴可以直接pip安裝即可。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

2、之後你可能還需要一些字型,如simhei.ttf等,這些字型在網上都有,可以直接進行下載下傳,在做詞雲的時候會用得到,如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

3、在items.py的同級目錄下建立analyse.py檔案,定義analyse_words方法,用于實作詞雲可視化,jieba.cut用于得到分詞結果,具體的代碼實作,如下圖所示。因為得到的moment.json資料是以JSON格式存儲的,是以需要在該檔案中導入JSON子產品對其進行解析。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

這個地方需要注意一下,由于我們的memoent.json檔案中是中文字元,如果在open()函數中沒有加入encoding=’utf-8’的話會導緻gbk編碼錯誤,記得将編碼加上即可。

4、之後運作程式,得到keys.png圖檔檔案,程式運作的效果如下圖所示。可以看到keys.png已經在items.py目錄下了。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

5、輕按兩下keys.png,如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

6、不得不承認,這個詞雲圖檔内容确實豐富,不過也十分的醜。小編利用wordart(一個詞雲網站)将朋友圈資料進行更加美化的可視化。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

7、比方說用動物的圖案進行可視化,效果圖如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

8、如果直接将資料進行導入的話,wordart會直接将整段話進行可視化,這樣顯得十分備援,看上去也不太友好,是以還需要通過Python對資料進行分頻統計,之後再導入到wordart中就可以看到想要的效果了。首先,我們需要對json檔案進行處理一下,将文本全部導出來,形成一個moment.txt檔案。内容如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

9、編寫代碼,将文本進行分詞,代碼實作如下所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

10、程式運作完成之後,得到的moment_outputs.txt檔案,内容如下圖所示,可以很清楚的看到分詞情況。紅色部分是程式運作的過程。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

11、繼續編寫代碼,将詞頻進行統計彙總,代碼實作如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

12、程式運作之後,得到一個txt和Excel檔案,裡邊是關于詞頻統計的資訊,如下圖所示。紅色部分是程式運作的結果,并沒有報錯。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

13、将這些關鍵字導入到wordart中進行可視化,如下圖所示。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

14、設定一下圖案、字型、排版、顔色等等,就可以生成絢麗的詞雲圖了,下圖是汪星人詞雲圖。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

15、下圖是小雲朵詞雲圖,可以給視覺帶來一場饕餮盛宴。

如何利用Python詞雲和wordart可視化工具對朋友圈資料進行可視化展示

小夥伴們,你們有沒有覺得很神奇呢?喜歡的話歡迎收藏和轉載噢~~