Python資料可視化常用的是matplotlib庫,matplotlib是底層庫,今天學了pandas的資料可視化,相對于matplotlib庫來說,簡單許多。
折線圖
%matplotlib inline
import numpy as np
import pandas as pd
x1 = pd.Series(np.random.normal(size=10))
x1.plot()
我們也可以加入grid參數添加格網:
x1.plot(grid=True)
條形圖
依舊以前文的簡書資料為例:
jianshu.groupby(jianshu.index)[['view']].sum().sort(['view'],ascending=False)[0:5].plot(kind='bar')
jianshu.groupby(jianshu.index)[['gain']].sum().sort(['gain'],ascending=False)[0:10].plot(kind='barh')
pandas繪圖亂碼解決
pandas繪圖其實是對matplotlib庫繼承,而matplotlib庫預設為ASCII編碼,是以繪圖中文會亂碼。我們需要去matplotlib庫裡面的matplotlibrc檔案進行設定。
打開matplotlibrc檔案,取消如下行的注釋,并在font.sans-serif冒号後加入SimHei,這個為中文字型。重新開機python即可。
font.family : sans-serif
font.sans-serif : SimHei
axes.unicode_minus