天天看點

對ch08.csv-消費賬單進行簡單的分析及可視化

#需要研究的内容 男性和女性的小費 去吃飯的人數對小費的影響 男女抽煙的人數和所占比例--禁煙對餐廳消費有正向/負向影響 抽煙的人和不抽煙的人,誰消費水準更高

周末用餐人數較多? 午餐和晚餐 平時和周末 賣出數量比較 午餐和晚餐 平時和周末 人均消費水準 小費水準

男女比例---這家餐廳是男性口味還是女性口味--需要更多資料

代碼: import matplotlib.pyplot as plt import numpy as np import pandas as pd

tips = pd.readcsv('tips.csv')

party_counts = pd.crosstab(tips.day,tips.size) /// 周幾 幾個人的台子開了幾個 In [11]: party_counts Out[11]: size  1   2   3   4  5  6 day Fri   1  16   1   1  0  0 Sat   2  53  18  13  1  0 Sun   0  39  15  18  3  1 Thur  1  48   4   5  1  3 發現一人台和6人台都很少,于是切片: /// party_counts=party_counts.ix[:,2:5] /// In [13]: party_counts Out[13]: size   2   3   4  5 day Fri   16   1   1  0 Sat   53  18  13  1 Sun   39  15  18  3 Thur  48   4   5  1 把1人台和6人台的去掉并作圖 /// party_counts.plot(kind = 'bar')

///

進行規格化,使各行和為1 /// party_pcts = party_counts.div(party_counts.sum(1).astype(float),axis = 0)

發現周末的聚會規模變大

我們再來生成“小費占總消費比值”的圖 tips['tip_pct']= tips['tip']/tips['total_bill'] tips['tip_pct'].hist(bins = 50)//直方圖 tips['tip_pct'].plot(kind = 'kde')//KDE圖