#需要研究的内容 男性和女性的小費 去吃飯的人數對小費的影響 男女抽煙的人數和所占比例--禁煙對餐廳消費有正向/負向影響 抽煙的人和不抽煙的人,誰消費水準更高
周末用餐人數較多? 午餐和晚餐 平時和周末 賣出數量比較 午餐和晚餐 平時和周末 人均消費水準 小費水準
男女比例---這家餐廳是男性口味還是女性口味--需要更多資料
代碼: import matplotlib.pyplot as plt import numpy as np import pandas as pd
tips = pd.readcsv('tips.csv')
party_counts = pd.crosstab(tips.day,tips.size) /// 周幾 幾個人的台子開了幾個 In [11]: party_counts Out[11]: size 1 2 3 4 5 6 day Fri 1 16 1 1 0 0 Sat 2 53 18 13 1 0 Sun 0 39 15 18 3 1 Thur 1 48 4 5 1 3 發現一人台和6人台都很少,于是切片: /// party_counts=party_counts.ix[:,2:5] /// In [13]: party_counts Out[13]: size 2 3 4 5 day Fri 16 1 1 0 Sat 53 18 13 1 Sun 39 15 18 3 Thur 48 4 5 1 把1人台和6人台的去掉并作圖 /// party_counts.plot(kind = 'bar')
///
進行規格化,使各行和為1 /// party_pcts = party_counts.div(party_counts.sum(1).astype(float),axis = 0)
發現周末的聚會規模變大
我們再來生成“小費占總消費比值”的圖 tips['tip_pct']= tips['tip']/tips['total_bill'] tips['tip_pct'].hist(bins = 50)//直方圖 tips['tip_pct'].plot(kind = 'kde')//KDE圖