天天看點

python找房源_如何用Python找到房源資訊(2)

主要是距離,關于距離,有兩種選擇方式,一種是先選出離你上班地最近的幾個區域,然後再在該區域内具體選擇;另一個是可以設定你可以接受的通勤距離,然後以這個距離作為條件,在小于等于這個距離内進行篩選。

我們這裡着重以第一種為主,先選擇距離最近的幾個區域,然後在這幾個區域内進行選擇。

因為距離是按 Region 來進行計算的,而表是按 Name 來統計的,是以要想計算出距離最近的 Region,需要先把 Region 和 Distance 部分提取出來,并合并成一個 DataFrame。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

可以看到,Region=“望京”距離最近,是以我們重點在該區域内選擇,接下來具體看看該區域内租房情況。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

通過上表可以看到在望京區域總共有 101 套房源,接下來對這 101 套房源進行深入分析。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

資料概覽,先對該區域的租房整體情況有個認識,看到 Price 名額的下界為 5000 左右,上界接近于 30000,中位數為 10000 出頭(有沒有感覺到好貴哈哈哈哈),但是我們也看到有一個大于 80000 的超級異常值,我們利用截尾均值對他進行替代。

關于房屋大小,中位數為 100 平,這與 Price 中位數正好可以對應,折算下來相當于 1 平 100 大洋,在與那些 10 平左右的合租房需要 2000+ 大洋比一比,是不是覺得還是 100 平 10000 大洋便宜哈。

是以論一平米的價格的話還是整租更便宜。

先找出那個大于 80000 的異常值具體值是多少,然後進行值替換。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

這是将 Price 異常值處理以後得到的箱型圖,看起來就比較規範了哈。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

通過上圖可以看出:中樓層和高樓層的房源絕對數量基本持平,高出低樓層數量一半。

房屋修建時間也是 2003 年以後的居多,這就和前面的樓層類型可以對應上了,在剛開始的時候(2003 年以前)大部分房子都是低樓層,随着時代的進步,科技的發展,人員的增多,樓層的數量和房屋的數量也随之增加。

房屋類型上的 Top3 類型分别為:2 室 1 廳、3 室 2 廳和 1 室 1 廳。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

通過上圖可以看出,随着時間的推移,2003 年以後的房子的 Price 要明顯高于 2003 年以前的,如果要是對價格比較敏感,可以考慮 2003 年以前的房子。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

随着房屋類型的更新,價格也是随之升高,但是我們也發現,有一些三室房子的價格(下邊界)要低于兩室的價格的,如果對房間數量和價格都有要求的可以考慮這部分房源。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

通過上圖可以看到三個樓層的價格下界基本持平,但是中樓層的中位數和上界價格是要明顯高于其他兩個房型的,這也很正常,中樓層相比于其他兩個樓層的房屋是最宜居的啦,價格貴也正常。

當然了,對于現在租房都很困難的環境下,哪還考慮什麼宜居,當然是挑價格低的房型。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

按 PV 進行降序,我們可以看出哪些房源是比較受歡迎,這些房源都有啥特征。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

從圖中可以看到,低樓層的房源數量不是最多的,但是看房次數卻是最多的(最受歡迎的),可能是低樓層價格低的原因吧。

2003 年和 2007 的房源 PV 最高,這和該年代的房源絕對數量基本維持一緻;兩室一廳的戶型最為火爆;在價格方面 10000 以下的房源比較受歡迎。

python找房源_如何用Python找到房源資訊(2)
python找房源_如何用Python找到房源資訊(2)

結論

通過上面的分析我們可以得出一些參考:

2003 年以前的房源的價格是要低于 2003 年之後的,對價格敏感的可以考慮 2003 年以前的房源。

有一些三室的房子價格是低于兩室的,如果對房間數量和價格都有要求的可以考慮這部分。

中樓層的價格整體上是要高于低樓層的,但是還有一部分是要比低樓層低,而且通過從 PV 最高的樓層來看,低樓層的火爆程度要比中樓層高,是以可以尋找那些不那麼火爆但是價格還低的中樓層。

如果希望機關面積價格最低,還是整租比較合适。

注:本次的資料為鍊家網的整租房源資訊,非合租資訊,是以你會看到價格都很高。

作者:張俊紅

原文來自微信公衆号:51CTO技術棧