由于最近再做推薦系統的特征處理,需要借助一些工具來篩選特征。最初使用了R,R的安裝很簡單,而且API也很容易使用,直接就能出圖。後來,發現很多人在python和R之間做選擇,是以我也在兩個工具間搖擺不定。後來,發現Tensorflow裡面有很多python的代碼,而且python可以做爬蟲寫web,幾乎是萬金油的角色。本着想找一門以後日常使用的工具的心态,最終還是選擇了python。
那麼本篇就從下面幾個方面介紹下,如何在日常使用python做資料分析:
- python安裝以及numpy、matplotlib的安裝
- python的hello world
- SublimeText的python內建
- 相關推薦
希望對那些剛剛打算做資料分析的朋友,提供參考。
Python以及必要的庫安裝
Python目前有兩個版本,一個是2.7,一個是3.4,在同僚的推薦下,選擇了2.7。Python的下載下傳直接去官網就可以了,但是想要做資料分析,還需要依賴很多其他的子產品,比如科學計算庫Numpy,圖形庫matplotlib,數值計算庫scipy,資料挖掘分析庫pandas,本篇就先安裝個Numpy和matplotlib,以做示範,其他庫的安裝基本類似。
python安裝的幾種方式
- 一種是在sourceforge上下載下傳exe檔案,隻要作業系統版本沒問題,幾乎是一鍵安裝
- 一種是下載下傳zip或者tar.gz壓縮包,使用裡面的setup.py執行
指令安裝setup.py install
- 另一種是下載下傳whl檔案,放在python的scripts檔案夾中,使用指令
安裝pip install xxx.whl
我這次由于需要的庫比較多,下載下傳的安裝檔案什麼樣子都有,是以幾種方式都會示範下。
相關的下載下傳資源參考分享連結:連結:http://pan.baidu.com/s/1i4Jhez7 密碼:t1sw
安裝Python
直接運作
python-2.7.13.amd64.msi
,無腦下一步即可,不過要記住python所在的目錄
C:\Python27\
,稍後需要對這個目錄進行添加檔案。
安裝numpy和matplotlib
如果版本沒問題(比如不是64位系統下載下傳安裝32位軟體),那麼會自動識别到python所在的目錄,直接下一步安裝即可。
Matplotlib也是一樣安裝即可。
安裝cycler、dateutil
把whl檔案拷貝到python27/scripts目錄下,
可以暫時忽略requests那個檔案,這個requests庫是webhdfs庫連接配接hdfs環境用的,如果不使用可以用安裝
然後分别執行指令:
pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl
安裝pyparsing
解壓pyparsing壓縮包,在setup.py那層目錄執行
setup.py install
指令安裝即可
安裝到這裡,numpy和matplotlib就可以使用了~
python初體驗
python安裝完,來體驗一下吧。python支援控制台輸出,也支援在新的檔案中寫入多行内容,統一執行。
SublimeText內建
直接使用IDLE,有點太麻煩,直接基于sublime text開發過ruby和web前端,體驗非常好,是以還是想通過sublimeText編寫python代碼。
是以首先在點選
Tools->Build System->New Build System
,彈出檔案:
{
"shell_cmd": "make"
}
按照下面的配置輸入:
"cmd": ["C:/Python27/python.exe", "-u", "$file"],
"file_regex": "[1]File "(…?)", line ([0-9]*)",
"selector": "source.python"
并儲存成自己的名字(我起名叫做my_python),注意路徑需要修改為本地的python路徑。路徑為
C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User
在Tools -> Build System 中重新選擇my_pyhton
然後再SublimeText中體驗一下matplotlib的魅力,代碼如下:
import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
plt.figure(1)
plt.plot(x,x*2)
plt.show()
按ctrl+B即可執行:
1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/
2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html
- ↩︎
作者:xingoo
出處:http://www.cnblogs.com/xing901022
本文版權歸作者和部落格園共有。歡迎轉載,但必須保留此段聲明,且在文章頁面明顯位置給出原文連接配接!