天天看點

手把手教你從零搭建Python資料分析環境

由于最近再做推薦系統的特征處理,需要借助一些工具來篩選特征。最初使用了R,R的安裝很簡單,而且API也很容易使用,直接就能出圖。後來,發現很多人在python和R之間做選擇,是以我也在兩個工具間搖擺不定。後來,發現Tensorflow裡面有很多python的代碼,而且python可以做爬蟲寫web,幾乎是萬金油的角色。本着想找一門以後日常使用的工具的心态,最終還是選擇了python。

那麼本篇就從下面幾個方面介紹下,如何在日常使用python做資料分析:

  • python安裝以及numpy、matplotlib的安裝
  • python的hello world
  • SublimeText的python內建
  • 相關推薦

希望對那些剛剛打算做資料分析的朋友,提供參考。

Python以及必要的庫安裝

Python目前有兩個版本,一個是2.7,一個是3.4,在同僚的推薦下,選擇了2.7。Python的下載下傳直接去官網就可以了,但是想要做資料分析,還需要依賴很多其他的子產品,比如科學計算庫Numpy,圖形庫matplotlib,數值計算庫scipy,資料挖掘分析庫pandas,本篇就先安裝個Numpy和matplotlib,以做示範,其他庫的安裝基本類似。

python安裝的幾種方式

  • 一種是在sourceforge上下載下傳exe檔案,隻要作業系統版本沒問題,幾乎是一鍵安裝
  • 一種是下載下傳zip或者tar.gz壓縮包,使用裡面的setup.py執行

    setup.py install

    指令安裝
  • 另一種是下載下傳whl檔案,放在python的scripts檔案夾中,使用指令

    pip install xxx.whl

    安裝

我這次由于需要的庫比較多,下載下傳的安裝檔案什麼樣子都有,是以幾種方式都會示範下。

手把手教你從零搭建Python資料分析環境

相關的下載下傳資源參考分享連結:連結:http://pan.baidu.com/s/1i4Jhez7 密碼:t1sw

安裝Python

直接運作

python-2.7.13.amd64.msi

,無腦下一步即可,不過要記住python所在的目錄

C:\Python27\

,稍後需要對這個目錄進行添加檔案。

安裝numpy和matplotlib

如果版本沒問題(比如不是64位系統下載下傳安裝32位軟體),那麼會自動識别到python所在的目錄,直接下一步安裝即可。

手把手教你從零搭建Python資料分析環境
手把手教你從零搭建Python資料分析環境

Matplotlib也是一樣安裝即可。

手把手教你從零搭建Python資料分析環境

安裝cycler、dateutil

把whl檔案拷貝到python27/scripts目錄下,

可以暫時忽略requests那個檔案,這個requests庫是webhdfs庫連接配接hdfs環境用的,如果不使用可以用安裝

手把手教你從零搭建Python資料分析環境

然後分别執行指令:

pip install cycler-0.10.0-py2.py3-none-any.whl
pip install python_dateutil-2.6.1-py2.py3-none-any.whl
           
手把手教你從零搭建Python資料分析環境

安裝pyparsing

解壓pyparsing壓縮包,在setup.py那層目錄執行

setup.py install

指令安裝即可

手把手教你從零搭建Python資料分析環境

安裝到這裡,numpy和matplotlib就可以使用了~

python初體驗

python安裝完,來體驗一下吧。python支援控制台輸出,也支援在新的檔案中寫入多行内容,統一執行。

手把手教你從零搭建Python資料分析環境

SublimeText內建

直接使用IDLE,有點太麻煩,直接基于sublime text開發過ruby和web前端,體驗非常好,是以還是想通過sublimeText編寫python代碼。

是以首先在點選

Tools->Build System->New Build System

,彈出檔案:

{

"shell_cmd": "make"

}

按照下面的配置輸入:

"cmd": ["C:/Python27/python.exe", "-u", "$file"],

"file_regex": "[1]File "(…?)", line ([0-9]*)",

"selector": "source.python"

并儲存成自己的名字(我起名叫做my_python),注意路徑需要修改為本地的python路徑。路徑為

C:\Users\xxh\AppData\Roaming\Sublime Text 3\Packages\User

在Tools -> Build System 中重新選擇my_pyhton

然後再SublimeText中體驗一下matplotlib的魅力,代碼如下:

import numpy as np
import matplotlib.pyplot as plt
plt.figure(1)
ax1=plt.subplot(211)
x=np.linspace(0,100,100)
for i in xrange(1,100):
	plt.figure(1)
	plt.plot(x,x*2)
plt.show()
           

按ctrl+B即可執行:

手把手教你從零搭建Python資料分析環境

1 廖雪峰的python教程:http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/

2 runoob的python教程:http://www.runoob.com/python/python-tutorial.html

  1. ↩︎

作者:xingoo

出處:http://www.cnblogs.com/xing901022

本文版權歸作者和部落格園共有。歡迎轉載,但必須保留此段聲明,且在文章頁面明顯位置給出原文連接配接!