天天看點

資料挖掘統計分析軟體推薦

本文來自網易雲社群。

常用的資料挖掘軟體還是有很多的,各有千秋。對學習資料挖掘的學生來說,如何選擇确實是道難題,下面就介紹一下幾種常用的挖掘軟體的特點,供大家參考。

資料挖掘軟體首推R,它的優點在于函數都給你寫好了,你隻需要知道參數的形式就行了,有時候即使參數形式不對,R也能“智能地”幫你适應。這種簡單的軟體适合想要專注于業務的人。

R作為一款用于統計分析和圖形化的計算機語言及分析工具,為了保證性能,其核心計算子產品是用C、C++和Fortran編寫的。同時為了便于使用,它提供了一種腳本語言,即R語言。R支援一系列分析技術,包括統計檢驗、預測模組化、資料可視化等等。

R軟體的首選界面是指令性界面,通過編寫腳本來調用分析功能。如果缺乏程式設計技能,也可使用圖形界面,比如使用R Commander。

其次是Python,Python幾乎都可以做(通用性語言),函數比R多,比R快。但是缺點是比R難學一點。它是一門語言,R更像是一種軟體,是以python更能開發出flexible的算法。它的語言簡單易懂,做分析友善,而且可以開發大型軟體。

其它資料挖掘軟體用的并不是很多,但是可以結合知友的回答推薦幾款,常用的資料挖掘軟體還是有很多的,各有千秋。

  • SAS Data Mining:

發掘資料集的模式,其描述性和預測性模型為使用者更深入的了解資料提供了基礎。使用者不需要寫任何代碼,它們提供易于使用的GUI,并提供從資料處理、叢集到最終環節的自動化工具,使用者可以從中得出最佳結果做出正确決策。

  • WEKA:

一款非常複雜的資料挖掘工具,也可能是名氣最大的開源機器學習和資料挖掘軟體。其原生的非Java版本主要是為了分析農業領域資料而開發的。該工具基于Java版本,支援多種标準資料挖掘任務,包括資料預處理、收集、分類、回歸分析、可視化和特征選取。進階使用者可以通過Java程式設計和指令行來調用其分析元件。同時,Weka也為普通使用者提供了圖形化界面。

同時它還支援幾種經典的資料挖掘任務,顯著的資料預處理,叢集,分類,回歸,虛拟化,以及功能選擇。其技術基于假設資料是以一種單個檔案或關聯的,每個資料點都被許多屬性标注。 Weka 使用Java的資料庫連結能力可以通路SQL資料庫,并可以處理一個資料庫的查詢結果。進階使用者可以通過Java程式設計和指令行來調用其分析元件。同時,Weka也為普通使用者提供了圖形化界面。和R相比,Weka在統計分析方面較弱,但在機器學習方面要強得多。

更多詳細内容可參考:你經常使用的資料挖掘軟體/軟體包有哪些?有什麼優點?

在使用資料挖掘軟體/軟體包的過程中,若能結合大資料分析處理平台,

并能将經常使用的軟體包嵌入其中,分析處理資料必會事倍功半。

利益相關:網易的猛犸大資料平台是一站式的資料開發平台,支援各種常用的資料挖掘軟體/軟體包,靈活的開發模式,簡單的拖拽節點即可進行任務開發,支援資料庫傳輸節點、SQL、Cube、MR、Spark、Script等多種節點任務,内嵌的軟體包簡化了資料開發人員和資料分析人員備援的工作環境,使他們更加關注業務本身。

歡迎點選這裡免費試用網易猛犸。

原文:對學習資料挖掘的學生來說,學習哪種統計分析軟體更好? r語言、sas、stata、spss 或者其他更好的推薦?

繼續閱讀