天天看點

《資料科學家修煉之道》一2.4 要點

本節書摘來異步社群《資料科學家修煉之道》一書中的第2章,第2.4節,作者: 【美】zacharias voulgaris(弗格裡斯)譯者: 吳文磊 , 田原 責編: 陳冀康,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視。

資料科學的曆史比人們通常想象得要悠久,然而,直到上一個10年(2000~2010年)才得以落地。

drew conway在2010年9月創作的著名的韋恩圖,有效地總結了資料科學的本質。

資料科學帶來了許多新規則,它們改變了我們傳統處理資料的方式,主要有如下幾個。

mapreduce。

hadoop分布式檔案系統(hdfs)。

進階文本分析。

大規模資料程式設計語言(如pig、r、ecl等等)。

替代性資料庫結構(如hbase、cassandra、mongodb等等)。

資料科學的規則轉變了我們處理資料的手段,而這對我們的生活産生了巨大的影響。正如它帶來對處理大資料有至關重要價值的新思維一樣。

資料科學的提升帶來的新思維,同樣帶來了資料科學家的職業生活和他與人相處的新變化。