天天看點

《R語言資料分析》——1.7 小結

本章重點探讨了一些乏味但是很重要的工作,這些工作我們可能每天都要完成。對于每個資料科學項目而言,資料導入一定是第一步,是以要掌握資料分析就應該從如何有效地将資料導入到r會話中開始。

但是某種程度上,有效是個很含糊的概念:從技術角度出發,資料裝載應該快速以免浪費我們的時間,但同時花幾個小時來程式設計以提高導入的效率也不是那麼重要。

本章還對讀取文本檔案,與資料庫系統互動,在r中查詢資料子集等問題給出了一些通用的解決方案。讀者應掌握當下最流行的幾種資料庫系統的處理方法,學會選擇最适合自己項目的資料庫産品,并進行測試,就像我們之前所做的一樣。

下一章,我們将更進一步地對這個問題展開探讨,我們将通過從web和各類api中擷取資料的樣例對問題進行說明,使讀者能夠掌握在項目中應用公開資料的方法,即便你還沒有獲得相應的二進制資料檔案或資料庫背景。