天天看點

《R資料可視化手冊》一1.3 加載分隔符式的文本檔案

本節書摘來自異步社群《r資料可視化手冊》一書中的第1章,第1.3節,作者 【美】winston chang,更多章節内容可以通路雲栖社群“異步社群”公衆号檢視

問題

如何加載一個分隔符式的文本檔案中的資料?

方法

加載逗号分隔組(csv)資料的最常用方法是:

讨論

由于資料檔案有許多不同的格式,為了加載它們,提供了很多對應的選項。如果一個資料集首行沒有列名:

得到的資料框的列名将是v1、v2等,你可能想要重命名列:

還可以用sep參數來設定分隔符号。如果是空格分隔,使用sep=" ";如果是制表符分隔,使用t。

預設情況下,資料集中的字元串(string)會被視為因子(factor)處理。假設下面是你的資料檔案,然後,你用read.csv()來讀取:

得到的資料框将會把first、last等存儲為因子,盡管此時将它們視為字元串(或使用r中的術語,字元:character)更為合理。為了差別這一點,可以設定stringsasfactors=false。如果有些列應該被處理為因子格式,你可以再逐個轉換:

或者,你可以在加載的時候不做設定(字元串自動轉換為因子),加載之後再對需要的列進行因子到字元的轉換。

另見

read.csv()是對read.table()一個便捷的封裝函數。如果需要更多的輸入控制,參見?read.table。