天天看點

R語言資料的輸入

鍵盤輸入

調用edit函數,比如我們要讓使用者輸入一個長度為5的向量并指派給變量a,那麼可以:

a<-vector("integer",5)

a<-edit(a)

另外也可以用函數fix來直接編輯變量,而不需要再指派變量。是以上面編輯a變量的指令可以改為:

fix(a)

讀取文本檔案

read.table函數可以讀取csv檔案,也可以讀取其他分隔符分割的文本檔案。如果是Tab鍵分割,那麼就是“\t”比如:

y<-read.table("hw1_data.txt",header=TRUE,sep=“\t”)

如果是标準的CSV檔案,那麼可以使用read.table還可以使用read.csv函數讀取:

x<-read.csv("hw1_data.csv")

讀取Excel格式的檔案

Excel格式分為老的xls和新的xlsx兩種,其實讀取方法是一樣的,一般現在使用的都是xlsx格式的Excel檔案了,要讀取這種格式的檔案,需要安裝package: xlsx。

library(xlsx)

excelFile<-"test1.xlsx"

excel<-read.xlsx(excelFile,1)

最後那個參數1表示讀取第一個Sheet,如果要讀取第二個Sheet就将該參數改為2.

讀取Url

如果我們想直接讀取一個Url檔案,那麼可以使用url函數建立一個connection,然後使用readLines函數得到該Url的内容。

比如:

b<-url("http://www.baidu.com")

html<-readLines(b)

這些需要說明的是,除了HTTP協定,還可以使用ftp協定file://共享檔案夾。另外還可以設定通路網絡的代理。

讀取資料庫

如果需要在R中連接配接資料庫,主要是使用ODBC來連接配接,需要安裝包RODBC。如果是Linux或者Mac平台,對于MySQL資料庫,可以安裝RMySQL包。

因為我現在是Mac,就以MySQL為例,我在MySQL的test資料庫中建立了一個表Employee,現在需要讀取該表。

library(RMySQL)

conn<-dbConnect(MySQL(),dbname="test",host="127.0.0.1")

接下來我們要檢視有哪些表,可以:

dbListTables(conn)

如果我要查詢Employee表中的所有資料,那麼:

emp<-dbGetQuery(conn,"select * from Employee”)

查詢完了資料庫記得關閉連接配接,這是一個好習慣:

dbDisconnect(conn)

如果我們連接配接的不是MySQL,那麼就需要安裝對應的資料庫連接配接的包。比如:

ROracle

RPostgreSQL

RSQLite

另外也可以用JDBC來通路資料庫,包是RJDBC

本文轉自深藍居部落格園部落格,原文連結:http://www.cnblogs.com/studyzy/p/R_ReadData.html,如需轉載請自行聯系原作者