常用的统计函数如表5-3所示,其中许多函数都拥有可以影响输出结果的可选参数。举例
来说:
y<- mean(x)
提供了对象x中元素的算术平均数,而:
y<-mean(x,trim=0.05,na.rm=TRUE)
则提供了截尾平均数,即丢弃了最大5%和最小5%的数据和所有缺失值后的算术平均数。请使用
help()了解以上每个函数和其参数的用法。
mean(x) 平均数
mean(c(1,2,3,4))返回值为2.5
median(x) 中位数
median(c(1,2,3,4))返回值为2.5
sd(x) 标准差
sd(c(1,2,3,4))返回值为1.29
var(x) 方差
var(c(1,2,3,4))返回值为1.67
mad(x) 绝对中位差(median absolute deviation)
mad(c(1,2,3,4))返回值为1.48
quantile(x,probs) 求分位数。其中x为待求分位数的数值型向量,probs为一个由[0,1]之间的概率值组成
的数值向量
# 求x的30%和84%分位点
y <- quantile(x, c(.3,.84))
range(x) 求值域
x <- c(1,2,3,4)
range(x)返回值为c(1,4)
diff(range(x))返回值为3
sum(x) 求和
sum(c(1,2,3,4))返回值为10
diff(x, lag=n) 滞后差分,lag用以指定滞后几项。默认的lag值为1
x<- c(1, 5, 23, 29)
diff(x)返回值为c(4, 18, 6)
min(x) 求最小值
min(c(1,2,3,4))返回值为1
max(x) 求最大值
max(c(1,2,3,4))返回值为4
scale(x,center=TRUE,
scale=TRUE)