R提供了获取汇总统计的各种功能。获取描述性统计量的一种方法是使用具有指定汇总统计量的sapply()函数。
# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)
在sapply中使用的可能函数包括mean,sd,var,min,max,median,range和quantile。
还有许多R功能可以一次提供一系列描述性统计数据。例如
# mean,median,25th and 75th quartiles,min,max
summary(mydata)
# Tukey min,lower-hinge, median,upper-hinge,max
fivenum(x)
使用Hmisc软件包
library(Hmisc)
describe(mydata)
# n, nmiss, unique, mean, 5,10,25,50,75,90,95th percentiles
# 5 lowest and 5 highest scores
使用pastecs 包
library(pastecs)
stat.desc(mydata)
# nbr.val, nbr.null, nbr.na, min max, range, sum,
# median, mean, SE.mean, CI.mean, var, std.dev, coef.var
使用心理包
library(psych)
describe(mydata)
# item name ,item number, nvalid, mean, sd,
# median, mad, min, max, skew, kurtosis, se
小组统计汇总
通过分组变量生成汇总统计的简单方法可以在心理包中找到。
library(psych)
describe.by(mydata, group,...)
所述doBy包提供多的SAS PROC内容的功能。它使用模型公式和函数定义所需的表格。这是一个简单的例子。
library(doBy)
summaryBy(mpg + wt ~ cyl + vs, data = mtcars,
FUN = function(x) { c(m = mean(x), s = sd(x)) } )
# produces mpg.m wt.m mpg.s wt.s for each
# combination of the levels of cyl and vs
另请参阅:汇总数据。
来练习
想交互式练习?试试这个免费的统计和R课程