标签:
数据的分布特征:
#######################
平均数(均值):一组数据相加后除以数据的个数而得到结果,称为平均数(mean)
中位数:一组数据排序后处于中间位置上的变量值,称为中位数(median)
四分位数:一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值,称为四分位数
众数:一组数据中出现频数最多的数值(mode)
#######################
极差(全距):一组数据的最大值与最小值之差,称为极差(range)
四分位差:上四分位数与下四分位数之差,称为四分位差
平均差:各变量值与其平均数离差绝对值的平均数,称为平均差
方差:各变量值与其平均数离差平方的平均数,称为方差(variance)
标准差:方差的平方根称为标准差()
离散系数:
########################
偏态:数据分布的不对称性,称为偏态
峰态:数据分布的平峰或尖峰程度,称为峰态
#########################
描述性统计量:主要包括分布的集中程度,分布的离散程度和分布的偏斜程度。
方法一:summary()函数——最大值,最小值,四分位数(上,下),均值
summary(mtcars) #结果有以下几条
1 vars<-c(‘mpg‘,‘hp‘,‘wt‘) 2 head(mtcars[vars])
summary(mtcars[vars])
标签:
原文地址:http://www.cnblogs.com/wujiadong2014/p/4924541.html