R语言笔记005——计算描述性统计量

时间：2015-10-30 22:56:25 阅读：829 评论：0 收藏：0 [点我收藏+]

标签：

数据的分布特征：

#######################

平均数（均值）：一组数据相加后除以数据的个数而得到结果，称为平均数（mean）

中位数：一组数据排序后处于中间位置上的变量值，称为中位数（median）

四分位数：一组数据排序后处于25%（下四分位数）和75%（上四分位数）位置上的值，称为四分位数

众数：一组数据中出现频数最多的数值（mode）

#######################

极差（全距）：一组数据的最大值与最小值之差，称为极差（range）

四分位差：上四分位数与下四分位数之差，称为四分位差

平均差：各变量值与其平均数离差绝对值的平均数，称为平均差

方差：各变量值与其平均数离差平方的平均数，称为方差（variance）

标准差：方差的平方根称为标准差（）

离散系数：

########################

偏态:数据分布的不对称性，称为偏态

峰态：数据分布的平峰或尖峰程度，称为峰态

#########################

描述性统计量：主要包括分布的集中程度，分布的离散程度和分布的偏斜程度。

方法一：summary()函数——最大值，最小值，四分位数（上，下），均值

summary(mtcars) #结果有以下几条

技术分享

1 vars<-c(‘mpg‘,‘hp‘,‘wt‘)
2 head(mtcars[vars])

技术分享

summary(mtcars[vars])

技术分享

标签：

原文地址：http://www.cnblogs.com/wujiadong2014/p/4924541.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行