码迷,mamicode.com
首页 > 编程语言 > 详细

R语言笔记005——计算描述性统计量

时间:2015-10-30 22:56:25      阅读:829      评论:0      收藏:0      [点我收藏+]

标签:

数据的分布特征:

  • 分布的集中趋势,反应各数据向其中心值靠拢或聚集的程度(平均数,中位数,四分位数,众数)
  • 分布的离散程度,反应各数据远离其中心值的趋势(极差,四分位差,方差,标准差,离散系数)
  • 分布的形状,反应数据分布的偏斜程度和峰度(偏态系数,峰度系数)

#######################

平均数(均值):一组数据相加后除以数据的个数而得到结果,称为平均数(mean)

中位数一组数据排序后处于中间位置上的变量值,称为中位数(median)

四分位数一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值,称为四分位数

  • 先计算位置,然后计算四分位数的值。50%处即为中位数

众数:一组数据中出现频数最多的数值(mode)

#######################

极差(全距):一组数据的最大值与最小值之差,称为极差(range)

四分位差:上四分位数与下四分位数之差,称为四分位差

平均差:各变量值与其平均数离差绝对值的平均数,称为平均差

方差:各变量值与其平均数离差平方的平均数,称为方差(variance)

标准差:方差的平方根称为标准差()

离散系数

########################

偏态:数据分布的不对称性,称为偏态

峰态:数据分布的平峰或尖峰程度,称为峰态

#########################

描述性统计量:主要包括分布的集中程度,分布的离散程度和分布的偏斜程度。

方法一:summary()函数——最大值,最小值,四分位数(上,下),均值

summary(mtcars) #结果有以下几条

技术分享

1 vars<-c(mpg,hp,wt)
2 head(mtcars[vars])

技术分享

summary(mtcars[vars])

技术分享

 

R语言笔记005——计算描述性统计量

标签:

原文地址:http://www.cnblogs.com/wujiadong2014/p/4924541.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!