标签:box ges relative read 数值 ack alt dia mos
数值变量的特征和可视化
·数据集中趋势的测量(measures of center)
— 均值(mean)、中位数(median)、众数(mode)
·数据分散趋势的测量(measus of spread)
— 值域(range:max-min)、方差(variance)、标准差(standard variance)、四分位距(interquartile range)
·稳健统计量(robust statistics)
— 是:中位数、四分位差(受极端值影响小)
— 否:均值、标准差、值域(受极端值影响大)
·一个变量的可视化
— 柱状图(histogram)、点图(dot plot)(分布)
— 箱图(box plot)(中位数、分位点、极端值)
· 两个变量的关系
— 散点图(scatter plot):方向、形状、强度、极端值
分类变量的特征和可视化
·一个分类变量的可视化
— 频率表(frequency table)、条形图(bar plot)
·两个分类变量的关系
— 关联表(contingency table)、相对频率表(relative frequency)
— 分段条形图、相对频率分段条形图
— 马赛克图(mosaicplot)
·一个分类变量、一个数值变量的关系
—并排箱图(side-by-side box plot)
标签:box ges relative read 数值 ack alt dia mos
原文地址:http://www.cnblogs.com/tjuwx/p/6698224.html