标签:
如何将数据组织成某些可理解的形式,使得他可以比较容易地发现数据的趋势,并与其他人交流,这就是描述性统计的任务:简化结构并整理组织数据。整理一组数据的最常用过程是将数据放入一个频数分布。
频数分布是一种组织好的关于位于测量量表每个类别上的个体数目的数据表。
频数分布的结构可以是表或涂,但是,在这两种情况下分布都具有两个相同的元素:
1、组成最初测量量表的类别。
2、频数的记录或每个类别中的个体数目。
比例与百分率
除了频数粉笔中的两个基本列外,表中还可以加入其它描述数据分布的测量。最常用的两种测量为比例与百分比。
比例=P=f/N
由于比例描述了频数(f)与数据数目(N)和之间的关系,因此它也被成为相对频数。
分组频数分布表
当一个数据组涵盖了较大范围的值时,在频数分布表中列出所有数据就不合理了。例如一组考试分数的范围由最低分X=41至最高分X=96。这些数据涵盖的范围超过了50.如果我们由X=96至X=41列出所有数据,这个频数表将具有56行。虽然也可以组织并简化数据,这个表还是会变的冗长麻烦。这个情况下,我们可以将数据分成区间组,然后将区间列在表中代替每个数据。数据组而非个体值,这些组或区间,被称为组距。
规则一:
分组频数分布表应该具有大约10个组距。具有太少或太多区间,这个表都不能提供清晰的画面。需要注意的是,10个区间是一个通常的指导方针。
规则二:
每个区间的宽度应为相对简单的数据。
规则三:
每个组距的最小数值应为宽度的倍数。
规则四:
所有区间应具有相同宽度。他们应该无间断无重复地涵盖所有数值,使得任意特定数值都恰好只属于一个区间。
标签:
原文地址:http://www.cnblogs.com/yangsy0915/p/5476206.html