描述性统计分析方法是指应用分类,制表,图形及概括性数据指标来概括书籍分布特征的方法,而推断性统计分析方法则是通过随机抽样应用统计方法,把样本数据得到的结论推广到总体的数据分析方法。
统计上需要把样本数据所含信息进行概括融合和抽象从而得到反映样本数据的综合指标这些指标称为统计量描述数据特征的统计量可分为两类一类表示数据的中心位置如,均值,中位数,众数等则一类表示数据的离散程度如方差,标准差,极差,等用来衡量各地偏离中心的程度。
对于给定的类,落入这类的个案数称为频率,落入该类中个案数和个案综合数的比例称为相对频率频率分析主要通过频率分布表,条形图,饼图和直方图。
在频率分析中,饼图和直方图一般适用于分类变量的类别个数较少的情况,如果类别个数较多,建议选择直方图。
中心区是是指一组数据向某个中心值靠拢的倾向,描述数据分布的中心位置的统计量称为位置统计量,对于连续变量和定序变量描述数据中心趋势的指标有均值,中位数,众数,百分之五结尾均质,对于定性变量描述数据中心趋势的指标只有众数。
观测值按照从小到大的顺序排列,剔除掉排序后的数据序列两端的部分数值和计算得到的均值称为结尾。
众数是观测值中出现次数最多的数值,其反应了这组观测值的集中趋势。
众数是定性数据,仅能使用的中心区是治标,但众数可以用于制度数据。
今天感觉数据的中心趋势指标进行决策是不够的,例如如果一个国家的普通家庭收入差距很少,而另一个国家的差距收入差距很大,及存在大量的贫困家庭,也存在许多十分富有的家庭那,么即使这两个国家的中等收入家庭的收入完全一样,他们的家庭收入情况也仍然不同。
对观测者而言,其离散程度的大小就是每个观测值偏离均值的情况及该观测值与均值的差值,这个差值可以用来描述个体的变异大小,但它不能代表整体的离散程度。
均值的标准误用来衡量不同样本的均值之间的差别,如果两个样本均值的差值与标准误的比值小于-二或者大于二则,可以断定两个均值有着显著的差别,进而断定这两个样本来自于两个不同的总体。
比较两组数据离散程度大小时,如果熟悉的测量尺度相差太大,或者是数据的量纲不一样,这时直接比较二者的标准差并不合适,首先需要消除测量尺度的量钢的影响变异系数就可以提出这些影响。
spss的许多菜单均可以进行描述性统计分析在独立样本体检验方差分析因子分析等许多分析过程中spss自定义模块儿也可以产生大部分的描述性统计。
原文地址:https://www.cnblogs.com/zhangjunxi/p/11773688.html