标签:结果 个数 关于 要求 相关性 说明 事件 统计 假设
上面的章节主要讲解了关于假设检验、参数估计、统计分布的推断统计的相关内容,但这些推断统计只是对总体的统计量分析,而且只是一个和两个的。我们进行数据的分析,不能停步与总体,要从宏观进入微观,对数据进行分类统计,查看各分类的关系。接下来的这两张就讲述了关于分类变量和数值变量的关系分析方法。主要分析方法就是拟合优度检验,独立性检验,方差分析具体内容如下:
对于一个分类变量和数值变量的关系分析,我们从期望和观察值的关系角度分析,就是用一个事件总的结果比例来期望分类数据的比例,然后利用χ2检验,观察值减去期望值的平方和和期望值的比例,然后用χ2检验进行决策。
对于两个分类变量的关系分析,我们从独立性检验来分析两个变量是否存在依赖关系,独立性检验就是行行和列和总数的比例的乘积乘以总数得到每个方格的期望。然后求出χ2和进行一个分析。当我们分析出来这个有相关性,就进行一个相关性的度量,具体度量方法φ,c,v。
对于χ2检验,我们要注意,对有两个单位的分组,每个分组的期望值不能低于5,大于2个的有20%的频数低于5是不能进行χ2检验的
当我们分析分类变量对数值变量的影响除了上述两个方法分析相关性还可以使用方差检验,方差分析主要是让不同分类方差相同,服从正态分布,观察值独立,分类样本均值是否相同来判段关系的。由于抽样的时候存在组内误差,组间误差,总误差,所以我们使用方差来分析这些误差,组间误差和组内误差的比较,大于F检验值,说明组间对数值影响大,拒绝原假设。既然有了相关性,就需要一个度量来平均,评价方式,组间差和比上总的差值
当我们分析两个分类变量无交互的情况时候,就需要计算行误差,类误差,随机误差,就算出来之后我们就要使用行误差和列误差分别和随机误差比较,行或列误差F检验量大于检验值,我们就认为它们有关系。衡量这个关系的系数是行差和加列差和比上总差和
当我们分析两个分类变量无交互的情况时候,要求总差和,rM(m是不同分类的个数)的列差和,km的行差和,m的交互平方和,总差和减去前面三个的随机差和,构成分析表,分析表第一个是误差来源,第二列计算误差平方和,第三列是自由度(交互作用的自由度(k-1)(r-1),误差自由度(kr(m-1))),第四列均方,第五列F然后再是p,(p大于a接收原假设)
总结完毕,总的来说对我分类变量对数值变量的影响主要分为两类,第一类是单个分类变量,拟合优度检验χ2检验方法,单因素方差分析F检验,第二类是对于两个分类变量不同分类类型的分析,主要方法是独立性检验χ2检验,双因素方差分析F检验。列联表是一个重要的工具可以重视一下。
标签:结果 个数 关于 要求 相关性 说明 事件 统计 假设
原文地址:https://www.cnblogs.com/dugudongfangshuo/p/9193516.html