标签:nbsp 标准 置信区间 相关系数 方差 水平 最优 问题 数据
接着上一节的内容,上主要介绍了关于分类变量和数值变量关系的分析方法,接下来讲述的内容就是关于数值型数据和数值型数据的相关关系的分析方式。对于 这种问题,我们根据数值数目分为,两个数值数据的分析,用一元相关性和一元回归分析,线性回归分析和非线性回归分析,和起来一元线性回归分析或者一元非线性回归分析。对于两个以上的变量,我们使用多元线性相关和回归分析,多元线性回归分析等。这里我们主要讲述的是一元线性回归和相关性分析,多元线性回归和相关性分析。
一元线性相关性和回归分析:讲述的内容分为两块相关性分析和回归分析,相关性分析就是来分析两个变量之间是否存在相关关系,关系强度如何,能否反映总体的关系特征,相关性不是函数关系,一个值可能有多个值与之对应,描述这个相关性的数值叫做相关系数,相关系数用t检验来查看他的显著水平。对于回归分析是为了用函数来准确的描述这个关系,用回归模型进行假设误差值服从正态分布,期望为零,前面的部分期望是y的估计值,x在这里不是随机地。通过,模型获得一个回归方程,然后使用这个回归方程,用最小二乘法使实际值与估计值平方差最小求出方程的系数常数,然后这个就是一个个估计回归方程。有了这个方程还不算完,我们要对我们这个方程进行一个检验,看看它准确度如何啊。所以就进行了拟合度检验——判定系数,R^2=r*r,估计标准残差,和显著性检验——线性关系检验和回归系数检验。拟合优度检验就是对观察值和估计值的一个检验,显著性水平就检验我们的回归方程系数,还有整体的一个显著性。最后我们要进行一个残差分析,来判断我们的残差是否满足服从正态分布,方差一致的假设 ,其中可以用标准方差来直观显示是否满足误差值服从正态分布,标准误差有95%落在-2~2的区间即可。对这些就行了加好的计算之后,我们就可以拿着这个一元线性回归方程进行预测了,主要预测方法有点估计,均值点估计,区间估计,置信区间估计和预测区间估计,预测区间估计或宽一点吧。
分析了一元的线性回归分析,我增大一下数值变量的数目,这时就需要进行多元线性回归分析了,在这里不进行相关性分析,因为多个变量涉及多维空间,不好直观描述,上来就使用多元回归模型进行描述,和一元的回归描述一样,从模型到方程到估计回归方程。我们对我们的到的方程也要进行一次检验看看可靠性如何,首先进行拟合优度检验,计算一个多重判定系数,然后计算一个估计标准误差。然后我们对这个方程进行一个显著性检查,检查线性关系F检验,检查相关性系数t检验。检验完成之后拿来用与预测就好。这个对于多个变量来估计一个数值会存在多重共线的问题,就是进行总体的F检验关系显著性高,但是对单个T检验就不行了。对于这种问题我们可是要筛选变量,不用使用全部的变量找一部分影响强的进行拟合即可,具体方法——向前选择,向后剔除,逐步回归,最优子集。
到这里我们已经学会了对数值数据和数值数据,分类数据和数值数据的分析处理方法了,开心一下下!!!(我去复习别的啦)
标签:nbsp 标准 置信区间 相关系数 方差 水平 最优 问题 数据
原文地址:https://www.cnblogs.com/dugudongfangshuo/p/9195387.html