标签:大于 依赖 另一个 png mic 存在 连续 inf nbsp
一、连续变量与连续变量的相关分析------ > 用相关分析
相关分析是指连续变量之间的一种非严格的相依赖的变化关系,具体表现为:当一个变量发生时,另一个变量随之发生相应线性变动的关系,我们一般可以用相关系数 r 大小来衡量两个连续变量的相关性强弱(注意:不是衡量因果关系),例如衡量客户入网时长和每月话费的相关分析。
r 的公式如下:(一般是由计算机为我们算出)
但因为相关系数r是通过样本量数据计算的,而实际的总体相关系数我们是未知的,因此相关系数r是否具备足够的说服能力,我们需要进行检验,对应的检验统计量是T检验,即用T来衡量两个连续变量是否有关系。
T 统计量的原假设H0:两个变量没有相关性
如果T 统计量发生的概率P值小于5%,,则拒绝原假设,如果P大于5%,则我们没有理由拒绝原假设,但我们也不能完全说原假设成立;比如我们分析时发现,算出两个变量的相关系数 r 非常高,但T统计量的P值大于5%(即不拒绝原假设,认为两个变量没有关系),此时并不是矛盾,这种情况的发生大多是因为样本量不够造成的,这只能说,两个变量可能存在相关性,但算出来的这个相关系数 r 的可靠性不高,我们可以通过增加样本量再算一次,来进一步分析结果。
t 统计量公式是:(我们一般是看 t 统计量发生的概率P来判断是否拒绝原假设)
引申知识:
标签:大于 依赖 另一个 png mic 存在 连续 inf nbsp
原文地址:https://www.cnblogs.com/wodexk/p/10702926.html