码迷,mamicode.com
首页 > 其他好文 > 详细

统计基础知识

时间:2018-11-14 15:32:49      阅读:253      评论:0      收藏:0      [点我收藏+]

标签:除了   模型   影响   大于   col   info   图片   大数   相关系数   

凭借记忆和百度复习一下以前学的,不断更

1:统计学三大分布,呵呵,没有正态,F,T,卡方分布

F分布(F检验)用来检验方差齐性,可用直方图和p-p图来检验(spss/R),如果方差随自变量x变大而变大,说明方差不齐,各个样本的数据可能不是来自一个整体,

比如汽车拥有量,大城市的样本多,小城市样本少,人口对于模型的影响较大,因此要做一个修正。。或者改用非参数检验

关于正态性检验,先可以画个直方图,样本量大于50看SW检验,样本量小于50看KS检验

 T分布:自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线

卡方分布:若干个随机变量的平方和服从卡方分布,用来检验随机变量是否服从其给定的概率的,服从某种分布的。貌似在列联表里有用到。

T检测:应用于小样本的情况。中心极限定理告诉我们随着样本的容量变大,样本的均值将成正态分布,而当样本较小的时候分布则更接近t分布。

 

协方差:表示X, Y 相互关系的数字特征,cov(X, Y) = E(X-EX)(Y-EY),当 cov(X, Y)>0时,表明 X与Y 正相关;当 cov(X, Y)<0时,表明X与Y负相关;当 cov(X, Y)=0时,表明X与Y不相关。

相关系数:X、Y的协方差除以X的标准差和Y的标准差(相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差)

变异系数:将离散程度标准化,等于均值除以方差

大数定律:当N很大,样本均值约等于期望

中心极限定律:不管什么分布,独立随机变量的均值分布趋近于正态分布

正态分布的再生性:随机变量X1,X2,相互独立,服从正态分布,则,Y=X1+X2 服从正态分布

技术分享图片

泊松分布:一段时间内或者一定空间内事件的发生次数的对应概率。

 

统计基础知识

标签:除了   模型   影响   大于   col   info   图片   大数   相关系数   

原文地址:https://www.cnblogs.com/marszhw/p/9958023.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!