标签:
离散变量是指该变量只能取离散的孤立值,通常按计量单位数计数,如个数、台数等。离散变量的分布很多都与伯努利实验有关,我们先来说一下伯努利实验:
在相同条件下重复地、各次之间相互独立地进行的一种试验,成为伯努利实验。
判断是否为伯努利试验的关键是每次试验事件A的概率不变,并且每次试验的结果同其他各次试验的结果无关,重复是指试验为一系列的试验,并非一次试验,而是多次,但要注意重复事件发生的概率相互之间没有影响。
1.二项分布(binomial distribution)
二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验。
n重伯努利实验需要满足以下条件:
1.一次实验只能有两种可能的结果,即成功或失败
2.成功的概率在每次实验都是相同的
3.多个实验之间是相互独立的
4.实验可以重复进行N次
5.在N次实验中,成功的次数是一个随机离散变量。
设进行n次独立测试,每次测试成功的概率为p(相应的,失败的概率为1-p)。这n次测试中的“成功次数”是一个随机变量。这个随机变量符合二项分布。
二项分布可以表示为:
n次测试,如果随机变量为k,意味着其中的k次成功,n-k次失败。从n次实验中挑选k个,根据计数原理,共有种可能。其中的每种可能出现的概率为
“二项分布”的命名原因是,上面的P(X=k)等于二项式二项式展开的第k项
二项分布的数学期望E(X)=np,方差D(X)=np(1-p)
下图是一个n=20,p=0.125的二项分布示意图:
2.伯努利分布(Bernoulli distribution)
有两种可能的结果。1表示成功,出现的概率为p(其中0<p<1)。0表示失败,出现的概率为q=1-p。因此, 伯努利分布可以表示为
伯努利分布又称为0-1分布或两点分布,它是n=1时的二项分布,均值E(X)=p,方差D(X)=p(1-p)
3.泊松分布(Poisson distribution)
泊松分布适合于描述单位时间内随机事件发生的次数,它是二项分布的极限情况,当p→0,n→+∞,而np=λ时,二项分布趋近于泊松分布,由于泊松分布是二项分布的特例,因此二项分布的条件也就适用于泊松分布。泊松分布具有可加性
泊松分布的概率函数为:
参数λ是单位时间(或单位面积)内随机事件的平均发生率
泊松分布的数学期望E(X)=λ,方差D(X)=λ
泊松分布有两个特征:
1.所考察的事件在任意两个长度相等的区间里发生一次的机会均等。
2.所考察的时间在任何一个区间里发生与否和在其他区间里发生与否没有相互影响,即互相独立。
这里的区间是广义的,它既可以表示时间,也可以表示空间
泊松分布用于模拟低概率事件,比如地震。地震是很低概率的事件,我们想知道一段时间,比如十年内某地发生地震的总数,可以将十年划分为n个小时间段,每个时间段内地震发生的概率为p。我们假设小时间段很短,以致于不可能有两次地震发生在同一小时间段内,那么地震的总数是一个随机变量,趋近于泊松分布。
【注意:只有当p的值很小,一般小于0.1时,用泊松分布取代二项分布所产生的误差才会比较小】
p=0.075时,泊松分布明显接近二项分布
4.几何分布(geometric distribution)
在n次伯努利试验中,试验k次才得到第一次成功的机率。也就是前k-1次皆失败,第k次成功的概率。
假设我们连续进行独立测试,直到测试成功。每次测试成功的概率为p。那么,到我们成功时,所进行的测试总数是一个随机变量,可以取值1到正无穷。这样一个随机变量符合几何分布
随机变量取值为k时,意味前面的k-1次都失败了。因此,我们可以将几何分布表示成:
几何分布的期望,方差
5.负二项分布(negative geometric distribution)
在n次伯努利试验中,试验k次,其中出现r次成功的机率。负二项分布和几何分布的区别是:几何分布是进行独立测试,直到出现成功,测试的总数。负二项分布同样是进行独立测试,但直到出现r次成功,测试的总数k。r=1时,负二项分布实际上就是几何分布。
负二项分布的表达式是:
6.超几何分布(hypergeometric distribution)
设总体有N个,其中含有M个不合格品。若从中随机不放回抽取n个产品,则不合格品的个数k是一个离散随机变量,假如n≤M,则X可能取0,1,2…,n;若n>M,则可能取0,1,2…,M,由古典方法可以求得X=k的概率是:
标签:
原文地址:http://www.cnblogs.com/xmdata-analysis/p/4694655.html