的差距进一步缩小了,我们做出这样的猜想:样本个数越大超几何分布和二项分布的对应概率相差就越小,当样本个数为无穷大时,超几何分布和二项分布的对应概率就相等,换而言之超几何分布的极限就是二项分布!也就
是说
。下面我们对以上猜想作出证明:
产品个数N无限大,设废品率为p,则
,
f以上的证明与我们的直观思想相吻合:在废品为确定数M的足够多的产品中,任意抽取
个(由于产品个数N无限多,无返回与有返回无区别,故可看作
次独立试验)中含有k个废品的概率当然服从二项分布。在这里,超几何分布转化为二项分布的条件是(1)产品个数应无限多,否则无返回地抽取
件产品是不能看作
次独立试验的2)在产品个数N无限增加的过程中,废品数应按相应的“比例”增大,否则上述事实也是不成立的。
对于超几何分布的数学期望
,二项分布的数学期望
,当我们
将“不返回”改为“返回”时,
,两种分布的数学期望相等,方差之间没有相等关系。
超几何分布和二项分布的数学期望和方差是否也具有我们以上猜想并证明的极限关系呢?
事实上超几何分布的数学期望
,方差
当
这两个极限值
分别是二项分布的数学期望与方差。需要指明的是这一性质并非只为超几何分布与二项分布之间所具有,一般地,如果随机变量依分布收敛于随机变量,则随机变量的数学期望和方差分别是随机变量的数学期望和方差的极限。这样超几何分布与二项分布达到了统一。
一般说来,有返回抽样与无返回抽样计算的概率是不同的,特别在抽取对象数目不大时更是如此。但当被抽取的对象数目较大时,有返回抽样与无返回抽样所计算的概率相差不大,人们在实际工作中常利用这一点,把抽取对象数量较大时的无返回抽样(例如破坏性试验发射炮弹;产品的寿命试验等),当作有返回来处理。
那么,除了在有无“返回”上做文章,有没有什么办法快速实现超几何分布向二项分布的转化呢?
设想N件产品装在一个大袋中,其中M件为废品,无返回地从中抽取
件,那么其中废品件数X服从超几何分布。现若在大袋中再放进两个小袋,一袋装正品,一袋装废品,然后从大袋中任摸一个小袋,无返回地从中任取一件产品,则这样任取
件,其中废品件数X就不再服从超几何分布,而应服从的二项分布了。事实上,我们把摸到正品袋中的产品看作“成功”,摸到废品袋中的产品看作“失败”,则“成功”与“失败”的概率相等,皆为且每次试验是相互独立的,正是典型的伯努力试验概型,因此可用二项分布r