文档视界 最新最全的文档下载
当前位置:文档视界 › 概率论与数理统计第五章_大数定律和中心极限定理精品教案

概率论与数理统计第五章_大数定律和中心极限定理精品教案

概率论与数理统计第五章_大数定律和中心极限定理精品教案
概率论与数理统计第五章_大数定律和中心极限定理精品教案

第五章 大数定律和中心极限定理

本章介绍概率论中最基本也是最重要的两类定理:大数定律和中心极限定理,它们都是使用极限方法研究大量随机现象统计规律性的。概括讲来,阐明大量重复试验的平均结果具有稳定性的定律称为大数定律;论证随机变量(试验结果)之和渐进服从某一分布的定理称为中心极限定理.

5.1 大数定律

在第一章我们曾指出,当试验次数很大时,随机事件发生的频率将与其概率非常接近。本节将从理论上讨论这个问题。为此,先介绍一个重要的不等式—切比雪夫(Chebyshev)不等式:

若随机变量X 的数学期望E (X )和方差D (X )都存在,则对于任意0ε>,都有

{}2()

()D X P X E X εε-≤≥, (5.1)

证明 仅证X 是连续型随机变量的情况.设()f x 是X 的概率密度,则

{}22|()||()|222[()]|()|()d ()d 1()[()]()d x E X x E X x E X P X E X f x x f x x D X x E X f x x εεεεεε--+∞-∞--=-=?

??.≥≥≥≤≤ 若取3()D X ε=,由切比雪夫不等式可知

{}

()()3()0.119()D X P X E X D X D X -≈≥≤. 也就是说,X 落在区间(()3()()3()E X D X E X D X --以外的可能性很小,而落在此区间中的概率很大。当D (X )较小时,X 的取值便集中在E (X )附近。D (X )越小,X 的取值越集中在E (X )附近,这正是方差的意义所在。

显然,切比雪夫不等式可以表示成如下的等价形式:

{}2()|()|1D X P X E X εε-<≥-. (5.2)

当D (X )已知时,(5.2)式给出了X 与E (X )的偏差小于ε的概率的估计值.

例1 设某供电网有10000盏电灯,夜晚每盏灯开灯的概率均为0.7,假定灯的开、关是相互独立的,使用切比雪夫不等式估计夜晚同时开灯的盏数在6800至7200之间的概率.

解 令X 表示在夜晚同时开灯的盏数,则X 服从n =10000,p =0.7的二

项分布,这时()7000E X np ==,()2100D X npq ==,由切比雪夫不等式可得

2

2100{68007200}{|7000|200}10.95200P X P X <<=-<-≈.≥ 可见,虽然有10000盏灯,但是只要供应7200盏灯的电力就能够以相当大的概率保证够用.

事实上,这个概率的近似值表明,在10000盏灯中,开着的灯数在6800到7200的概率大于0.95,而由二项概率公式算出此概率的精确值为0.99999.由此可知,切比雪夫不等式虽可用来估计概率,但精度不够高.

1866年,俄国数学家切比雪夫证明了一个相当普遍的结论??大量观察结果的平均值具有稳定性,这就是切比雪夫大数定律.

定理1 切比雪夫大数定律 设随机变量12,,,,n X X X L L 相互独立,每一随机变量都有数学期望12(),(),,(),n E X E X E X L L 和有限的方差1()D X ,2()D X ,L ,()n D X ,L ,并且它们有公共上界c ,即(),1,2,k D X c k ≤=L ,则对任意ε >0,皆有

1111lim ()1n n

k k n k k P X E X n n ε→∞==??-<=????

∑∑. (5.3)

证 因12,,,,n X X X L L 相互独立,所以

2211

111()n n

k k k k c D X D X nc n n n n ==??== ???∑∑≤. 又因 11

11()()n n k k k k E X E X n n ===∑∑,由切比雪夫不等式可得 2211111111()11n n n k k k k k k c P X E X D X n n n n εεε===????≥-<--?? ?????

∑∑∑≥≥, 所以

1111lim ()1n n

k k n k k P X E X n n ε→∞==??-<=????

∑∑. 切比雪夫大数定律表明,相互独立的随机变量的算术平均值1

1n n i i X X n ==∑与其数学期望的差,在n 充分大时以概率1是一个无穷小量.这意味着在n 充分大时,n X 的值将比较紧密地聚集在它的数学期望()n E X 附近.

由切比雪夫大数定律可以得到如下推论:

推论1 设随机变量12,,,,n X X X L L 独立同分布,并且有数学期望μ及方差2σ,则对任意正数ε,都有

11lim 1n i n k P X n με→∞=??-<=????

∑. (5.4) 推论1是我们利用重复观测值的算术平均来近似真实值的理论依据.例如,要测量某一物理量a ,进行n 次重复测量,得到n 个测量值12,,,n X X X L ,显然可以视它们为n 个独立同分布的随机变量,并且有数学期望a .由大数定律可知,当n 充分大时,n 次测量的平均值可作为a 的近似值,即

121(....)n a X X X n ≈

+++ (5.5) 且当n 充分大时,近似计算的误差很小.

定理2 贝努里大数定律 设n μ是n 重贝努里试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则对任意0ε>,都有

lim 1n n P p n με→∞??-<=????

. (5.6) 证 设i X 是第i 次试验中事件A 发生的次数,则i X 服从参数为p 的0-1分布,(),()i i E X p D X pq ==,其中1,1,2,3,,q p i n =-=L .又12,,,n X X X L 相互独立,且1n

n i i X μ==∑,从而有

11

11(),n n n i i i i E E X E X p n n n μ==????=== ? ?????∑∑ 211

11()n n n i i i i pq D D X D X n n n n μ==????=== ? ?????∑∑. 由切比雪夫不等式得

221n n pq P p D n n n μμεε

ε????-=?? ?????≥≤, 因此

lim 0n n P p n με→∞??-=????

≥, 亦即

lim 1n n P p n με→∞??-<=????

. 历史上,贝努里大数定律是概率论中极限定理方面的第一个重要结论。它从理论上证明了随机事件的频率具有稳定性(频率在概率附近摆动).不难看出,贝努里大数定律是切比雪夫大数定律的一个特例,很容易由切比雪夫大数定律证明之.

由贝努里大数定律,若事件A 是小概率事件,则其在大量重复试验中的频率也很小,即事件A 很少发生.因此,贝努里大数定律给了“小概率事件在一次试验中不可能发生”理论支持。至于“概率小到什么程度”才可认为在一次试验中不可能发生,要视具体情况而定.例如,对于粉笔来讲,次品率大到0.05也无关紧要;但对于导弹的制导系统来讲,即使0.01的次品率也是绝对不允许的,因为它可能引发重大事故.

定义1 依概率收敛 设12,,,,n Y Y Y L L 是一个相互独立的随机变量序列,a 是一个常数,若对于任意正数ε,都有lim {|-|}1n n P Y a ε→∞

<=,则称序列12,,,,n Y Y Y L L 依概率收敛于a .

由贝努里大数定律,事件A 的频率n

n μ依概率收敛到其概率p .因此,我

们可以通过做试验确定某事件发生的频率,并把它作为其概率的估计,这种方法称为参数估计,它是数理统计中主要的研究课题之一,将在第七章详细论述.

5.2 中心极限定理

大数定律揭示了当n 无限增大时,频率/n n μ无限逼近概率p 的规律.但在许多时候,我们都需要了解/n n μ的概率分布,即需要对其做进一步的研

究.在概率论中,把研究大量独立随机变量和的分布趋向于正态分布的一类定理统称为中心极限定理.下面给出两个常用的中心极限定理.

定理3 独立同分布的中心极限定理 设随机变量12,,,,n X X X L L 相互独立, 服从同一分布,具有有限的数学期望和方差:()i E X μ=,2()0i D X σ=≠(1,2,)i =L ,则随机变量

11()n n k k k k n X X n Y n n μμσσ

==--==∑∑ 的分布函数()n F x 对任意的(,),x ∈-∞+∞ 都有

212

lim ()lim d ()2n t k x k n n n X n F x P x e t x n μσπ-=-∞→∞←∞??-???=≤==Φ????????

∑. (5.7) 其中()x Φ为标准正态分布的分布函数. 这个定理告诉我们,当n 很大时,n Y 近似地服从标准正态分布(0,1)N .随机变量1n

k n k X n Y n μ==+∑近似地服从正态分布2(,)N n n μσ.由于期望

1()n k k E X n μ==∑,方差)21()n k k D X n σ==

∑,故n Y 实际上就是1

n k k X =∑的标准化的随机变量.在实际工作中,只要n 足够大,便可把独立同分布的n 个随机变

量之和近似当作正态随机变量.

例1 对敌人的防御地段进行100次射击,每次射击命中目标的炮弹数是一个随机变量,其数学期望为2,均方差为1.5,求在100次射击中有180颗到220颗炮弹命中目标的概率.

解 设i X 为第i 次射中时命中目标的炮弹数(1,2,,100)i =L ,则100

1i

i X X ==∑为100次射击中命中目标的炮弹总数,而12100,,,X X X L 同分布且相互独立,

()2i E X =() 1.5i D X =. 由定理3可知 10020015X Y -=近似服从正态分布, 所以

{}180200P X ≤≤=100110021802002202001510 1.515i i X P =??-???--??≤≤?????????

∑ 1004433P Y ??=-≤≤????444210.8165333??????≈Φ-Φ-=Φ-= ? ? ???????

. 例2 某种电器元件的寿命服从均值为100(单位:小时)的指数分布,现随机抽出16只,设它们的寿命是相互独立的,求这16只元件的寿命总和大于1920小时的概率.

解 设第i 只电器元件的寿命为()1,2,,16i X i =L ,由题设

()100i E X =, 2()10010000i D X ==

则161

i i Y X ==∑是这16只元件的寿命的总和.所以所求概率为

{}16119201920i i P Y P X =??≥=≥????∑16116001920160040016100i i X P =??-??-?=≥???????

∑ 1920160011(0.8)0.2119400-??≈-Φ=-Φ= ???

. 定理4 德莫佛—拉普拉斯(De Moivre-Laplace)定理 设随机变量n η服从参数为,(01)n p p <<的二项分布,则对于任意实数x ,恒有

2

2lim e d ()(1)2t

x n n P x t x np p -→∞???≤==Φ?-π???. (5.8) 证 由于服从二项分布的随机变量n η可视为n 个相互独立的、服从同一参数p 的(0-1)分布的随机变量12,,,n X X X L 之和,即1n

n k k X η==∑,其中

(),(),1,2,,,1k k E X p D X pq k n q p ====-L .由独立同分布中心极限定理可

212lim lim e d ()(1)(1)2n t i x n i n n X np P x P x t x np p np p -=→∞→∞??-??????===Φ????--π??????????

∑?. 此定理表明,正态分布是二项分布的极限分布.若(,)n B n p η:,则当n 充分大时n η近似服从正态分布(,)N np npq ,于是有

{}()222k np npq n P k npq ηπ--=≈, (5.9)

{}n n P a b P npq npq npq η??<=<≤ npq npq ????≈Φ-Φ. (5.10) 由于当n 较大,p 又较小时,二项式分布的计算十分麻烦,因此,用上面的近似公式计算将是非常简洁的.

例3 某出租车公司有500辆的士参加保险,在一年里的出事故的概率为

0.006,参加保险的的士每年交800元的保险费.若出事故,保险公司最多赔偿50000元,试利用中心极限定理,计算保险公司一年赚钱不小于200000元的概率.

解 设X 表示500 辆的士中出事故的车辆数,则X 服从500,0.006n p ==的二项分布,这时5000.0063,30.994 2.982np npq =?==?=.保险公司一年赚钱不小于200000元的事件为 {}50080050080050000200000X ??-≥≥,即事件{}04X ≤≤ ,从而有

{}()()04 2.982

2.982 2.9820.579 1.7372.982 2.9820.71900.959110.6781

P X P =??≈Φ-Φ=Φ-Φ-=+-=≤≤ 可见,保险公司在一年里赚钱不小于200000元的概率为0.6781.

例4 设某单位内部有1000台电话分机,每台分机有5%的时间使用外线通话,假定各个分机是否使用外线是相互独立的,该单位总机至少需要安装多少条外线,才能以95%以上的概率保证每台分机需要使用外线时不被占用?

相关文档