文档视界 最新最全的文档下载
当前位置:文档视界 › 概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理
概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理

唐南南

摘要 概率论是从数量上研究随机现象的规律的学科,概率论的特点是先提出数学模型,然后去研究它的性质,特点和规律。它在自然科学,技术科学和社会科学等科学中有广泛的应用。而大数定律和中心极限定理的内容是概率论中极限理论极为重要的一部分内容。在这篇文章中,我们从贝努力试验中的频率出发,讨论了独立随机变量和分布的极限问题。在一定条件下,这些分布弱收敛于退化分布,这就是大数定律。在另一些条件下,这些分布弱收敛于N(0,1)分布,这一类收敛于N(0,1)分布的定理统称为中心极限定理.大数定律说明了随机现象都具有稳定性而中心极限定理是研究相互独立随机变量序列{}i x 的部分和∑==

n

i i

n x

S 1

的分布,在适当条件下向正态分布收放的问题。在这篇文章

里,我们只介绍了一些定理的提出,内容以证明以及在其他学科上的应用,而大数定律和中心极限定理还有许多更深入,更广泛的内容,限于篇幅这里就不再介绍了。掌握定理的结论是重要的,这些结论一方面使频率稳定于概率,n 次观察的算术平均值稳定于数学期望都有了明确的含义和理论依据;另一方面,又将给数理统计中大样本的统计推断等提供理论依据。 关键词 大数定律 中心极限定理 随机现象 随机变量

引言

大数定律和中心极限定理是概率论中重要的一部分内容,但对读者来说,多数人对于这部分内容感到很难掌握,这篇文章就是对这部分内容进行浅入的分析,但对其内容进行详细的说明,而且进行了归纳性的总结,指出了各定律之间的联系及其差别,希望通过本篇文章内容的介绍,能使读者对于这部分知识有一个清晰的印象,能整体地把握这部分内容。

一 、大数定律

(一)、问题的提法(大数定律的提法)

重复实验中事件的频率的稳定性,是大量随机现象的统计规律性的典型表现。人们在实践中认识到频率具有稳定性,进而由频率的稳定性预见概率的存在;由频率的性质推断概率的性质,并在实际应用中(当n

充分大时)用频率的值来估计概率的值。这些都是概率的公理化定义的实际背景。概率的概念以及在此基础上建立的理论应该与实际相符合。因此,我们需要对频率的稳定性这一实际作理论的说明。

其实,在大量的随机现象中,不但事件的频率具有稳定性,而且大量随机现象的平均结果一般也具有这稳定性:单个现象的行为对大量随机现象共同产生的总平均效果几乎不发生影响,这就是说,尽管单个随机现象的具体实现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消,补偿和拉平,致使总的平均结果趋于稳定。例如,在分析天平上称量一质量为u 的物品,以21,ξξ……,n ξ表示n 次重复测量的结果。经验告诉我们,当n 充分大时,它们的算术平均值()

∑==n

i i n n 1

1ξξ对u 的偏差却很小,而且一般n 越大,这种偏差越小。如果把一连串的观察结果21,ξξ……,n ξ看成随机变量,则上述直观现实表

明,当n 充分大时,在一顶的收敛意义下,有u n n

i i →∑=1

1ξ,它就是大量随

机现象的平均结果稳定性的数学表达式。

频率的稳定性也可以表达成u n n

i i →∑=1

1ξ这种形式。为此令

??

?=次试验中不出现

若在第次试验中出现

若在第i i i ,0,1ξ i=1,2……,n 。

那么,()∑==n

i i n A u 1

ξ是n 次试验中A 出现的频数。频率的稳定性指的是随着

n 无限增大,频率()A P n 趋于稳定概率()A P 附近,即在一定的收敛意义下

())(1)(1

A P n n A u A P n i i n n →==∑=ξ。概率论中,一切关于大量随机现象的平均结

果稳定性的定理,统称为大数定律,按收敛性的含义不同,大数定律有

弱大数定律和强大数定律之分。

(二)、大数定律的内容及证明

1、 在证大数定理时,我们经常用到著名的切比雪夫不定式,首先我们来讲这个不定式]2[。

设随机变量X 有期望()x E 和方差()x D ,则对于任意 ε>0,有

(){}()

2

εεx D x E x P ≤

≥-或(){}()

2

1εεx D x E x P -

≥<-

证明:(1):

x 是离散型随机变量的情形。

(){}(){}()[]()()[]()

2

2

2

2

2εεεεε

ε

x D x E X P

X E X x x P x E x P k x E x k

k k

x E x k k =-≤-≤

==

≥-∑

∑∑≥

-≥

- ({}K K P X x P ==)

(2)x 是连续随机变量的情形。

设x 的密度函数是()x P ,则有(){}()εε≥-?=≥-x E x x E x P ()dx x P 积分区域如图:

P(x)

E(x)-ε E(x) E(x)+ε 由于()(),,)(,εεε-≤-≥-≥-x E x x E x x E x 所以 即()().,εε-≤+≥x E x x E x 于是有

(){}()()()()[]()()[]()()2

2

22

21

ε

ε

εεεεx D dx x P x E x dx

x P x E x dx x P x E x P x E x x E x =-≤-?≤?=≥-?∞

+∞-≥-≥-

切比雪夫不定式给出了在随机变量x 的分布未知的情况下,对事件

X

(){}

ε<-x E x

(或事件(){}ε≥-x E x 的概率的一种估计方法。例如在式子

(){}()

2

1εεx D x E x P -

≥<-中令σσε43、

=,并令()u x E =,则有{}8889.03≥<-σu x P (8889.098

9122≈=-σσ)

{}9375.04≥<-σu x P

式子(){}()

2

εεx D x E x P ≤

≥-给出了离差不小于ε的概率的上界,而式子

(){}()

2

εx D x E x P -

≥<-给出了离差不小于ε的概率的下界,而且二个式子

对任何具有方差的随机变量都成立。从第二个式子中又可以看到,()x D 越小,概率(){}ε<-x E x P 就越大,说明x 取值集中于其期望周围的程度越高;

()x D 越大,概率(){}ε<-x E x P 就越小,说明x 取值集中于平均值附近的程

度越低,这就使我们方差定义的含义有了进一步的理解。

例1. 对小麦品种做发芽试验,种子发芽的概率未知,问要用多少颗小麦做试验才能认为发芽的概率与P 相差不超过1/10的概率达到95%? 解:用S n 表示试验的n 颗种子中发芽的颗数,则发芽的频率是n

S n

,我们要确定n ,使得n 满足%95101≥?????

?<-P n

S P n 或%510≤??????

≥-n nP S P n 。

因为S n 服从二项分布,所以,E(Sn)=nP, D(S n )=nP(1-P). 又因为P(1-P)=-P 2+P=-(P-2

1)2+4

1故p(1-p)≤4

1

n n p np n nP S P n 2510)1(102

≤??

?

??-≤??????

≥-

说明所选的n 要满足

≤n

25

5%,即n ≥500 2、现在再讲述一种常见的大数定律的数学定义 假设1ξ,2ξ…,n ξ,…是随机变量的序列,令n ξ=

n

n

ξξξ+++ 21, 如果

存在这样的一种常数序列α1,α2,…,αn…,对任意的ε>ο,恒有

→n lim {

}

,1=<-εξn

n a p 则称序列{}n ξ(接算术平均值)服从大数定律。

必须指出,更加一般地描述大数定律的形式是:对于随机变量序列

{}n ξ,

令=n ζf n (ξ1,ξ2,…ξn ),这里ζn 是{}i ξ( ,2,1=i )的对称的函数。如果存在常数列序列α1,α2,…,αn …,对任意的ε>ο,成立∞

→n lim {},1=<-εζn n a p ,则称这种随机变量的序列按函数f n 服从大数定律。 3、下面具体介绍几个大数定律的内容及证明。 (1)切比雪夫大数定律。

①、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,若存在常数

a ,使得对任意0>ε,都有∞

→n lim

{},1=<-εa X p n 则称随机变量序列{}n X 依概率收敛于a ,记作a X p

n ?→?。

②、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,数学期望

()(),......

2,1=i x E 存在,使得对于任意0>ε,都有

∞→n l i m (),11111=?

?????<-∑∑==εn i i n i i X E n X n p ,则称随机变量序列{}n X 服从大数定律。 {}n X 服从大数定律,实质是说0111

1?→?-∑∑==P

n i i n i i X n X n 。

③、定理 若独立随机变量序列X 1,X 2,…,X n ,…,各有数学期

望()i i u X E =,方差()()无关的常数

是与i c i c X D i ......,2,1==<,则对于任意0>ε,有∞→n lim 11111=?

?????<-∑∑==εn

i i n i i u n X n p 。

④、证明:令∑==n

i i n X n X 1

1,由于X i 相互独立,所以()

∑==n i i n u n X E 11

()

∑==?≤

=n

i i n

n c

nc n

n

X D 1

2

22

11

σ由式子(){}()21εεx D x E X P -≥<-可以得到 (){}

()2

2

11ε

ε

εn c X D X E X P n

n n -

≥-

≥<-

当n ∞→时,取极限使得∞

→n lim

(){}

,1≥<-εn n X E X p 但由于概率不可能大于1,所以∞

→n lim (){}

,1=<-εn n X E X p ⑤结论:这个定理表明,在定理成立的条件下,当n 充分大时,n 个独立随机变量X 1,X 2,,…,X n ,的算术平均数这一随机变量n X 的分布,对

于它的数学期望()∑=n

i i X E n 1

1的附近,而当n 充分大时,与其期望之差依概

率收敛到0。此处所谓大数的“大”是指定理中极限等式右端的“1”。

⑥推论:若X 1,X 2,,…,X n ,,…是独立在同分布的随机变量序列,且E (X i )=u ,

D (X i )=2σ(i=1,2,……),则对于任意的0>ε,都有

→n lim 111=?

??

???<-∑=εu X n p n i i 这一推论使我们关于算术平均值的法则有了理论依据,经过算术平均

后得到的随机变量∑==n i i n X n X 1

1

,其分布随着n 的增大越来越紧密地聚集

在它的期望附近。切比雪夫定理为我们提供了关于用抽样算术平均数估计总体平均数(期望)的理论依据。假如在相同的条件下进行n 次重复抽样,得到n 个不同的值X 1,X 2,,…,X n ,我们可把这些结果看成独立同分布的随机变量X 1,X 2,,…,X n 的试验数值,且E (X i )=u ,

D (X i )=2

σ。由这个推论可知,当n 充分大时,取∑==n

i i n X n X 1

1作为u 的

估计值,其误差一般是很小的,这就是说,对于同一随机变量X 进行n

次独立观察,则所有观察值的平均数依概率收敛于X 的期望值,即

u X p

n ?→?,因此在实际中我们用抽样算术平均数∑=n

i i X n 1

1来估计总体期望

u 。

下面举出一些切比雪夫大数定律的一些重要的特例。 (2)贝努里大数定律。 X 0 1

P x1 1-P P

①定理 X 1,X 2,,…,X n 为随机变量序列,X k 有分布列

i=1,2,…

若X 是n 次试验中时间A 发生的次数,则有P n

x P

?→?

,即对于任意给定的0>ε有,

→n lim 1=?

??

???<-εp n x p ②证明:X i 为第i 次试验中事件A 发生的次数。由于

()()()()n i P P X D P X E i i ,......2,111,=≤-==

又因为X 1,X 2,,…,X n 相互独立,且X=∑=n

i i X 1

,再由切比雪夫定理的推论

可以得到P n x P ?→?

,即∞→n lim 111=?

?????<-∑=εp X n p n i i ,亦即∞→n lim 1=???

???<-εp n x p ③说明: 我们在叙述重复试验中事件A 出现的规律时可知事件A 的频率具有稳定性,贝努里大数定律对于之一事实作了理论上的说明。

设时间A 的概率为p ,X k 为第k 次独立重复试验中事件A 出现的

次数,则X k 有分布列 X i 0 1 i=1,2,……根据贝努里大数定律

P xi 1-P P

p X n n x P n i i ?→?=∑=1

1 就是说,独立重复试验中事件A 出现的频率稳定性是指依概率收敛于它的概率。

由贝努里定理知道,当试验次数很大时,事件出现的频率与概率有较大的偏差的可能性很小。由实际推断原理,当试验次数很大时,便可以用频率来代替概率。例如,某工厂的产品的次品品率为p ,产品中抽出n 件产品,出现次品数为u ,频率u/n 与次品率p 之间的偏差是p n

u -。当n 很大时,概率9999.002.0>?

??

???<-p n

u p 的实际意义是:进行N 次抽样每次

抽n 件产品,在n 次抽样中使02.0<-p n

u 成立的有M 次,当n 充分大时,有

()9999.0>≈p N

M

。 贝努里定理是在试验的条件不改变时来讨论频率的,而实际上进行多次试验的条件不可能是绝对不变的。例如电话打不通的概率(称为损失率)白天和晚上就不一样。虽然如此,仍然能发现频率的稳定性。我们有下述的普哇松定理。

(3)普哇松定理。

①定理:在一个独立试验序列中,事件A 在第k 次试验中出现的概率为P k , 且设u 是起初n 次试验中事件A 出现的次数,则

∞→n lim 1...21=?

?????<+++-εn p p p n u p n ②证明:作随机变量u k :第k 次试验时如果事件A 出现,它为1,反

之为0,则u=u 1+u 2+…+u n 。易知 M ·u k =P k ,()4

1

1≤-=k k k P P Du 再由切比雪夫定理可得到本定理。 (4)辛钦大数定律

①定理:设,...,...,,21n ξξξ均为相互独立相同分布的随机变量,且具有有限的数学期望(,...2,1,==n M a n ξ),则对任意的0>ε,有

→n l i m 111=?

?????<-∑=εξa n p n k k 。 ②证明:在证明之前先介绍在证明中要用到的定理及该定理的系。 定理 如果随机变量序列,...,...,,21n ξξξ 依概率收敛于随机变量ξ,则该序列{}n ξ,分布函数序列{})(X F n 弱收敛于ξ的分布函数)(X F 定理的系。

{}n ξ依概率收敛于常数C 的充要条件是n ξ的分布函数F n (x)()∞→n 弱收

敛于退化分布F(x)=??

?≥≤c

x c

x ,1,0 下面证明辛钦大数定理。

由于,...,...,,21n ξξξ具有相同分布,故有一特征函数,设为()t ?。因为数

字期望存在,故()t ?可以展成()()()()t ait t o t t ο??++=+'+=101。而∑=n

k k n 11ξ的

特征函数显然为n

n t ?

?

?

?????? ???,对于任意固定的t ,

n

n t ????????? ???=()∞→?→?????

???? ??++n e n n ait ait n

11ο。而e ait 为a ≡ξ的特征函数,其对应的分布函数弱收敛于G(x)=()()

???≤>a x a x ,0,1。依特征函数的逆极限定理,∑=n k k n 11ξ的

分布函数弱收敛于G(x),从而由前面的系,∑=n

k k n 1

1ξ依概率收敛于a ,即

11lim 1=?

??

???<-∑=∞

→εξa n p n k k n

③说明:贝努里大数定律成立时,要求D(x i )存在,若D(x i )不存在时,则可应用辛钦大数定律。

(三)加强大数定律的内容及证明

到现在为止还不能从贝努里定理作出:“当试验次数无限增加时,频率趋于概率”的推断。事实上,贝努里定理只能肯定对任意小的正数ηξ和,使得对充分大的n 成立着ηε->?

??

???<-1p n

u p ,因而n

u

并不是绝对趋向于p ,

这个结论只告诉我们,当n 充分大时,不等式ε>-p n

u

成立是小概率事件,这事件虽然在一次试验中可以认为不出现,但在多次重复下就会出现,特别是在现代电子计算机的运算中,它在极短的时间内可以进行大量的计算,在一次计算中可以认为计算结果与真数相差较大的情况不会出现,但在大量的重复计算中,可以出现与真数相差很大的情况。因此,为了避免因大量运算中造成结果相差很大的情况出现,以概率为1地保证在试验次数不断增加时使运算结果愈加精确就显得极为重要了。而加强大数定律,就是研究这类问题的。为了讨论加强大数定律,我们先引进一个重要的概念——随机变量序列的收敛性,即对于任意的0>ε,有

{}0lim =≥-∞

→εξξn n p 。

如果对于一个随机变量序列{}n ξ及随机变量ξ,有{}1=→ξξn p ,则称随机变量序列{}n ξ以概率1收敛于ξ。所谓一个随机变量序列{}n ξ是服从加强大数定律的是指该序列{}n ξ满足下列关系式:

101111=?

??

???→-∑∑==n k k n k k M n n p ξξ

1、波莱尔强大数定律

(1)定理:假设u n 是n 重伯努利试验中某事件A 出现的次数,已知每次试验中A 出现的概率为p(0

u n

n =∞

→lim

(2)证明:由于对于任意0>ε,满足{}∑∞

=∞<≥-1

n n p εξξ则随机变量序

列,...,21ξξ以概率

1

收敛于随机变量ξ,又由于

{}∑∑∞

=∞

=≥-=??????≥-11

n n n n n np u p p n u p εε,可见,只要证明上面的级数对于任意0>ε收敛。为此,我们估计概率{}ε≥-np u p n 。由马尔科夫不等式,知

{}()

4

4

4

1np u E n n np u p n n -≤

≥-ε

ε;又由曾经做过的题可知

()()[]()16

73123122

4

n pq pq n pq n npq np u E n ≤+≤-+=-,于是又由式子

{}()4

4

41np u E n n np u p n n -≤

≥-εε可得

{}()∞<≤-≤≥-=??????≥-∑∑∑∑∞

=∞

=∞

=∞=12

44

1

4

411

1

167

11

n n n n n n

n n

np u E n n np u p p n u p εεεε (3)说明:波莱尔强大数定律是伯努利大数定律的加强。它说明在重复试验中,当试验次数无限增大时,事件的频率以概率1收敛于它的概率。

2、柯尔莫戈洛夫强大数定律。

(1)定理:假设,...,21ξξ相互独立,而且有有穷方差(),...2,1=∞

∑∞

=∞<12

n n

n

D ξ,则随机变量,...,21ξξ服从强大数定律,即()101lim 1=?

??=-???∑=∞→n

i i i n E n p ξξ。

(2)、证明:令u i =E i ξ,对于任意m ≥1,记S m =

()

1

1

2max +=≤-∑m n

i i i n u ξ,由于

对任意n ,存在m ≥1。使2m

≤n ≤2m+1

,而且这时,()m m n

i i i S u n -=≤-∑211

ξ;因

此只需要证明

102lim =?

??

=????-∞→m m n S p ,

由柯尔莫戈洛夫不等式,知对于任意0>ε和m ≥1, 有{}()∑+=--≤≥1

21

2

2

2m n n

m m m D S p ξ

εε,从而有

{}()∞<=-

==≤≥∑∑∑∑∑∑∑∞

=∞=≥=-==∞=-∞=-++12

2122212211213164

114

14141211

n n

n n n m m n n n n m m m m m n

D n D D D S p m m ξεξεξξξεε因此,又由已知的推论可证得定理。

(3)说明①此定理是马尔科夫定理的推广。而且又有三个推论分别是切比雪夫大数定律,贝努里大数定律和普哇松大数定律的推广。内容是:

如果,...,21ξξ相互独立,而且存在常数c ,使(),...2,1=≤n c D n ξ,则,...,21ξξ服从强大数定律。

②假设n u 是n 重贝努里试验中某事件A 出现的次数,已知每次试验中A 出现的概率为p(0

=???

=???

∞→p n u p n n 。

③假设n u 是n 次独立随机试验中某事件A 出现的次数,已知在第I 次试验中

A

出现的概率为

p i (0

101lim 1=?

??=???

???-???∑=∞→n i i n n p n n u p (四)、大数定律的应用

大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性。

它是随机现象统计规律性的具体表现,因此大数定律在理论和实践中(例如,在数学分析,数理统计和近似计算中),都有广泛的应用

例1(在近似计算中的应用)]1[

假设需要计算定积分()dx x g b

a ?,其中g(x)是连续函数,现在,向区间[]

b a ,均匀地连接投掷n 个随机点。那么,它们的坐标,...,...,,21n ξξξ是n 个独立并在[]b a ,上均匀分布的随机变量。显然,()()n i dx x g a

b Eg b

a i ,...2,1,1=-=

?ξ。由辛钦定理知:()()?∑-=-=∞→b

a n i i n dx x g a

b g n p 11lim 1

ξ。(由柯尔莫戈洛夫大数定理知,上面的式子实际上为以概率1收敛)。于是,当n 充分大时,得近似计算公式:()()∑?=-≈n

i i b

a

g n a b dx x g 1

ξ。 有趣的是该式右边很象普通的积分和,不过这里,...,...,,21n ξξξ是在[]b a ,上均匀分布的独立随机变量。

例2、用大数定律可以证明数学分析一著名定理

——关于用多项式列一致逼近连续函数的维尔斯特拉斯定理:假设f(x)在闭区间[]b a ,上是连续函数。那么,存在一列多项式B 1(x ),B 2(x ),……,一致收敛于函数f(x),x ∈[]b a ,。

证明:不妨设a=0,b=1,因为否则就可以引进新的自变量u :x=(b-a )

u+a ,使u ∈[]1,0。这样假设f(x),x ∈[]1,0,是连续函数,那么,f(x)在[]1,0上一致连续并且有界:对于任意0>ε,0≤x 1,x 2≤1,存在0>δ,使得

()()δε

<-<-2121,2

x x x f x f 只要。此外,对于一切0≤x ≤1,有()k

x f ≤(常数)。现在建立一列多项式:

()()m

n m n m m n n

n x x n m f n Ef x B c -=-??

? ??=??? ??=∑10ξ

(*) 其中n ξ服从二项分布,参数为n ≥1,而x ∈[]1,0。显然,有B n (0)=f (0),

B n (1)=f (1)。由贝努里大数定律知,lim

x n

p n

n =-∞

→ξx ∈[]1,0。

现证明()??

?

??=n Ef x B n n ξ一致收敛于f(x),x ∈[]1,0。 由于()

110

=--=∑m

n m

n

m m n x x c ,可见,()()()()m

n m m n n

m n x x x f n m f x f x B c -=-??

????-??? ??=-∑10

由此可见,

()()()()

()()()()()

?

?????≥-+=

-+<

--??

?

??+--??

? ??=

--??? ??≤--≥--≥--<--=∑∑

∑δξε

ε

δδδx n kp x x k

x x x f n m f x x x f n m f x x x f n m f x f x B n m

n x n

m

m

m n

m

n x n

m

m m n m

n m m n x n

m

m

n m m n n

m n c

c c c 22122

1110

由于对任意x ∈[]1,0,

x n

p

n

?→?ξ,可见存在一个N 使当n ≥N 时

k

x n p n 4ε

δξ≤

??????≥-,从而当n ≥N 时,对于一切x ∈[]1,0,有 ()()εε

ε

ε

ε

=+

=

?

+<

-2

2

422

k

k x f x B n 。

即()()10,关于∈x x B n 一致收敛于f (x )

。 二、中心极限定理

我们已经知道,概率论可被理解的价值是建立在对大量随机变量上的研究上,并从中揭示出大量随机现象在其集体的行动中所服从的确定而非偶然的规律。从数学的角度来讲,只有通过极限的理论才能显示出

概率论的价值。而在概率论的发展史上,中心极限定理是最重要的也是最出色的成果之一。凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理,也就是中心极限定理所回答的问题是,(独立或弱相依),随机变量之和的极限分布在什么条件下是正态的,它揭示产生正态分布的源泉。

(一)、中心极限定理的提法。

如果一个随机变量决定于大量随机因素的总和,其中每个随机因素的单位作用微不足道,而且各隐私的作用相对均匀,那么它就服从或近似地服从正态分布。在实际中这类例子是很多的。现在,我们用严格的数学形式来表述这一直观。

1、随机变量之和。在许多情况下,一随机变量η可以表示为或近似地表示为大量独立随机变量之和n ξξη++≈...1。这里每一个i ξ直观上表示一种随机因素的效应。假设上式包含了决定η的充分多的随机因素的效应(即n 充分大),则η的分布就近似于∑∞

=1i i ξ的分布。中心极限定理就是要

说明,在什么条件下,当n 充分大时,独立随机变量之和的极限分布是正态的。

例如,在分析天平上重复称量某物品,第j 次称得的结果

(),...2,1=+=j e u j j ξ,其中u 为被称量的物品,j e 为随机误差,令

∑∑==+==n

j j n j j n e n u n 1

111ξη,要求n 充分大时n η的分布。故可以求当n 充分大

时,随机变量和n η的极限分布。

2、独立随机变量的规范和。由于许多问题都可以归结为求独立随机

变量之和∑=n

j j 1

ξ规范化。为此假设()n j j ,...,2,1=ξ都有有穷数学期望和分差。

令∑∑======n

j j n j j n

j j n j j B D M M u E 1

2

2

21

,;,σσξξ。那么,如果n 充分大时,∑=n

j j

1

ξ近似地服从正态分布。()

B n n M N 2

,,则显然2

1∑=???

?

??-=n

j n

j

j n B

u ξζ近似地服从标准正态分布N(0,1)。反之亦然。因此,我们以后研究n ∞→时n ζ的极限分布,并称n ζ为独立随机变量n ξξ...1的规范和。

记号:考虑独立随机变量列...,21ξξ。假设j j u E =ξ和2

j

j D σξ=(j=1,2,…)有穷。对于任意n ≥1,1≤j ≤n ,记(){}x p x F j j ≤=ξ;∑==n

j j n

B 1

22

σ;

(){}x p x F B u nj nj n

i

i nj ≤=-=

ξξξ,,()n j

it nj Ee

t f ξ=;()∑∑==-=

=n

j j j

n n

j nj n u B 1

1

1

ξ

ξζ,

(){}()n it n n n Ee t g x p x G ζζ=≤=,。

显然,1,01

===∑=n

j nj n n D D E ξζζ

定义,称随机变量列,...,21ηη有渐近正态分布N (u, 2σ),如果相应的分布函数列F n1(x ),F n2(x ),……。弱收敛于正态分布N (u ,2σ)的分布函数,即()()du e

x F x

u n n

?∞

---

→=

2

221

lim σμησ

π

定义。假设...,21ξξ是一独立随机变量列。那么,(ⅰ)对于任意n ≥1,称随机变量n ξ为n ξξ,...1的规范性;(ⅱ)称...,21ξξ服从中心极限定理。如果响应的规范和列...,21ξξ有渐近核准正态分布N (0,1)即

()()du e x

x x G x u n ?∞

--

→=

Φ=2

2

21

lim ,其中G n (x)= {

},...2,1,=≤n x p n ζ 由于,如果二项分布函数F 1(x )和F 2(x )有同一特征函数,则F 1

(x )≡F 2(x )。故可以知道,式子()()du e x

x x G x u n n ?∞

--

→=

Φ=2

2

21

lim 中的收敛关

于x ∈()+∞∞-,。为一致收敛。这样,如果...,21ξξ服从中心极限定理,则当

n 充分大时,有()du e

x x B p x

u j j

j n

?

∑∞

--

=≈?

????

?≤-2

12

21

1

μξ

(二)、中心极限定理的内容。

中心极限定理的名称最早是由卜里耶提出来的,而其定理的一般形式最早是由切比雪夫提出来的。下面我们将介绍三个主要定理①以...,21ξξ同分布为条件的列维—林德伯格定理以及它的特殊情形隶美弗—拉普拉斯积分定理;②林德伯格定理③李亚普诺夫定理。

1、列维—林德伯格定理。

(1)、定理:对于独立同分布随机变量...,21ξξ,如果它们的方差有穷,则关于

x ∈()+∞∞-,一致地有()

du e

x n p x

u n

j j

i

n ?

∑∞

--

=∞

→=??

?

???????≤-2

1

2

211

lim π

μξ

σ

其中

(),...

2,1,2===j D E j j ξσξμ (2)、证明:令f(t)为(),...2,1=-j j j μξ的特征函数。那么,n ξ的特征函数

()n

n n t f t g ??

???????? ??=σ.由条件知∞

和二阶导数,并且,

()()()2

220,00σσμξ-==''=-='i f iE f j ,于是,由泰勒公式知对于任意t ∈

()

+∞∞-,,有()()()???

??+-=??? ??++'+=???

? ??n n t n n t f n t f f n t f 121120"0022

2οοσσσ,

(),1212

n

n

n n n t n t f t g ???

?????? ??+-=??

???????? ??=οσ()2

2

2

121l i m l i m t n

n n n e n n t t g -

∞→∞→=????????? ??+-=ο,因为

g n (t)收敛于标准正态分布的特征函数,所以由定理(连续性定理)可知

(){}x P x G n n ≤=ζ

弱收敛于标准正态分布函数()x Φ。由于()x Φ是连续函数,故()x G n 向()x Φ的收敛关于

x ∈()+∞∞-,一致收敛。 (3)、特殊情况

隶美弗—拉普拉斯积分定理。

假设μn (n=1,2,…)表示n 重贝努里试验中成功的次数,已知每次试验成功的概率为p(0

()du e

x p np np p x

u n n ?

--

→=??

????????≤--2

2

211lim π

μ。

该定理表明,正态分布是二项分布极限分布。当n 充分大时,可以利用下面的近似公式来计算二项分布的概率。

{}?∑-

=-≈

??

????????≤-≤==

≤≤βα

π

βμαμdx e npq n p q p c m m p u n m m m m

n m m n n 2

2122

1

21

其中p q npq

np m npq

np m -=-=

-=

1,,21βα

2、林德伯格定理

(1)定理 如果独立随机变量列...,21ξξ满足林德伯格条件,即:如果对于

任意τ>0,有()()01

lim

122

=-∑?=≥-∞→n

j Bn

x j

j

n

n j

x dF x B τμμ 则它服从于中心极限定理。

(2)证明路线

定理的证明基于特征函数和分布函数对应的连续性定理

①在林德伯格条件下,证明当∞→n 时,有()()+∞∞-∈=-∞

→,,lim 2

2t e t g t n n ,

其中()()∏==n j nj n t f t g 1

是规范和()∑==n

j nj n t 1

ξζ的特征函数,而f nj (t)是nj ξ的特征

函数。

②由于2

2

t e -是标准正态分布的特征函数,故()x G n 弱收敛于标准正态分布函数()x Φ,即n ξξξ...,21服从中心极限定理。 3、李亚普诺夫定理

(1)定理:假设...,21ξξ是独立随机变量列,那么,如果对于某个,0>δ有

δ

δμξ

+=+∞

→∑-21

21lim

n

j j

j

n

n E B

=0其中(),,...2,1,1

2n j E D B j j n

j j n

===∑=ξμξ则......,21n ξξξ服

从中心极限定理 (2)证明:假设δ

δμξ

+=+∞

→∑-21

21lim

n

j j

j

n

n E B

=0成立,即存在,0>δ,使

01

12221→-=

∑∑=+++=n

j j

j

n

n

j nj

E B E δ

δδμξ

ξ

,其次,对于任意τ>0,有

()01

1

21

1

22

1

→≤

?+==+=∑∑∑δδ

δ

δ

ξ

τξ

τξ

n

j nj

n j j

nj nj

nj nj

n j E x E x E 。其中x nj 是{}

τξ>nj 的表示

性函数。由此可见,林德伯德条件成立,从而...,21ξξ服从中心极限定理

(三)、中心极限定理的应用]4[

上述的中心极限定理在实际中应用广泛,因为在考虑那些随机因素总和的极限分布时,只要那些因素对总的影响均匀地小,同时又是独立的,并且总和在个数上是15个以上的,则一般都可以认为它的分布律是正态的。

例一、某检查员逐个地检查某种产品,每次花10秒钟检查一个,但

也可能有的产品需要再花10秒钟重复检查一次,假设每个产品需要复检的概率为0.5,求在8小时内检查员检查的产品个数多于1600个的概率。

解:引入随机变量x i 表示第i 个产品花费的时间。

X i =??

?个需重复检查

第个不需重复检查第i i 2010

则X=∑=16001

i Xi ——检查1600个产品所花时间 于是 E (X i )=10×0. 5+20×0.5=15

D (X i )=

E (X i 2)-[E (X i )]2=102×0.5+202×0.5-152=25 由列维一林德伯格定理可知

{}()()()1

24245

401516005160015160036008516001516003600836008≈???Φ≈???≤??-=?

?

?

?????-?≤??-=

?

?????-?≤-=?≤x p x p n x nE n x nE x p x p i i σσ

例2,对敌人防御地段进行100次的射击,在每次射击中,炮弹的命中数的数学期望为,而命中的数的均方差为1.5,求当射击100次时,有380颗到240颗炮弹命中目标的概率的近似值。

解:总命中数等于各次命中数的和

∑==+???++=100

1

10012

i i ξξξξξ

这里i ξ表示第i 次射击中炮弹的命中数,由于这时随机变量()100,...,2,1=i i ξ 的个数足够多,同时又是同分布的,它们有有限的方差,并且我们可以把各次射击看成是彼此独立的。因此,可以应用中心极限定理。

由m x =∑==n

i i m 1

400 D x =1001

=∑=n

i i D ×(1.5)2=225

所以 {}8164.021152022540015204203802

21

1520

15

20≈≈??????<-≤-=<≤--?ττπξξd e p p

概率论大数定律及其应用

概率论基础结课论文题目:独立随机序列的大数事件的定理与应用 作者 摘要:历史上第一个定理属于,后人称之为“”。概率论中讨论的向的定律。概率论与数理的基本定律之一,又称弱大数理论。 大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,是随机现象统计规律性的具体表现,应用很广泛。本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。 关键词:弱大数定理伯努利大数定理随机变量数学期望概率 引言:“大数定律”本来是一个数学概念,又叫做“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗的说,这个定律就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。比如,我们向上抛一枚硬币,硬币落下时哪一面朝上本身是偶然的,但当我们向上抛的硬币的次数足够多时,达到上万次甚至几十万几百万时之后,我们就会发现,硬币朝上的次数大约占总数的二分之一。偶然之中包含着必然。 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近,人们在实践中观察其他的一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的个别特征无关,而且结果也不再是随机的。深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么?在什么条件下具有稳定性?这就是我们大数要研究的问题。 概率与统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。然而,在大量重复试验或观察中,我们会发现,一个事件发生的频率具有稳定性,它的稳定性会随着试验次数的增多表现得越来越明显。这种稳定性与它在在实验进行中的个别特征无关,且不再是随机的。大数定律给出了稳定性的确切含义,并且给出了什么条件下才具有稳定性。那么,这对于我们解决理论与实际问题有哪些实际意义呢?这就是我们在下面将要了解到的,大数定律的某些应用。即,大数定律及其在理论与实际生活中的一些应用。 一方面,在理论上,大数定律可以看作是求解极限、重积分以及级数的一种新思路,另一方面,在实际生活中,保险动机的产生、保险公司财政稳定和保费的确定,我们都将看到大数定律的重要作用。

中心极限定理

中心极限定理 中心极限定理(Central Limit Theorems) 什么是中心极限定理 大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。 中心极限定理是概率论中最著名的结果之一。它提出,大量的独立随机变量之和具有近似于正态的分布。因此,它不仅提供了计算独立随机变量之和的近似概率的简单方法,而且有助于解释为什么有很多自然群体的经验频率呈现出钟形(即正态)曲线这一事实,因此中心极限定理这个结论使正态分布在数理统计中具有很重要的地位,也使正态分布有了广泛的应用。 中心极限定理的表现形式 中心极限定理也有若干个表现形式,这里仅介绍其中四个常用定理: (一)辛钦中心极限定理 设随机变量相互独立,服从同一分布且有有限的数学期望a和方差σ2,则 随机变量,在n无限增大时,服从参数为a和的正态分布即n→∞时, 将该定理应用到抽样调查,就有这样一个结论:如果抽样总体的数学期望a和方差σ2是有限的,无论总体服从什么分布,从中抽取容量为n的样本时,只要n足够大,其样本平均数的分布就趋于数学期望为a,方差为σ2 / n的正态分布。 (二)德莫佛——拉普拉斯中心极限定理 设μ n是n次独立试验中事件A发生的次数,事件A在每次试验中发生的概率为P,则当n 无限大时,频率设μ n / n趋于服从参数为的正态分布。即:

该定理是辛钦中心极限定理的特例。在抽样调查中,不论总体服从什么分布,只要n充分大,那么频率就近似服从正态分布。 (三)李亚普洛夫中心极限定理 设是一个相互独立的随机变量序列,它们具有有限的数学期望和方 差:。 记,如果能选择这一个正数δ>0,使当n→∞时, ,则对任意的x有: 该定理的含义是:如果一个量是由大量相互独立的随机因素影响所造成的,而每一个别因素在总影响中所起的作用不很大,则这个量服从或近似服从正态分布。 (四)林德贝尔格定理 设是一个相对独立的随机变量序列,它们具有有限的数学期望和方差满足林德贝尔格条件,则当n→∞时,对任意的x,有 。 中心极限定理案例分析 案例一:中心极限定理在商业管理中的应用 水房拥挤问题:假设西安邮电学院新校区有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向后勤集团提议增设水龙头。假

概率论复习题及答案

复习提纲 (一)随机事件和概率 (1)理解随机事件、基本事件和样本空间的概念,掌握事件之间的关系与运算。 (2)了解概率的定义,掌握概率的基本性质和应用这些性质进行概率计算。 (3)理解条件概率的概念,掌握概率的加法公式、乘法公式、全概率公式、Bayes 公式, 以及应用这些公式进行概率计算。 (4)理解事件的独立性概念,掌握应用事件独立性进行概率计算。 (5)掌握Bernoulli 概型及其计算。 (二)随机变量及其概率分布 (1)理解随机变量的概念。 (2)理解随机变量分布函数)}{)((x X P x F ≤=的概念及性质,理解离散型随机变量的分布律及其性质,理解连续型随机变量的概率密度及其性质,会应用概率分布计算有关事件的概率。 (3)掌握二项分布、Poisson 分布、正态分布、均匀分布和指数分布。 (4)会求简单随机变量函数的概率分布。 (三)二维随机变量及其概率分布 (1)了解二维随机变量的概念。 (2)了解二维随机变量的联合分布函数及其性质,了解二维离散型随机变量的联合分布律 及其性质,并会用它们计算有关事件的概率。 (3)了解二维随机变量分边缘分布和条件分布,并会计算边缘分布。 (4)理解随机变量独立性的概念,掌握应用随机变量的独立性进行概率计算。 (5)会求两个随机变量之和的分布,计算多个独立随机变量最大值、最小值的分布。 (6)理解二维均匀分布和二维正态分布。 (四)随机变量的数字特征 (1)理解数学期望和方差的概念,掌握它们的性质与计算。 (2)掌握6种常用分布的数学期望和方差。 (3)会计算随机变量函数的数学期望。 (4)了解矩、协方差和相关系数的概念和性质,并会计算。 (五)大数定律和中心极限定理 (1)了解Chebyshev 不等式。 (2)了解Chebyshev 大数定律和Benoulli 大数定律。 (3)了解独立同分布场合的中心极限定理和De Moivre-Laplace 中心极限定理的应用条件 和结论,并会用相关定理近似计算有关随机事件的概率。

概率论与数理统计第五章 大数定律及中心极限定理

概率论与数理统计作业 班级 姓名 学号 任课教师 第五章 大数定律及中心极限定理 教学要求: 一、了解大数定律的直观意义; 二、掌握Chebyshev 不等式; 三、了解Chebyshev 大数定理和贝努里大数定理; 四、会用中心极限定理估算有关事件的概率. 重点:中心极限定理. 难点:切比雪夫不等式、大数定律、中心极限定理. 综合练习题 一、选择题 1.设12,,,n X X X 是独立同分布的随机变量序列,且 1,2,,i n = .令∑==n i i n X Y 1 ,1,2,,i n = ,()x Φ为标准正态分布函数,则 ()=?? ????????≤--∞ →11lim p np np Y P n n (B ). (A )0 ; (B )()1Φ; (C )()11Φ-; (D )1.6 . 2.设()x Φ为标准正态分布函数,0,1,i A X A ?=? ?事件不发生, 事件发生, ()100,,2,1 =i ,且 ()8.0=A P ,10021,,,X X X 相互独立.令∑==100 1 i i X Y ,则由中心极限定理知Y 的分布函 数()y F 近似于(B ). (A )()y Φ; (B )?? ? ??-Φ480y ; (C )()8016+Φy ; (D )()804+Φy . 3.设随机变量 ,,,,21n X X X 相互独立,且i X () ,,,2,1n i =都服从参数为 2 1

的指数分布,则当n 充分大时,随机变量∑==n i i n X n Z 1 1的概率分布近似服从(B ). (A )()4,2N ; (B )??? ??n N 4,2; (C )?? ? ??n N 41,21; (D )()n n N 4,2. 二、填空题 1.设随机变量 ,,,,21n X X X 相互独立且同分布,它们的期望为μ,方差为2 σ, 令∑==n i i n X n Z 1 1,则对任意正数ε,有{}=≤-∞→εμn n Z P lim 1 . 2.设 ,,,,21n X X X 是独立同分布的随机变量序列,且具有相同数学期望和方差 ()μ=i X E ,()02>=σi X D ,() ,2,1=i , 则对任意实数x , =??? ? ??? ???????≤-∑=∞ →x n n X P n i i n σμ1lim ()x Φ. 3.设()1-=X E ,()4=X D ,则由切比雪夫不等式估计概率{}42P X -<<≥ 9 5 . 4.设随机变量[]1,0~U X ,由切比雪夫不等式可得≤??????≥- 3121X P 4 1. 5.设随机变量() 2.0,100~B X ,应用中心极限定理可得{}≈≥30X P 0062.0.(其中 ()()9938.05.2=Φ) 三、应用题 1. 100台车床彼此独立地工作着,每台车床的实际工作时间占全部工作时间的80%, 求任一时刻有70至86台车床在工作的概率. 解:设?? ?=台车床没有工作 第台车床正在工作 第i i X i .0.1(100,,2,1 =i ),且()8.0,1~B X i , 则100台车床中在任一时刻正在工作的机床台数为10021X X X X +++= ,且()80=X E ,()16=X D ,(其中10021,,,X X X 独立同分布),于是由德莫弗-拉普拉斯中心极限定理近似可得 ()???? ??-≤-≤-=≤≤168086168016 80708670X P X P

概率论与数理统计概率历史介绍

概率论与数理统计概率历史介绍

一、概率定义的发展与分析 1.古典定义的历史脉络 古典定义中的“古典”表明了这种定义起源的古老,它源于赌博.博弈的形式多种多样,但是它们的前提是“公平”,即“机会均等”,而这正是古典定义适用的重要条件:同等可能.16世纪意大利数学家和赌博家卡尔丹(1501—1576)所说的“诚实的骰子”,即道明了这一点.在卡尔丹以后约三百年的时间里,帕斯卡、费马、伯努利等数学家都在古典概率的计算、公式推导和扩大应用等方面做了重要的工作.直到1812年,法国数学家拉普拉斯(1749—1827)在《概率的分析理论》中给出概率的古典定义:事件A的概率等于一次试验中有利于事件A的可能结果数与该事件中所有可能结果数之比. 2.古典定义的简单分析 古典定义通过简单明了的方式定义了事件的概率,并给出了简单可行的算法.它适用的条件有二:(1)可能结果总数有限;(2)每个结果的出现有同等可能.其中第(2)条尤其重要,它是古典概率思想产生的前提. 如何在更多和更复杂的情况下,体现出“同等可能”?伯努利家族成员做了这项工作,他们将排列组合的理论运用到了古典概率中.用排列(组合)体现同等可能的要求,就是将总数为P(n,r)的各种排列(或总数为C(n,r)的各种组合)看成是等可能的,通常用“随意取”来表达这个意思.即使如此,古典定义的方法能应用的范围仍然很窄,而且还有数学上的问题. “应用性的狭窄性”促使雅各布?伯努利(1654—1705)“寻找另一条途径找到所期待的结果”,这就是他在研究古典概率时的另一重要成果:伯努利大数定律.这条定律告诉我们“频率具有稳定性”,所以可以“用频率估计概率”,而这也为以后概率的统计定义奠定了思想基础.“古典定义数学上的问题”在贝特朗(1822—1900)悖论中表现得淋漓尽致,它揭示出定义存在的矛盾与含糊之处,这导致了拉普拉斯的古典定义受到猛烈批评. 3.统计定义的历史脉络 概率的古典定义虽然简单直观,但是适用范围有限.正如雅各布?伯努利所说:“……这种方法仅适用于极罕见的现象.”因此,他通过观察来确定结果数目的比例,并且认为“即使是没受过教育和训练的人,凭天生的直觉,也会清楚地知道,可利用的有关观测的次数越多,发生错误的风险就越小”.虽然原理简单,但是其科学证明并不简单,在古典概型下,伯努利证实了这一点,即“当试验次数愈来愈大时,频率接近概率”. 事实上,这不仅对于古典概型适用,人们确信“从现实中观察的频率稳定性”的事实是一个普遍规律.1919年,德国数学家冯?米塞斯(1883—1953)在《概率论基础研究》一书中提出了概率的统计定义:在做大量重复试验时,随着试验次数的增加,某个事件出现的频率总是在一个固定数值的附近摆动,显示出一定的稳定性,把这个固定的数值定义为这一事件的概率.

概率论与数理统计(经管类)复习试题及答案

概率论和数理统计真题讲解 (一)单项选择题(本大题共10小题,每小题2分,共20分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.设随机事件A与B互不相容,且P(A)>0,P(B)>0,则() A.P(B|A)=0 B.P(A|B)>0 C.P(A|B)=P(A) D.P(AB)=P(A)P(B) 『正确答案』分析:本题考察事件互不相容、相互独立及条件概率。 解析:A:,因为A与B互不相容,,P(AB)=0,正确; 显然,B,C不正确;D:A与B相互独立。 故选择A。 提示:① 注意区别两个概念:事件互不相容与事件相互独立; ② 条件概率的计算公式:P(A)>0时,。 2.设随机变量X~N(1,4),F(x)为X的分布函数,Φ(x)为标准正态分布函数,则F(3)=() A.Φ(0.5) B.Φ(0.75) C.Φ(1) D.Φ(3) 『正确答案』分析:本题考察正态分布的标准化。 解析:, 故选择C。 提示:正态分布的标准化是非常重要的方法,必须熟练掌握。 3.设随机变量X的概率密度为f(x)=则P{0≤X≤}=() 『正确答案』分析:本题考察由一维随机变量概率密度求事件概率的方法。第33页 解析:, 故选择A。 提示:概率题目经常用到“积分的区间可加性”计算积分的方法。

4.设随机变量X的概率密度为f(x)=则常数c=() A.-3 B.-1 C.- D.1 『正确答案』分析:本题考察概率密度的性质。 解析:1=,所以c=-1, 故选择B。 提示:概率密度的性质: 1.f(x)≥0; 4.在f(x)的连续点x,有F′(X)=f(x);F(x)是分布函数。课本第38页 5.设下列函数的定义域均为(-∞,+∞),则其中可作为概率密度的是() A.f(x)=-e-x B. f(x)=e-x C. f(x)= D.f(x)= 『正确答案』分析:本题考察概率密度的判定方法。 解析:① 非负性:A不正确;② 验证:B:发散; C:,正确;D:显然不正确。 故选择C。 提示:判定方法:若f(x)≥0,且满足,则f(x)是某个随机变量的概率密度。 6.设二维随机变量(X,Y)~N(μ1,μ2,),则Y ~() 『正确答案』分析:本题考察二维正态分布的表示方法。 解析:显然,选择D。

中国对概率论思想发展史研究初露端倪_读王幼军_拉普拉斯概率理论的历史研究_

第38卷第5期 2009年9月内蒙古师范大学学报(自然科学汉文版)Journal of Inner Mongolia Normal University (Natural Science Edition )Vol.38No.5Sept.2009 收稿日期:2009207210 基金项目:国家自然科学基金资助项目(10771169);山东省十一五教育规划课题(115GG73) 作者简介:徐传胜(1962-),男,山东聊城人,临沂师范学院教授,主要从事概率论思想史研究,E 2mail :lysyxcs @https://www.docsj.com/doc/4917427145.html,. 中国对概率论思想发展史研究初露端倪 ———读王幼军《拉普拉斯概率理论的历史研究》 徐传胜 (临沂师范学院数学系,山东临沂276005) 摘 要:目前我国学者对概率论史的研究鲜有涉及,以致有关资料相当匮乏.王幼军的《拉普拉斯概率理论 的历史研究》是中国第一部概率论史研究专著.该书特色为:(1)揭示了拉普拉斯概率理论形成的主要因素; (2)论述了拉普拉斯概率理论的本质和特点;(3)考证了《决疑数学》的底本.但此书也有一些不足和可议之处, 如有些语言西化,令人费解. 关键词:拉普拉斯;概率论;王幼军 中图分类号:N 092 文献标识码:A 文章编号:1001228735(2009)052205782204 概率论现已成为中国高等教育的重要课程之一.现代概率论的内容往往使学生认为它需要与现实模型结合起来,这使学生难以进入数学抽象的境地.在方法上,概率论更注重概念的理解,而这正是习惯于算法学习的学生所欠缺的;另一方面,学生都是在因果观的环境中成长起来的,因此在首次学习处理不确定性的概率论时,感到难以理解也就不足为怪了. 概率论既是一门核心数学学科,更是观测世界的一种基本方法.作为科学探索的特色方法,其显著功效已引起概率理论在科学研究中的爆炸性增长.概率思想是统计学的理论基础,是物理学、遗传学和信息论的重要工具,是金融学、地球科学、神经学、人工智能和通讯网络等学科的常用方法.然而概率论的思想又很微妙,即使今天仍未被很好地理解.因此,对概率思想的研究已成为数学家和数学史家关注的热点之一. 2007年1月,王幼军在其博士论文的基础上,做了进一步的充实和改进,出版了《拉普拉斯概率理论的历史研究》,该书是中国第一部概率论史研究专著,由此拉开了我国对概率论思想发展史研究的帷幕. 《拉普拉斯概率理论的历史研究》全书分成6章,内容为2个独立专题:前5章是对拉普拉斯概率论理论的历史研究,以拉普拉斯的《分析概率论》为中心,探讨了拉普拉斯概率理论的来龙去脉和科学影响;最后一章通过详细考证,确认中文的第一部概率论译著———《决疑数学》的底本应是Thomas Galloway 在《大英百科全书》第8版(1859)中所作“概率论”一文,并从拉普拉斯概率论发展的历史背景出发,全面地论述了《决疑数学》的背景、风格、观点、内容安排,以及《决疑数学》对中国概率论发展的影响[1]. 李文林称王幼军的《拉普拉斯概率理论的历史研究》“对原始文献的掌握与使用”和“运用现代数学理论 与方法,分析考察拉普拉斯的概率论底本”(原书序一)值得称道,该书“无论对于科学史探讨或现实的概率论 研究和教学来说都体现出数学史研究的价值”.江晓原称其曾“受到国内数学界权威人士的很高评价”,是“令 人欣喜的新成果” (原书序二),诚哉斯言.1 近现代数学史研究的困窘 正如科学史研究领域所面对的问题一样,在数学史的研究领域中,诸如为什么要研究数学史、谁需要数学史、数学史究竟是干什么的、数学史该往何处去,这些问题也是每个数学史研究者难以回避的问题. 20世纪中国数学史的研究经历了两次高潮,分别是在李俨和钱宝琮、吴文俊等学者的倡导下,先后发起的以“发现”和“复原”为主题的两次运动.第一次运动中,“发现”意味着破解历史上都做出了什么样的数学,数学史家们必须从原始文献中找寻;在吴文俊发起的以“复原”为主题的第二次运动中,数学史家所关注的问

概率论中的大数定律及中心极限定理

概率论中的大数定律及中心极限定理 唐南南 摘要 概率论是从数量上研究随机现象的规律的学科,概率论的特点是先提出数学模型,然后去研究它的性质,特点和规律。它在自然科学,技术科学和社会科学等科学中有广泛的应用。而大数定律和中心极限定理的内容是概率论中极限理论极为重要的一部分内容。在这篇文章中,我们从贝努力试验中的频率出发,讨论了独立随机变量和分布的极限问题。在一定条件下,这些分布弱收敛于退化分布,这就是大数定律。在另一些条件下,这些分布弱收敛于N(0,1)分布,这一类收敛于N(0,1)分布的定理统称为中心极限定理.大数定律说明了随机现象都具有稳定性而中心极限定理是研究相互独立随机变量序列{}i x 的部分和∑== n i i n x S 1 的分布,在适当条件下向正态分布收放的问题。在这篇文章 里,我们只介绍了一些定理的提出,内容以证明以及在其他学科上的应用,而大数定律和中心极限定理还有许多更深入,更广泛的内容,限于篇幅这里就不再介绍了。掌握定理的结论是重要的,这些结论一方面使频率稳定于概率,n 次观察的算术平均值稳定于数学期望都有了明确的含义和理论依据;另一方面,又将给数理统计中大样本的统计推断等提供理论依据。 关键词 大数定律 中心极限定理 随机现象 随机变量 引言 大数定律和中心极限定理是概率论中重要的一部分内容,但对读者来说,多数人对于这部分内容感到很难掌握,这篇文章就是对这部分内容进行浅入的分析,但对其内容进行详细的说明,而且进行了归纳性的总结,指出了各定律之间的联系及其差别,希望通过本篇文章内容的介绍,能使读者对于这部分知识有一个清晰的印象,能整体地把握这部分内容。 一 、大数定律 (一)、问题的提法(大数定律的提法) 重复实验中事件的频率的稳定性,是大量随机现象的统计规律性的典型表现。人们在实践中认识到频率具有稳定性,进而由频率的稳定性预见概率的存在;由频率的性质推断概率的性质,并在实际应用中(当n

概率论与数理统计:中心极限定理

中心极限定理 无论随机变量12,,,, n X X X 服从什么分布,当n 充分大时,其和的极限分布是正 态分布,这就是我们今天要讲的中心极限定理。 定理 5.5(独立同分布中心极限定理)设随机变量12,,,,n X X X 相互独立,服从同一 分布,且具有数学期望和方差2 (),()0,i i E X D X μσ==>1,2,i =,则随机变量之和1 n i i X =∑的标 准化变量 n i n X n Y μ -= ∑ 的分布函数()n F x 对于任意X 满足 2/2lim ()lim d ()n i x t n n n X n F x P x t x μΦ-→∞→∞ ?? -??? =≤==????? ∑? 定理 5.5表明,对于均值为,μ方差为2 0σ>的独立同分布的随机变量的和1 n i i X =∑的标准 化随机变量,不论12,,,, n X X X 服从什么分布,当n 充分大时,都有 ~(0,1)n i n X n Y N μ-= ∑近似 , 从而,当n 充分大时 21 ~(,)n i i X N n n μσ=∑近似. 定理5.5′ 设随机变量列12,,,,n X X X 相互独立,服从同一分布,且具有数学期望和方差2(),()0,i i E X D X μσ==>1,2, i =,令1 1n n i i X X n == ∑,则当n 充分大时 ~(0,1)N 近似 ,即2~(,/)n X N n μσ近似. 例5.3 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100 g,标准差是10 g,求一盒螺丝钉的重量超过10.2 kg 的概率. 解 设i X 为第i 个螺丝钉的重量,,100,,2,1 =i Y 为一盒螺丝钉的重量,则

概率论与数理统计 习题(5)答案

习题五 1.一颗骰子连续掷4次,点数总和记为X .估计P {10

整理得0.95,10n ??Φ≥ ? ??? 查表 1.64,10n ≥ n ≥, 故取n =269. 3. 某车间有同型号机床200部,每部机床开动的概率为,假定各机床开动与否互不影响, 开动时每部机床消耗电能15个单位.问至少供应多少单位电能才可以95%的概率保证不致因供电不足而影响生产. 【解】要确定最低的供应的电能量,应先确定此车间同时开动的机床数目最大值m ,而m 要满足200部机床中同时开动的机床数目不超过m 的概率为95%,于是我们只要供应15m 单位电能就可满足要求.令X 表同时开动机床数目,则X ~B (200,), ()140,()42,E X D X == 1400.95{0}().42m P X m P X m -?? =≤≤=≤=Φ ??? 查表知 140 1.64,42 m -= ,m =151. 所以供电能151×15=2265(单位). 4. 一加法器同时收到20个噪声电压V k (k =1,2,…,20),设它们是相互独立的随机变量, 且都在区间(0,10)上服从均匀分布.记V = ∑=20 1 k k V ,求P {V >105}的近似值. 【解】易知:E (V k )=5,D (V k )= 100 12 ,k =1,2,…,20 由中心极限定理知,随机变量 20 1 205 ~(0,1).100100 20201212 k k V Z N =-?= =??∑近似的 于是105205{105}1010020201212P V P ????-?? >=>???? ????? 1000.3871(0.387)0.348,102012V P ????-?? =>≈-Φ=? ???????? 即有 P {V >105}≈ 5. 有一批建筑房屋用的木柱,其中80%的长度不小于3m.现从这批木柱中随机地取出100 根,问其中至少有30根短于3m 的概率是多少

哈工大概率论课程论文

哈尔滨工业大学 课程论文概率论与数理统计的发展与应用 课程名称概率论与数理统计姓名 学院英才学院 专业电气工程及其自动化班级 学号 指导教师王勇 日期2014年12月11日

[摘要]:通过本学期概率论与数理统计这门课的学习,我基本掌握了基本的概率知识,这对于自己以后的发展和创新有着很大的帮助。本文将根据自己的学习心得,概率论的历史、发展和主要内容,应用方向,课程感悟等四个方面来阐述我对本门课的总结。 [关键词]:概率论数理统计生产发展主要内容应用方向

概率论与数理统计是研究随机现象规律性的一门科学。前者是从数学观点研究随机现象的基本性质,后者从搜集到的随机数据,估计或推断随机现象的基本特性。 一:概率论与数理统计的起源与发展 1、概率论 概率论起源于对赌博问题的研究。早在16世纪,意大利学者卡丹与塔塔里亚等人就已从数学角度研究过赌博问题。他们的研究除了赌博外还与当时的人口、保险业等有关,但由于卡丹等人的思想未引起重视,概率概念的要旨也不明确,于是很快被人淡忘了。 概率论的早期研究大约在十六世纪到十一七世纪之间。(若考虑到概率与统计在早期难于区分的辜实,它的历史可远溯到许多世纪之前。根据科学史记载,在1390年就有人讨论过掷般子的问题,若把文明古国的抽签活动也加以考虑,还可有更早的史料。)这段期间,欧洲进入文艺复兴时期,工业革命已开始蔓延。伴随工业发展提出的误差问题,伴随航海事业发展产生的天气预报问题,伴随商业发展而产生的贸易、股票、彩票和银行、保险公司等,加之人们越来越需要了解的患病率、死亡率、灾害规律等问题,急需创立一门分析研究随机现学学科。概享论应社会实践的需要出现了。 在这个时期,意大利著名物理学家伽俐略就曾对物理实验中出现的误差进行了科学的研究,把误差作为一种随机现象,并估计了他们产生的概率。十八世纪,概率论发展很快,几乎初等概率的全部内容都在这个期间形成。在这个期间,概率论工作者已经不是孤立地、静止地研究事件发生的概率,而是把随机现象视为一种特殊的变量——随机变量。随机变量的引入,数学家如鱼得水,他们利用各种数学工具,研究随机变量的分布,从而使概率论的研究得到了一次飞跃。在整个十八世纪和十九世纪初叶,概率论风行一时。但是,由于一些学者过分夸大了它的作用,许多人企图把它应用到诸如诉讼之类的“精神”或“道德”的科学上去,遭到了失败。这以后,欧洲的一些数学家认为概率论只是一种数学游戏,不可能有重大的具有科学根据的应用。甚至概率论在气体动力论、误差论、射击论等方面的卓有成效的应用也因此而受到忽视。这些错误后来被形容为“数学诞语”,导致概率论的发展在西欧较长的一段时间(十九世纪下半叶)出现停滞。虽然概率论在这段时期走了一段弯路,但它的发展仍是主流。在这个时期,概率论工作者较好地应用数学工具,使概率论的理论更加严密,基本上完成了概率论作为数学的一个分支应具备的条件。二十世纪以来,由于公理化体系的建立,使得概率论的理论更加完备。另外,极限理论的研究取得了一系列的结果。随机过程,数理统计从概率论中独立出来,成为两门生命力极强的新学科。概率的应用性越来越显示出来,产生了应用概率的研究分支,并由此滋生出许多分支。概率论与其它学科相结合,又出现了不少边缘学科。

概率论大数定律及其应用

概率论大数定律及其应 用 Revised as of 23 November 2020

概率论基础结课论文 题目:独立随机序列的大数事件的定理与应用 作者 摘要:历史上第一个定理属于,后人称之为“”。概率论中讨论的向的定律。概率论与数理的基本定律之一,又称弱大数理论。 大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,是随机现象统计规律性的具体表现,应用很广泛。本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。 关键词:弱大数定理伯努利大数定理随机变量数学期望概率 引言:“大数定律”本来是一个数学概念,又叫做“平均法则”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗的说,这个定律就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。比如,我们向上抛一枚硬币,硬币落下时哪一面朝上本身是偶然的,但当我们向上抛的硬币的次数足够多时,达到上万次甚至几十万几百万时之后,我们就会发现,硬币朝上的次数大约占总数的二分之一。偶然之中包含着必然。 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近,人们在实践中观察其他的一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的个别特征无关,而且结果也不再是随机的。深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么在什么条件下具有稳定性这就是我们大数要研究的问题。

概率论(复旦三版)习题五答案

概率论与数理统计(复旦第三版) 习题五 答案 1.一颗骰子连续掷4次,点数总和记为X .估计P {10

10.760.840.9.n i i X P n =??????≤ ≤≥???????? ∑ 根据独立同分布的中心极限定理得 0.8n i X n P ??-??≤≤???? ∑ 0.9,=Φ-Φ≥ 整理得 0.95,10?Φ≥ ?? 查表 1.64,≥ n ≥268.96, 故取n =269. 3. 某车间有同型号机床200部,每部机床开动的概率为0.7,假定各 机床开动与否互不影响,开动时每部机床消耗电能15个单位. 问至少供应多少单位电能才可以95%的概率保证不致因供电不 足而影响生产. 【解】设需要供应车间至少15m ?个单位的电能,这么多电能最多能 同时供给m 部车床工作,我们的问题是求m 。 把观察一部机床是否在工作看成一次试验,在200次试验中, 用X 表示正在工作的机床数目,则~(200,0.7)X B , ()2000.7140, ()(1)2000.70.342,E X np D X np p ==?==-=??= 根据题意,结合棣莫弗—拉普拉斯定理可得 0.95{}P X m P =≤=≤=Φ

概率论论文-浅谈中心极限定理

浅谈中心极限定理 摘要:中心极限定理的产生具有一定的客观背景,最常见的是林德伯格-莱维中心极限定理和棣莫弗-拉普拉斯中心极限定理。它们表明了当n 充分大时,方差存在的n 个独立同分布的随机变量和近似服从正态分布,在实际中的应用相当广泛。本文讨论了中心极限定理的内涵及其在生活实践中的应用。 关键词:中心极限定理;正态分布;生活中的应用。 引言:在实际问题中,常常需要考虑许多随机因素所产生的总的影响,如测量误差、炮弹 射击的落点与目标的偏差等。同时许多观察表明,若一个随机变量是由大量相关独立的随机因素的综合影响所构成的,而其中每一个随机因素的单独作用是微小的,则这样的随机变量通常是服从或近似服从正态分布。这种现象就是中心极限定理产生的客观背景。 在概率论与数理统计中,中心极限定理是非常重要的一节内容,而且是概率论与数理统计之间承前启后的一个重要纽带。王勇老师讲到中心极限定理时,曾非常激动地说这个定理一被提出便震惊了全世界,而且重复了数遍。由此足以见得中心极限定理的重要性。 目前我们研究的是独立同分布条件下的中心极限定理: 林德伯格-莱维中心极限定理:设 {}n X 是独立同分布的随机变量序列,且 )(,)(2>==σμi i X Var X E 存在,若记 n n X Y n i i n σμ -= ∑=1 则对任意实数y ,有 {}? ∞ --∞ →=Φ=≤y t n n t y y Y P .d e π21)(lim 2 2 这个中心极限定理是由林德伯格和莱维分别独立的在1920年获得的,定理告诉我们, 对于独立同分布的随机变量序列,其共同分布可以是离散分布,也可以是连续分布,可以是正态分布,也可以是非正态分布,只要其共同分布的方差存在,且不为零,就可以使用该定理的结论。只有当n 充分大时, n Y 才近似服从标准正态分布)1,0(N ,而当n 较小时,此种 近似不能保证。也就是说,在n 充分大时,可用)1,0(N 近似计算与n Y 有关事件的概率,而 n 较小时,此种计算的近似程度是得不到保障的。当 ) 1,0(~N Y n 时,则有 ) , (~),,(~2 2 1 n N X n n N X n i i σμσμ∑=。 现如今旅游、汽车等行业越来越受欢迎。在这些行业中就会用得到中心极限定理。 例如,某汽车销售点每天出售的汽车服从参数为λ=2的泊松分布,若一年365天都经

概率论与数理统计重点总结及例题解析

概率论与数理统计重点总结及例题解析 一:全概率公式和贝叶斯公式 例:某厂由甲、乙、丙三个车间生产同一种产品,它们的产量之比为3:2:1,各车间产品的不合格率依次为8%,9%, 12% 。现从该厂产品中任意抽取一件,求:(1)取到不合格产品的概率;(2)若取到的是不合格品,求它是由甲车间生产的概率。(同步45页三、1) 解:设A1,A2,A3分别表示产品由甲、乙、丙车间生产,B表示产品不合格,则A1,A2,A3为一个完备事件组。P(A1)=1/2, P(A2)=1/3, P(A3)=1/6, P(B| A1)=0.08,P(B| A2)=0.09,P(B| A3)=0.12。 由全概率公式P(B) = P(A1)P(B|A1)+ P(A2)P(B| A2)+ P(A3)P(B| A3) = 0.09 由贝叶斯公式:P(A1| B)=P(A1B)/P(B) = 4/9 练习:市场上出售的某种商品由三个厂家同时供货,其供应量第一厂家为第二厂家的2倍,第二、三两厂家相等,而且第一、二、三厂家的次品率依次为2%,2%,4%。若在市场上随机购买一件商品为次品,问该件商品是第一厂家生产的概率是多少?(同步49页三、1)【0.4 】

练习:设两箱内装有同种零件,第一箱装50件,有10件一等品,第二箱装30件,有18件一等品,先从两箱中任挑一箱,再从此箱中前后不放回地任取2个零件,求:(同步29页三、5) (1)取出的零件是一等品的概率; (2)在先取的是一等品的条件下,后取的仍是一等品的条件概率。 解:设事件i A ={从第i 箱取的零件},i B ={第i 次取的零件是一 等品} (1)P(1 B )=P(1 A )P(1 B |1 A )+P(2 A )P(1 B |2 A )=5 230 182150 10 21= + (2)P(1 B 2 B )= 194 .02121230 2 182 50 2 10=+ C C C C ,则P(2 B |1 B )= ) ()(121B P B B P = 0.485 二、连续型随机变量的综合题 例:设随机变量X 的概率密度函数为 ?? ?<<=others x x x f 02 0)(λ 求:(1)常数λ;(2)EX ;(3)P{1

最新概率论的起源和发展简史

概率论地起源和发展简史 1引言 现实世界中形形色色地自然现象、社会现象大致可分为两类:一类是事先能确定其结果地现象,即确定性现象,如今天太阳必然会落下去,同性电荷互相排斥等。另一类是事先不能确定其结果地现象为随机现象,这类现象地可能结果不会是一种,如同品种种子播种到肥力均匀地田地里,每粒种子是否发芽、掷一枚骰子,可能结果有6种等,这种随机现象是否有规律,便成为数学研究中地一个问题。概率论就是运用数学方法研究随机现象统计规律性地一门数学学科。概率, 简单地说,就是随机现象出现地可能性大小地一种度量。 2 概率论地起源和发展简史 概率论同其他数学分支一样,是在一定地社会条件下,通过人类地社会实践和生产活动发展起来地一种智力积累.它发源于17世纪中叶,并且是与惠根斯、巴斯加尔、及雅谷、贝努里诸人地名字分不开地。对概率论地兴趣,本来是由于保险事业地发展而产生地,但刺激数学家思考概率论地一些特殊问题却是来自赌博者地请求。《论赌博中地计算》一书,这是概率论最早地论著。概率论虽然起于17世纪,但为此准备基础却是较早地事。例如卡当在其《论赌博》一书中已计算了掷两颗或三颗骰子时在一切可能方法中有多少方法得到某一总点数。17、18世纪之交,有不少数学家从事概率地研究,伯努里地巨著《猜度术》是一项重大地成就,其中包含概率论中地“伯努里定理”,这是“大数定律”地最早形式。 德莫瓦佛地《机会地学说》包含“德莫佛—拉普拉斯定理”。在概率论地系统理论产生之前,许多数学家已认识到了很多实际问题中地随机变量都是由大量相互独立因素综合影响形成地。而其中每一个个别地因素在总地影响中地作用都是很

微小地,这样形成地随机变量往往近似服从正态分布,从理论上来证明这个事实是一个中心问题,概率论就是围绕这个中心发展起来地。 2.1概率论地起源 概率论起源于对赌博问题地研究。早在16世纪,意大利学者卡丹与塔塔里亚等人就已从数学角度研究过赌博问题。他们地研究除了赌博外还与当时地人口、保险业等有关,但由于卡丹等人地思想未引起重视,概率概念地要旨也不明确,于是很快被人淡忘了。 点数问题地圆满解决标志着概率论地创立.所谓点数问题是:A,B赌博,其技巧相当,约定谁先胜s局则获全部赌金.若当A胜s1局而B胜s2局时(s1s2则A除取回自己赌金还要取B赌金地(s1-s2)/s.假设二人地赌金相等,则分配比例为[s+(s1-s2)]/[s-(s1-s2)]。1603年,弗雷斯坦尼给出分配规则:首先A和B各按s1/(2s-1)和s2/(2s-1)地比例来分配赌金,然后再把余下地赌金平均分配,其分配比就是把塔塔利亚结果中地s代换成2s-1. 在这些求解中,只有卡尔达诺意识到分配原则不应依赖于(s,s1,s2)而应和赌徒离全胜所 差地局数a=s-s1和b=s-s2有关[2]. 为解决点数问题,帕斯卡与费马在1654年7月-10月通信七封.在7月29日帕斯卡写给费马地信中,圆满解决了点数问题.故概率论史家视其为概率论诞生地日子[3].

相关文档
相关文档 最新文档