文档视界 最新最全的文档下载
当前位置:文档视界 > 3二项分布、泊松分布与泊松逼近

3二项分布、泊松分布与泊松逼近

二项分布、泊松分布与泊松逼近

雅各布·伯努利与二项分布公式

雅各布·伯努利(Jacob Bernoulli,1654—1705)来自数学史上的传奇家族—瑞士巴塞尔的伯努利家族,该家族的三代成员中产生了8位数学家,在17世纪和18世纪微积分理论及应用的发展中占有领先地位,雅各布·伯努利是其家族第一代数学家中的第一位,他与弟弟约翰·伯努利(Johann Bernoulli,1667—1748)、侄子丹尼尔·伯努利(Daniel Bernoulli,1700—1782)在数学史上享有声誉。

家族简介

在科学史上,父子科学家、兄弟科学家并不鲜见,然而,在一个家族跨世纪的几代人中,众多父子兄弟都是科学家的较为罕见,其中,瑞士的伯努利(也译作贝努力、伯努利)家族最为突出。

伯努利家族3代人中产生了8位科学家,出类拔萃的至少有3位;而在他们一代又一

3二项分布、泊松分布与泊松逼近

代的众多子孙中,至少有一半相继成为杰出人物。伯努利家族的后裔有不少于120位被人们系统地追溯过,他们在数学、科学、技术、工程乃至法律、管理、文学、艺术等方面享有名望,有的甚至声名显赫。最不可思议的是这个家族中有两代人,他们中的大多数数学家,并非有意选择数学为职业,然而却忘情地沉溺于数学之中,有人调侃他们就像酒鬼碰到了烈酒。

老尼古拉·伯努利(Nicolaus Bernoulli,公元1623~1708年)生于巴塞尔,受过良好教育,曾在当地政府和司法部门任高级职务。他有3个有成就的儿子。其中长子雅各布(Jocob,公元1654~1705年)和第三个儿子约翰(Johann,公元1667~1748年)成为著名的数学家,第二个儿子小尼古拉(Nicolaus I,公元1662~1716年)在成为彼得堡科学院数学界的一员之前,是伯尔尼的第一个法律学教授。

雅各布·伯努利

1654年12月27日,雅各布·伯努利生于巴塞尔,毕业于巴塞尔大学,1671年17岁时获艺术硕士学位。这里的艺术指“自由艺术”,包括算术、几何学、天文学、数理音乐和文法、修辞、雄辩术共7大门类。遵照父亲的愿望,他于1676年22岁时又取得了神学硕士学位。然而,他也违背父亲的意愿,自学了数学和天文学。1676年,他到日内瓦做家庭教师。从1677年起,他开始在那里写内容丰富的《沉思录》。

1678年和1681年,雅各布·伯努利两次外出旅行学习,到过法国、荷兰、英国和德国,接触和交往了许德、玻意耳、胡克、惠更斯等科学家,写有关于彗星理论(1682年)、重力理论(1683年)方面的科技文章。1687年,雅各布在《教师学报》上发表数学论文《用两相互垂直的直线将三角形的面积四等分的方法》,同年成为巴塞尔大学的数学教授,直至1705年8月16日逝世。

1699年,雅各布当选为巴黎科学院外籍院士;1701年被柏林科学协会(后为柏林科学院)接纳为会员。

许多数学成果与雅各布的名字相联系。例如悬链线问题(1690年),曲率半径公式(1694年),“伯努利双纽线”(1694年),“伯努利微分方程”(1695年),“等周问题”(1700年)等。

雅各布对数学最重大的贡献是在概率论研究方面。他从1685年起发表关于赌博游戏中输赢次数问题的论文,后来写成巨著《猜度术》,这本书在他死后8年,即1713年才得以出版。

最为人们津津乐道的轶事之一,是雅各布醉心于研究对数螺线,这项研究从1691年就开始了。他发现,对数螺线经过各种变换后仍然是对数螺线,如它的渐屈线和渐伸线是对数螺线,自极点至切线的垂足的轨迹,以极点为发光点经对数螺线反射后得到的反射线,以及与所有这些反射线相切的曲线(回光线)都是对数螺线。他惊叹这种曲线的神奇,竟在遗嘱里要求后人将对数螺线刻在自己的墓碑上,并附以颂词“纵然变化,依然故我”,用以象征死后永生不朽。

约翰·伯努利

雅各布·伯努利的弟弟约翰·伯努利比哥哥小13岁,1667年8月6日生于巴塞尔,1748年1月1日卒于巴塞尔,享年81岁,而哥哥只活了51岁。

约翰于1685年18岁时获巴塞尔大学艺术硕士学位,这点同他的哥哥雅各布一样。他们的父亲老尼古拉要大儿子雅各布学法律,要小儿子约翰从事家庭管理事务。但约翰在雅各布的带领下进行反抗,去学习医学和古典文学。约翰于1690年获医学硕士学位,1694年又获得博士学位。但他发现他骨子里的兴趣是数学。他一直向雅各布学习数学,并颇有造诣。1695年,28岁的约翰取得了他的第一个学术职位——荷兰格罗宁根大学数学教授。10年后的1705年,约翰接替去世的雅各布任巴塞尔大学数学教授。同他的哥哥一样,他也当选为巴黎科学院外籍院士和柏林科学协会会员。1712、1724和1725年,他还分别当选为英国皇家学会、意大利波伦亚科学院和彼得堡科学院的外籍院士。

约翰的数学成果比雅各布还要多。例如解决悬链线问题(1691年),提出洛必达法则(1694年)、最速降线(1696年)和测地线问题(1697年),给出求积分的变量替换法(1699年),研究弦振动问题(1727年),出版《积分学教程》(1742年)等。

约翰与他同时代的110位学者有通信联系,进行学术讨论的信件约有2500封,其中许多已成为珍贵的科学史文献,例如同他的哥哥雅各布以及莱布尼茨、惠更斯等人关于悬链线、最速降线(即旋轮线)和等周问题的通信讨论,虽然相互争论不断,特别是约翰和雅各布互相指责过于尖刻,使兄弟之间时常造成不快,但争论无疑会促进科学的发展,最速降线问题就导致了变分法的诞生。

约翰的另一大功绩是培养了一大批出色的数学家,其中包括18世纪最著名的数学家欧拉、瑞士数学家克莱姆、法国数学家洛必达,以及他自己的儿子丹尼尔和侄子尼古拉二世等。

3二项分布、泊松分布与泊松逼近

雅各布·伯努利的父亲为他规划的人生道路是做神职人员,但他的爱好却是数学,他靠自学掌握了莱布尼茨的微积分学,并且从1687年直到去世一直担任巴塞尔大学数学教授。雅各布·伯努利是与牛顿、莱布尼茨

3二项分布、泊松分布与泊松逼近

3二项分布、泊松分布与泊松逼近

和惠更斯同时代的人物,雅各布·伯努利与他们都保持密切的通信联系并曾仔细研读了惠更斯的《机遇规律》,由此对概率论产生兴趣。

从雅各布·伯努利与莱布尼茨的通信可知,他是在其生命的最后两年里写作其划时代的著作《推测术》的。这部概率论发展史上里程碑式的著作在雅各布·伯努利去世时尚未整理定稿,而且由于伯努利家族内部的问题,该书在1713年才得以出版。这部著作共239页,分为4部分。其中,第一部分是对《机遇的规律》的注解;第二部分是关于排列组合的系统论述;第三部分则是利用前面的知识讨论一些赌博问题 这三部分是以往概率论知识的系

统化和深化;第四部分是关于概率论在社会、道德和经济领域中的应用,其中包括了该书的精华、奠定了该书在概率史上不朽地位的“伯努利大数定律”。

《推测术》之前的那些概率论著作多是讨论具体的赌博取胜概率的计算,相比之下,《推测术》与现代教科书的编写模式类似,更着重指导这种计算的一般规律及其数学证明,并以数字实例来解释其应用。例如,在论及有重复操作的博弈??例如在一局赌博中涉及将一颗骰子掷五次时,他指出在每次重复中所涉及的事件概率不变,且各次重复相互独立。前人的著作中也是默认这一点的,但雅各布·伯努利第一个将其明确指出,因此,如今符合这种条件的实验模型称为伯努利概型。雅各布·伯努利还明确表述了独立事件的概率乘法定理,并在此基础上严格证明了二项概率分布公式(n k

)p k q n?k 的精确值相当困难。因此。18世纪前期的许多数学家们,一直在寻找近似计算二项概率分布的方法。这些努力产生了丰硕的成果,其中特别重要的事棣莫弗和泊松的工作。

棣莫弗与二项概率的正态逼近

棣莫弗(Abraham De Moivre ,1667—1754)出生于法国一个新教徒家庭。他从11岁到14岁在新教徒中级学校接受古典文学教育;1681年学校关闭以后,转学并开始学习惠更斯的概率著作、物理学以及从欧式机和开始的标准教学课程。1865年南特法令废除后不久,棣莫弗因为宗教信仰被捕入狱。1688年4月重获自由后,他随即永久离开法国前往英国。在英国,棣莫弗掌握了牛顿的流数术并开始了自己的创造性工作,他谋生的手段除了做家庭教师,就是为赌徒或投机商解决机会游戏或年金保险中出现的问题,由此在数学领域内取得了多方面的成就,并于1697年当选为英国皇家学会会员。

1718年,棣莫弗出版了《机遇论》(Doctrine of Chance,或译为《机遇原理》 )。该书在1738年和1756年两次再版,书中给出了二项分布公式、斯特林公式、正态分布、棣莫弗-拉普拉斯中心极限定理、弱大数定律(伯努利大数定律)、概率积分、正态频率曲线等重要内容,还首次定义了独立事件的乘法定理等。该书与伯努利的《推测术》以及拉普拉斯的《分析概率论》并称为概率论发展早期3部里程碑式的著作,奠定了棣莫弗在概率论历史上的地位。棣莫弗在二项概率分布的近似计算方面取得了重要突破:他提出了正态概率密度函数,给出了二项分布的正态逼近。

有趣的是,吸引棣莫弗投身到二项概率分布研究的契机并不是伯努利的工作,而是下述偶然事件:1721年,有一个名叫亚历山大·喀明的人向棣莫弗提出了这样一个问题:甲乙两人在丙家进行赌博,每局甲胜出的概率为p ,乙胜出的概率为q =1- p 。赌N 局,以X 表示甲获胜的局数,并约定:若X ≥N p ,则甲付给丙X —Np 元,若X Nq ,则乙付给丙(N —X )—Nq =Np —X 元。问丙平均获利多少元?

答案是丙平均获利为

D N =∑|i ?Np |N i=1b(N,p,i)

这里,b(N,p,i)=(N i

)p i q N?i 就是一个二项概率。棣莫弗在Np 为整数的条件下得到 D N =2 Npq b(N,p,Np)

但他只对p =1/2的特例给出了证明,不过他的证法容易推广到p 为一般值的情况下。棣莫弗说他是在1721年得到上述公式的,但证明的首次公开发表是在1730年的。尽管回答了喀明提出的问题,但由于N 比较大时,b(N,p,i)的值不易计算,因此棣莫弗希望找到一个

便于计算的近似公式。

1809年,德国数学家高斯(Johann Carl Friedrich Gauss ,1777—1855)在其数学和天体力学名著《绕日天体运动的理论》中指出测量误差服从正态分布,之后人们发现正态分布在自然界和社会实践中极为常见。例如,炮弹落点、农作物产量、工厂产品的许多数量指标(直径、长度、宽度、高度等)、人的许多生理尺寸(身高、体重等)以及各种各样的心理学测试分数和物理现象比如光子计数等都近似服从正态分布。因此,高斯的这项工作对后世影响极大,它也使正态分布同时有了“高斯分布”的名称。一般来说,如果影响某个数量指标的随机因素很多,而每个因素所起的做用都不大,那么这个数量指标就服从或近似服从正态分布。这一点我们将在第五章加以证明。正态分布具有许多良好的性质,很多分布可以用正态分布来近似,还有一些分布可以通过正态分布导出。因此,正态分布是概率论中最重要的一种分布,在应用及理论研究中占有头等重要的地位。

泊松逼近与泊松分布

法国数学家泊松(Sim éon-Denis Poisson ,1781—1840)

3二项分布、泊松分布与泊松逼近

3二项分布、泊松分布与泊松逼近

的名字对于学习概率论的人来说可谓是耳熟能详,主要原因就是我们在2.2节中介绍的泊松定理(二项分布的泊松逼近)和泊松分布。

泊松的父亲是退役军人,退役后在村里作小职员,法国大革命爆发时任村长。泊松最初奉父命学医,但他对医学并无兴趣,不久便转向数学。他于1798年进入巴黎综合工科学校,成为拉格朗日(Joseph-Louis Lagrange ,1735—1813)和拉普拉斯的得意门生。毕业时,他由于学业优异且得到拉普拉斯的大力推荐而留校任教。1812年当选为法国科学院院士,1826年被选为彼得堡科学院名誉院士,1837年被封为男爵。

泊松的科学生涯开始于研究微分方程及其在摆的运动和声学理论中的应用。他工作的特色是应用数学方法研究各类力学和物理问题,并由此得到数学上的发现。他对积分理论、行星运动理论、热物理、弹性理论、电磁理论、位势理论和概率论都有重要贡献。作为19世纪概率统计领域里的卓越人物,泊松改进了概率论的运用方法,特别是用于统计方面的方法,泊松是从法庭审判问题出发研究概率论的。1837年,他出版了专著《关于刑事案件和民事案件审判概率的研究》(Recherches sur la probabilit é d és jugements enmati ère criminelle

et

mataère civile,précedés des règles du calcul des probabilités)。正是在这部著作中,泊松给出了著名的泊松逼近公式

lim N→+∞b(N,p,k)=e?λλk

k!,λ=lim

N→+∞

Np

该公式适用于p很小,N很大,而Np不太大的情况,这正好填补了棣莫弗公式的不足,因为棣莫弗公式只适用于p不太接近于0或1的情况。不过,从历史上看,棣莫弗在1712年已经实质上作出了这个结果,只是形式更复杂一些,而且也没有将它作为公式单独提出,因此没能取得这一公式的优先权。

泊松分布是伴随着泊松逼近公式、作为大量试验(N很大)中稀有事件(p很小)出现的概率的数学模型进入概率论的,然而近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的分布之一,其原因主要是以下两点:

首先,人们发现许多随机现象都服从或近似服从泊松分布,这种情况特别集中在两个领域中,一是社会生活,对服务的各种要求,如某电话交换台收到的呼叫数、来到某公共汽车站的乘客数等都近似服从泊松分布,因此泊松分布在运筹学和管理科学中占有很突出的地位;另一领域是物理学,放射性物质发射出的粒子数、热电子的发射数等都服从泊松分布。另外,机器出现的故障、各类事故、自然灾害等也都服从泊松分布。

其次,对泊松分布的深入研究(特别是随机过程的研究)已经发现泊松分布具有许多特殊的性质和作用,人们甚至感觉到泊松分布有些像是构造随机现象的“基本粒子”之一。

需要指出的是,对二项概率近似计算的探讨不仅导出了正态分布和泊松分布这两种极其重要的分布,而且还推进了大数定律和中心极限定理的研究。其次,对二项分布中未知概率的推断问题的探讨,还在18世纪中叶导致了贝叶斯推断思想的建立,如今这种思想已经发展成为数理统计学中的重要学派 贝叶斯学派。另外泊松过程是随机过程论的重要组成部分。因此,从这种意义上说,二项分布是概率论、数理统计和随机过程知识的重要增长点。