文档视界 最新最全的文档下载
当前位置:文档视界 › 概率论与数理统计简明教程

概率论与数理统计简明教程

概率论与数理统计简明教程
概率论与数理统计简明教程

引言形形色色的概率统计问题

人们在日常生活和生产实践活动中,都会遇到这样或那样的随机现象;下面是其中一些有趣的问题。先从赌博说起。事实上,概率论正是起源于17世纪的赌博问题。由于赌博的趣味性和吸引力,使得概率论能够发展至今。请看概率论的第一个问题:

问题0.1:甲乙两人打赌,各押硬币的一面,先出现6次者赢100法郎。当赌博进行到5:3时因故终止,试问应如何分配赌金?

有人说:甲应该得到全部的100法郎,因为这个赌博只有两种结果,而现在甲领先;

又有人说:既然比分是5:3,那么甲应该得到赌金的5/8,乙得另外的3/8。你以为呢?

下面的三颗骰子赌博机问题盛行于狂欢节时的美国中西部和英格兰:

问题0.2:你从1到6之中选取一个数字(比如6),然后机器掷出三颗骰子。如果三颗骰子出现的三个数字都是你选取的数字6,机器会支付你3美元;如果三颗骰子的数字中有两个6,机器会支付你2美元;如果三颗骰子的数字中仅有一个6,机器会支付你1美元。只有当你选取的数字没有出现时,你才需要付给它钱——仅仅1美元。好象这个游戏看起来挺吸引人的,因为掷三颗骰子,你有三个机会能赢,并且有时你可赢取1美元以上,而1美元则是你的最大损失。请问你愿意赌吗?说说你的理由!

在概率统计中,直觉是很重要的,我们常常凭直觉就能得到正确的结论。但是在好多情况下,直觉会让人误入歧途。我们给出的第3个问题大家也许曾经亲眼见到或有所耳闻:问题0.3:一个人有三张牌,一张两面都是黑色,一张两面都是红色,一张一面是黑色一面是红色。他将这三张牌放到帽子里,让你抽一张,但你只能看这张牌的一面。假定这面是红色,则这张牌肯定不是两面黑色,只能是两面红色或一面红一面黑。他提议和你来场赌博,他赌这张牌是两面红,赔率是1赔1。你认为公平吗?

问题0.4:历史上有名的“生日问题”同样说明“直觉”有时真的不是很可靠!假定一年有365天,则由著名的抽屉原理可知,任意366人中至少有两人同一天生日。也就是说,需要366人,才能保证其中至少有两人同一天生日。但是现实生活中,大家可能留意到一个事实:一个47人的班级几乎就有两人同一天生日!这样的结果相信足以引起多数读者好奇的。这又是怎么回事呢?后面的古典概率模型将给出合理的解释。

问题0.5:“熊”了几年的中国股市近两年狂“牛”,许多对股票几乎一窍不通的老人家也前赴后继地投身到股市的洪流中。如果你是一个股民,也知道股市存在风险,自然希望能得到专家的帮助。但问题是,究竟谁可以算是股市行家呢?如果连续6个星期,你都收到某股市顾问对某种股票行情(上升或下降)正确预言的邮件,那么这名顾问要求你为第七个星期中这样的预言付费,你愿意吗?

问题0.6:这是一个医学诊断问题,更应该是一个生活常识。有点医学知识的人也许知道,用甲胎蛋白法诊断肝癌,准确性是比较高的:由过去的资料估计灵敏度(即癌症患者检测结果呈阳性的概率)是95%、特异度(即正常人检测结果呈阴性的概率)是90%。如果在某次例行检查(譬如单位每年一度的体检)中,某人的检验结果是阳性,试问:他应该沮丧到什么程度?

问题0.7:可预见的梦和巧合问题:

一个人做过一个梦,而梦中的事在现实中出现时,他很难不再相信有预感的存在。你以为呢?

如果有两个人有难以置信的一系列相同的经历,而发生这种巧合的概率是一万亿分之一(1/1012),我们是否应该诧异呢?

问题0.8:敏感性问题调查:为确定什么样的性行为最容易导致爱滋病,需要了解人群中进行过某种性行为的人所占的比例。试问:如何设计调查方案?

解答这些形形色色的概率统计问题,需要有足够的概率统计知识。我们从基础开始。

第一章 随机事件及其概率

一、 随机事件及其运算

我们把随机现象的某个结果称为随机事件,所有可能基本结果组成的集合称为样本空间, 记为?。于是,随机事件可以看成是样本空间的元素。借用集合论的概念,事件经过运算之后得到新的事件:

1. 事件A 与B 的并A ∪B 表示“A 与B 中至少有一件发生”;

2. 事件A 与B 的交A ∩B 表示“A 与B 都发生”,简记为AB ;

3. n 个事件的并

12,,,n A A A L 1n i i A =U 表示“n 个事件中至少有一件发生”; 12,,,n A A A L 4. n 个事件的交12,,,n A A A L 1n

i i A =I 表示“n 个事件都发生”。 12,,,n

A A A L 5. 事件A 的对立称为A 的对立事件,记为

B A =。

事件的运算遵循下面的规律,如同集合论一样:

(1)交换律:,A B B A =U U AB BA =;

(2)结合律:()()A B C A B C =U U U U ()(),AB C A BC =;

(3)分配律:()A B C AB AC =U U ,()()()A BC A B A C =U U U ;

(4)对偶律:I U +∞=+∞==11k k k k

A A ;U I +∞=+∞==11k k k k A A 。

事件之间还有下列关系:

1. 包含:

若事件A 的发生必然导致事件B 的发生,则称事件B 包含事件A ,记为B A ?。

2. 相等:

当事件B 包含事件A 且事件A 也包含事件B 时,则称事件A 与B 相等,记为A =B 。

3. 互不相容(或互斥)

若两事件A 与B 不可能同时发生,即AB =φ,则称事件A 与B 互不相容。

二、 随机事件的概率与条件概率

随机事件可能发生,也可能不发生。我们无法预测随机事件是否发生,只能考虑随机事件发生的可能性的大小。直观上说,随机事件发生的可能性大小就称为随机事件的概率. 那么如何求随机事件的概率?下面是一非常简单的问题:

问题1.1:如何求抛一硬币时正面朝上的概率?

比较直观的方法就是重复做试验,这就是人们常说的频率方法(统计方法): 重复抛一均匀硬币n 次,则当n 充分大时,正面朝上的频率m/n 可作为概率p 的估计. 一般地,独立重复试验n 次,当n 充分大时,可把事件A 出现的频率n A A f n n )

()(μ=作

为A 的概率P (A )的近似值。这是由大数定律保证的。

但是,统计方法只能得到概率P (A )的近似值。实际上,在许多情况下,我们可以通过建立数学模型来求概率的准确值。古典概型是常见的一种概率模型。

数学模型是在一定的假设条件下建立起来的。为了利用古典概型解决上面的问题,需要对硬币作些假设。通常假定硬币是均匀的,这就意味着结果出现正面和反面的可能性是一样的,于是满足古典概型的要求。按照古典概型中概率的计算方法,我们马上得到抛一均匀硬币时正面朝上的概率p=1/2.

一般地,我们把满足下面两个条件的概率模型称为古典概型:

(1)样本空间只包含有限个不同的基本事件;

(2)每个基本事件出现的可能性相等.

在古典概型中,如果基本事件总数为N ,事件A 所包含的基本事件数为M (M N ≤),则 ()M P A N

=。 利用古典概型,我们比较容易解决第一节中的“生日问题”。

问题0.4:一个47人的班级为什么几乎就有两人同一天生日?

同上面一样,为了利用古典概型解决问题,需要对问题作些假设。一般的假设条件就是:对任何人来说,他在一年中的每一天出生的可能性都是一样的。在这样的模型假设下,问题就变成古典概率模型中的概率计算问题了。于是,任意47人中至少有两人同一天生日的概率为%5.95365

14747365=?=P p ;这样大概率的事件我们可以认为它应该发生。这就是在古典概率模型下我们对“生日问题”给出的看起来还算合理的解释。

有读者或许要问,你怎么可以作上面那样的假设,认为任何人在一年中的每一天出生的可能性都是一样?一方面是直觉,好象没有太多原因说明一年中的哪一天出生的人数比其它时候多一些。另一方面,我们可以通过收集真实的数据,对古典概率模型的假设进行统计检验。建议有兴趣的读者自己亲自动手实践一下。

在大多数场合,人们需要考虑所谓的条件概率,它是指事件B 已经发生的条件下,事件A 发生的概率,记作(|)P A B 。先看下例:

问题0.1:甲乙两人打赌,各押硬币的一面,先出现6次者赢100法郎。当赌博进行到5:3时因故终止,试问应如何分配赌金?

有人说:甲应该得到全部的100法郎,因为这个赌博只有两种结果,而现在甲领先。这种分法显然不大合理,因为暂时的领先并不足以保证最后的胜利。法国数学家、哲学家Pascal 首先解决了这个问题:考虑比分是5:3的条件下,甲乙两人能赢的可能性分别有多大。 事实上,最多再扔三次硬币赌博就可以分出输赢。在所有可能的8种结果中只有1种情况乙赢,在硬币是均匀的条件下概率是1/8;因此乙只能得到赌金的1/8,甲应得7/8。 本例是直接利用古典概型求条件概率的。但有时,看似简单的问题反而容易让人上当。 问题0.3:一个人有三张牌,一张两面都是黑色,一张两面都是红色,一张一面是黑色一面是红色。他将这三张牌放到帽子里,让你抽一张,但你只能看这张牌的一面。假定这面是红色,则这张牌肯定不是两面黑色,只能是两面红色或一面红一面黑。他提议和你来场赌博,他赌这张牌是两面红,赔率是1赔1。你认为公平吗?

乍一看,好象公平:这张牌有两种可能,他赌其中一种,你猜另一种。但骗人的地方就在于,你只有一种情况(这张牌看见的那面是“红黑”牌的红面)能赢,而他却有两种情况(这张牌看见的那面是“红红”牌的一面或另一面)能赢,因此他赢的概率为2/3,不公平。 *三、概率的公理化定义

上面的概率和条件概率的概念都是直观意义上的,现在给出它们的公理化定义如下:

1.设?为样本空间,F 为?的某些子集构成的事件域,称F 上的实值函数P 为概率,如果

(1) P (?)=1; (2) 若A ∈F ,则P (A )≥0 ;

(3) 若A 1, A 2,…, A n ,…互不相容,则 。 ∑+∞

=+∞==11)()(k k

k k A P A P U 三位一体的(?,F ,P )称为概率空间,它可作为描述随机现象的数学模型。

2.设,则在事件B 已发生的条件下, 事件A 的条件概率定义为

()0P B >()(|)()

P AB P A B P B =

。 四、概率的性质和基本计算公式:

1. 不可能事件的概率为0,即 0)(=φP ; 2. 概率的有限可加性:若A 1, A 2,…, A n 互不相容,则 ; ∑===n

k k n k k A P A P 11)()(

U 3. 概率的单调性:若B A ?,则)()(B P A P ≤; 4. 概率的下连续性:; U L L +∞

=+∞→=????1

21)()(lim ,k k

k k k A P A P A A A 则若概率的上连续性:; I L L +∞=+∞→=????1

21)()(lim ,k k

k k k A P A P A A A 则若

5. 对立事件的概率计算公式:)(1(A P A P ?=; 6. 概率的加法公式:; ()()()()P A B P A P B P AB =+?U 7. 概率的乘法公式: ,如果。

()()(|)P AB P B P A B =()0P B >8. 全概率公式: ,如果,)|()()(1i

i i B A P B P A P ∑+∞==Ω=+∞=U 1i i B i j B B φ=(i )

。 j ≠注:利用全概率公式可把复杂事件的概率化为互斥的简单事件的概率来计算。

9. Bayes 公式:

∑∞+===1)

|()()

|()()()

()|(i i i j j j j B A B B P B A P B P A P AB P A B P ,如果,Ω=+∞=U 1i i B i j B B φ=()

。 i ≠j 注:知道结果找原因用Bayes 公式计算。

由概率的公理化定义以及条件概率的数学定义,不难证明上面概率的性质和计算公式。我们更希望大家熟练运用它们解决实际问题。下面是一些范例:

问题0.6:用甲胎蛋白法诊断肝癌,灵敏度是95%、特异度是90%。如果在某次例行检查(譬如单位每年一度的体检)中,某人的检验结果是阳性,试问:他应该沮丧到什么程度? 答案是令人惊讶的,他甚至应该保持谨慎乐观的态度。为什么呢?我们只须计算出检验结果是阳性的条件下他患肝癌的概率就可以了。

现在已知的只是癌症患者检测结果呈阳性的概率和正常人检测结果呈阴性的概率,为了利用Bayes 公式计算检验结果是阳性的条件下他患肝癌的(后验)概率,还需要知道人群中肝癌的罹患率。根据广州市1999年的调查资料,我们可以假设人群的肝癌发病率大约为0.02%,则由Bayes 公式容易得到他患肝癌的条件概率为

%19.0%)

901(%)02.01(%95%02.0%95%02.0=?×?+××。 这么小的概率自然不值得他担心。

不过要注意,如果他复查时检验结果还是阳性,则他患肝癌的概率将增加到1.78%。 问题0.8:为确定什么样的性行为最容易导致爱滋病,需要了解人群中进行过某种性行为的人所占的比例。试问:如何设计调查方案?

最简单的调查方案是:随机调查n 人,如果其中回答“是”的有k 人,则比例p 的一个估计为。但是这样得到的估计值往往偏低,因为显然有人会说谎!现在面对的是社会调查中的一类特殊问题,属敏感性问题调查。设计调查方案,关键一点是要保护个人隐私,被访者才有可能真实作答。下面给出两种可行的设计方案,大家可以做一比较。 n k p

/?=方案1:准备一密封罐,罐中装有若干红球和白球(已知红球的比率为π)。随机调查 n 人,先摸球再答题。若摸得红球,则须如实回答;否则说谎。

记回答“是”的人数为k ,则由全概率公式得 P (是)=P (上)P (是|上) +P (下)P (是|下)。 于是当n 充分大时,我们有 )1)(1(p p n k ??+=ππ。

解之得,p 的估计为1

2)1(????=ππn k p 。 请注意,本方案首先要求21≠π;进一步,π该如何选择,得到的p 的估计比较好? 方案2:准备一密封罐,罐中装有若干红球和白球(已知红球的比率为π)。随机调查 n 人,先摸球再答题。若摸得红球,则须如实回答;否则回答另一问题:生日是否在上半年? 记回答“是”的人数为k ,则由全概率公式得 P (是)=P (上)P (是|上) +P (下)P (是|下)。 于是当n 充分大时,我们有 2)1(ππ?+=p n k 。

解之得,p 的估计为ππ2

)1(???=n k p 。

方案2要求0≠π。一个遗留的问题是:π又该如何选择,得到的估计较好? 我们都听说,吸烟危害健康。到底怎么回事呢?还是让数据说话吧!

问题1.2:1950年某地区曾对50—60岁的男性公民进行调查,结果发现,肺癌病人和无肺

癌的吸烟比例差不多,两者分别为99.7%、95.8%。这很难看出吸烟有多大危害。那么请问:该如何说明吸烟的危害?

自然我们首先考虑吸烟的条件下患肺癌的可能性(即吸烟人群中的肺癌发病率)有多大。欲利用Bayes 公式,需要知道整个人群的肺癌发病率。假设人群的肺癌发病率是0.01%,则

4

1004.1%

8.95%)01.01(%7.99%01.0%7.99%01.0)|()()|()()

|()()|(?×≈×?+××=×+××=无肺癌吸烟无肺癌肺癌吸烟肺癌肺癌吸烟肺癌吸烟肺癌P P P P P P P 这就是说,在吸烟的条件下患肺癌的可能性非常小(只有0.01%),吸烟的危害性似乎不足挂齿!但是,另一方面,我们求得不吸烟的条件下患肺癌的概率仅为

61014.7%8.951%)01.01(%7.991%01.0%7.991%01.0)|(?×≈?×?+?×?×=)

()()(不吸烟肺癌P 于是吸烟患肺癌的可能性是不吸烟的14.6倍。因此可以得出结论:还是不吸烟的好!

五、事件的独立性和伯努利概型

1. 称两事件A 与B 相互独立,如果 P (AB )=P (A )P (B )。

2. 称事件A 1, A 2,…, A n 相互独立,如果对其中任意的k (2≤k ≤n )个事件,都有

k j j A A ,,1L ∏===k

i j k i j i i A P A P 11)()(I 。 3. 伯努利概型:将一试验独立重复n 次,这一系列试验就称为n 重伯努利概型。

设每次试验中事件A 的概率为p (0

的概率为 (m=0,1,2,…,n )。

()(1)m m n m n n P m C p p ?=?问题1.3:(彩票问题)一种福利彩票称为幸福35选7,即从1,2,…,35中不重复地开出7个号码, 则在每组号码出现的可能性是一样的模型假设下,彩民中一等奖(7个号码全中)的概率是77351049.16724520

11?×≈==C p 。这样的概率小得可怜,大约二千万人中只有3人可中头奖。因此购买彩票应有平常心,要不就当做善事好了!

如果有人想以愚公移山的精神“积少成多”,那么来看一下会发生什么状况。假设他每期投一注, 试问需要连续投注多少期, 才能保证至少中一次一等奖的概率不小于95%? 令表示“他第i 期中”,i =1,2,…,n ,则要使得连续投注n 期,至少中一次一等奖的概率,只需 i A %95)1(1)(1

≥??==n n

i i p A P U 71001.2996.220ln )1ln(05.0ln ×≈=??≈?≥p p p n 。 换算一下,即使是一天开奖一期,也要47105.51001.2×≈×年。如果30年算一代的话,则要34108.130105.5×≈×代。这差不多可算是千秋万载的“佳话”了! 六、小概率事件原理和假设检验

如果我说,昨天我中了幸福35选7彩票的一等奖,你信吗?你肯定不大相信,因为直觉告诉你,这么小概率的事件应该不会出现。

这就是著名的小概率事件原理:在一次试验中,可认为小概率事件不发生!

通常概率在5%以下的事件称为小概率事件。人们常用小概率事件原理进行假设检验和统计推断。用小概率事件原理进行假设检验的基本步骤是:先根据实际情况,建立一个原假设;然后在原假设成立的条件下计算观察到的(作为对原假设不利证据的)事件发生的概率。如果概率不超过5%,表明观察到的事件是小概率事件;小概率事件竟然发生了,我们就有充分理由怀疑前提假设,从而可以作出拒绝原假设的统计推断结论。

问题1.4:(洗碗问题)某家四个女孩洗碗,在打破的四只碗中至少有三个是老幺所为。她可否申辩:我不笨?

假定申辩有理,则可认为四个女孩打破碗的机会均等;四只碗被四个女孩打破的所有可能结果构成一古典概型。于是作为对原假设不利证据的事件“至少有三个是老幺所为”发生的

概率是%54314

34≈?+C ,它是小概率事件。由小概率事件原理可知,我们有充分理由怀疑假设不成立,因此统计推断的结论是:她申辩无理!

请注意,统计推断的结论有可能犯错误。

你相信医药广告吗?比如,“霸王”洗发水请成龙做广告,你认为应如何看待这件事呢? 即使真如成龙所言,他是在用过并觉得“霸王”洗发水有点效果后才做广告的,那也只能算是个案,并没有足够的理由说明“霸王”洗发水确实有效;只有一批试验数据才有可能说明问题。下面是关于某降压药的试验。

问题1.5:任选20人服用某降压药后要发现至少多少人血压降低,才能认为该药有效? 如果该药无效,则20人服药可视为伯努利概型,其中每人血压降低的概率均为 1/2,于是 “至少 m 人血压降低”的概率是

。 ??

???====∑=13%,2.1314%,8.515%,1.2)2/1(202020m m m C m k k 可见,只有当m ≥15时,才有充分理由拒绝无用的原假设,从而认为该药降压效果显著。 当然,上面的推断是在显著性水平α=0.05下作出的;因为这里我们是把概率在5%以下的事件称为小概率事件。实际上,5%就是统计推断犯第一类错误的概率的上限。在有些情况下,人们希望统计推断犯第一类错误的概率控制在更低的水平,比如1%,于是假设检验的显著性水平α 就等于0.01,这时概率在1%以下的事件才当作小概率事件。 这样来说,如果只有14人血压降低,则在α=0.05下该药降压效果不显著,但在α=0.1下仍可认为该降压药有效。.

小概率事件原理认为:在一次试验中,小概率事件不发生!但是,如果不断重复试验,小概率事件迟早会发生!为什么呢?

设一次试验中,小概率事件A 发生的概率为p ,p 很小,但不为零,那么在n 次独立重复试验中,A 至少出现一次的概率是,所以 。 n n p p )1(1??=1lim =+∞

→n n p 于是,我们明白了一首歌:伤心总是难免的。既然伤心总是难免的,那伤心一次又何妨?人生漫漫长路,我们何必为一两次挫折而耿耿入怀呢?

对于小概率事件原理,应全面考虑问题。下面的股市预测问题提示,凡事一分为二的好。 问题0.5:如果连续6个星期,你都收到某股市顾问对某种股票行情(上升或下降)正确预言的邮件,那么这名顾问要求你为第七个星期中这样的预言付费,你愿意吗?

假设股市顾问对股票行情毫无经验,完全靠猜测;则他每周作出正确预言的可能性都是1/2,这样连续6周他都能正确预言股票行情的概率就是1/64≈1.6%。因此有理由怀疑前提假设,可认为顾问有一定预测能力。所以,你愿意为下一个预言付费好象也有一定道理。 但是,小概率事件在多次重复试验中很有可能发生。原来,故事是这样的:

所谓股市顾问, 先写32000封预测某种股票行情的信寄给股市潜在的投资者, 还特别介绍他公司精心制作的电脑模型、他自己的专业金融知识以及他们与股市的内部联系;不过, 其中一半预言股票上升, 另一半预言股票下降; 于是, 不管股市风云如何变幻, 总有一半预言正确!

后续的信件就继续寄往这些得到正确预言的一半投资者。六个星期后, 连续六次都收到正确预言的还有500人。现在,顾问提醒这500人:若想继续收到对第七周有价值的预言, 应该支付200元。如果他们全都交了, 那个所谓的顾问就可骗到100000元。

七、最大似然原理和参数估计

统计推断不只是假设检验,还有参数估计。先看黑猫白猫问题。

问题1.6:现有两箱外形相同,甲箱有 99 只白猫 1 只黑猫,乙箱有 99 只黑猫 1 只白猫。今随机取一箱,再从中任抓一猫,结果发现是白猫。试问猫从何来?

要问猫从何来,甲箱、乙箱都有可能,但这只猫只能来自其中之一,自然我们要看它来自哪箱的概率大。由古典概率模型易知 P (白|甲)=99/100,P (白|乙)=1/100。 因为 P (白|甲) >P (白|乙),故可推断白猫来自甲箱!

注意:严格说来,应该比较后验概率的大小。上面推断正确的原因在于 P (甲)=P (乙)时,

P (白|甲) > P (白|乙) 等价于P (甲|白) >P (乙|白) 。

由黑猫白猫问题,引出最大似然原理:估计参数,使得事件发生的概率最大! 问题1.7:(捕获—再捕获问题): 如何知池中鱼几何?

先抓50条,做记号放回;再抓20条,如果发现有记号5条,试估计池中鱼数n ?

令 A =“再抓20条,发现有记号5条”,则 2052050550)|(n

n C C C n A P ???=。 由最大似然原理,找之最大值点作为n 的估计。因

)|(n A P p n =200

11200

1120011)

15501)(1()201)(501(1<+?>=+?=>+?

故最大值点为n =199或200,于是估计池中鱼有199或200条。

第二章 随机变量及其分布

由上节知,概率论研究随机事件的概率,要完整的描述随机现象,需要知道概率空间。概率空间的数学味道太浓,初学者难以理解。用随机变量及其分布作为描述随机现象的数学模型,简单、直观,容易掌握。

问题2.1:Michael Jordan 连续投篮10次,每次命中率为0.8, 如何描述这一随机现象? 用概率空间描述太过麻烦。事实上,我们关心 Jordan 10次投篮的结果,因此有 法1: 令表示第k 次的命中次数, k =1,2,…,10, 则10次投篮的结果为,且每种结果发生的概率如下:

k X ),,(101X X L ∑∑====?=1011011010

12

.08.0))((k k k k x x k k k x X P I ,1,0=k x ,k =1,2, (10)

上面是十维随机变量的联合分布列,它完整刻画了 Jordan 10次投篮的所有可能结果。但是,实际问题中,我们更关心 Jordan 10次投篮的总的进球数,于是有

),,(101X X L 法2: 令X 表示Jordan 10次投篮总的命中次数, 则X 的分布列为

.10,,1,0,2.08.0)(1010L ===?m C m X P m m m

一、离散型随机变量

1.定义: 只取有限或可列个值的随机变量X 称为离散型随机变量,其分布列定义为

k k p x X P ==)(, k ≥1.

分布列有两条基本性质:

(1) , k ≥1; (2) 0>k p 11=∑≥k k p

2.常用离散型随机变量的分布列:

(1)二项分布(,其中,),(~p n B X 1≥n 10<

()(1)k k n n P X k C p p k ?==??,0,1,2,,k n =L 。

可描述n 重Bernoulli 概型中“成功”的次数.

特例:X ~B (1,p )(其中10<

(2)几何分布(,其中)(~p G X 10<

:1()(1)k P X k p p ?==?,。 1,2,3,k =L 可描述Bernoulli 概型中首次“成功”需要的次数.

(3)Poisson 分布()(~λP X ,其中0>λ):()!k

P X k e k λλ?==,。

0,1,2,k =L 可描述稀有事件出现的次数,如单位时间内的地震次数、事故次数、重要的战争次数、患病人数、顾客数、候车人数、上课迟到人数;单位面积布匹上的疵点数、每页上的印刷错

误数等等。 注:二项分布和Poisson 分布应用相当广泛,又关系密切。当n >30, , 时,二项分布近似于Poisson 分布。Poisson 定理从理论上保证了这一点: 1.0≤n p 10≤n np ),(n p n B )(n np P 定理2.1:若 λ=+∞→n n np lim (>0),则 0,!)1(lim ≥=???+∞→m e m p p C m

m n n m n m n n λλ。

问题2.2:(1)设鸡在正常情况下感染某种传染病的概率为0.2,新疫苗A 注射11只鸡后无一感染,请问疫苗有效吗?

聪明的读者马上联想到用假设检验进行统计推断。假设疫苗无效,则11只鸡无一感染的概率是,在显著性水平α=0.05下没有充分理由拒绝假设,不好认为疫苗有效! 086.08.011=注: 上面的概率0.086在假设检验中称为检验的p 值,只有当p 值不超过预先给定的显著性水平,才有充分的理由拒绝原假设。

在显著性水平α=0.05下,注射14(或以上)只鸡无一感染才能认为疫苗A 有效 (p =0.044)。

(2)疫苗B 注射22只鸡后仅感染1只,试问疫苗有效吗?

假设疫苗B 无效,则22只鸡至多感染1只的概率是,在

显著性水平α=0.05下有充分理由拒绝假设,因此可认为疫苗B 有效!

048.02.08.08.02112222=??+C 注:检验的 p 值越小,疫苗越有效!

保险险种的设计很有讲究,既不能每年保费过高,使顾客“望洋兴叹”,死亡赔偿金也应达到一定水平,让人觉得物超所值;还要保证保险公司赚钱。不学概率统计,那怎么行呢? 问题2.3:(1)设有10000人投人寿保险,每年保费200元,死亡赔偿金100000元。若他们的死亡率为0.001,求保险公司盈利500000元以上的可能性大小。

易知,保险公司盈利500000元当且仅当年死亡人数X 不超过15。由Bernoulli 概型, X ~B (10000,0.001),故所求概率为

9513.0)001.01(001.0)15(15

010********=??=≤∑=?m m m m C X P 。

上式的计算非常复杂,也没有现存的表可查。如果利用Poisson 分布表,困难迎刃而解。事实上,由Poisson 定理,X 近似服从分布P (10),故所求概率为

951.0!10)15(15

010=≈≤∑=?m m

e m X P 。 (2)若其它条件不变,则要以95%以上的概率保证保险公司至少盈利1000000元的最低年保费a 应为多少?

由上可知,年死亡人数X 不超过15人的概率刚好大于95%,因此应有

10000a -15×100000≥1000000,

故取a=250即可。

问题2.4:设有80台同类型设备,各台工作是相互独立的,发生故障的概率都是0.01, 且一台设备的故障能由一人处理。请问:需要几个维修工人,才能以95%以上的概率保证设备发生故障可得到及时修理?

以X 表示80台设备中同时发生故障的台数,则 X ~B (80,0.01) 或 P (0.8)。

设需要请m 个维修工人,则问题要求 P (X ≤m )≥0.95。查Poisson 分布表知,m =2即可。 这样我们得到方案一:由2人共同维护80台设备; 如果各人自扫门前雪,那么就有方案二:由2人维护,每人负责40台。

以Y 表示40台设备中同时发生故障的台数,则Y ~B (40,0.01) 或 P (0.4)。

于是80台设备发生故障可得到及时修理的概率是 。 881.09384.0)1(22==≤Y P 这个概率比方案一的95.3%要小一些;因此两个方案就效率而言,还是方案一好!

问题2.5:假设某商场一天来的顾客数X ~P (λ),而每个顾客购物的概率为 p , 试求商场一天内购物的顾客数Y 的分布。

根据题设条件,可以利用Bernoulli 概型得到,。

再由全概率公式可知,商场一天内购物的顾客数Y 的分布列为

m n m m n p p C n X m Y P ??===)1()|(

∑+∞===?===m n n X m Y P n X P m Y P )|()()(∑+∞

=????=m

n m n m m n n p p C e n )1(!λλ

∑+∞=???=0

!))1((!)(k k m

k p e m p λλλ)1(!)(p m

e e m p ???=λλλ.,2,1,0,!)(L ==?m e m p p m

λλ 因此商场一天内购物的顾客数Y ~P (λp )。

二、连续型随机变量

问题2.6:2005年全国新生婴儿大约19000000,如何描述他们的体重?

学习了离散型随机变量以后,我们可以用离散型随机变量及其频率直方图(图a,b)来描

要比将X 视为离散型随机变量,用频率直方图描述来得方便,至少从数学模型的角度来说是这样的。现在给出连续型随机变量的定义。

1.定义: 称X 为具有密度函数p (x )的连续型随机变量,如果b a

∫=≤

a

dx x p b X a P )()(.

密度函数有两条基本性质:

(1) ; (2)

0)(≥x p 1)(=∫+∞

∞?dx x p 上面只介绍了现实世界中常见的两类特殊随机变量。对于一般的随机变量,我们用分布函数来刻画它取值的统计规律。下面给出其中的一种数学模型,别的定义方式可看参考文献。

2.随机变量及其分布函数

定义:对概率空间(?,F ,P ),称定义在?上的实函数X (ω)为随机变量(简记为X ),如果,都有 {ω: X (ω)≤x }∈F 。随机变量X 的分布函数定义为

),(+∞?∞∈?x ()()F x P X x =≤,x ?∞<<∞。

注意,有人定义分布函数)()(x X P x F <=,x ?∞<<∞;也可定义为其它形式,关键是要能完整刻画随机变量取值的统计规律,即由此可计算随机变量任意取值的概率。我们这里由分布函数计算概率的基本公式是:122()()P x X x F x F x 1()<≤=?,其中12x x <。

分布函数有三条基本性质: (1)单调性:; )()(2121x F x F x x

→x F F x ,1)(lim )(==+∞+∞→x F F x ; (3)右连续性:F (x +0)= F (x ).

离散型随机变量X 的分布函数为 ∑∑≤≤===

≤=x x i x x i i i p x X P x X P x F )()()(;

连续型随机变量X 的分布函数为 。

∫∞?=≤=x dt t p x X P x F )()()(对密度函数p (x )的连续点有:(1))()(x p x F =′;(2)P (x

3.常用连续型随机变量及其密度函数与分布函数:

(1)[,上的均匀分布(,其中]a b ],[~b a U X b a <):

?????≤≤?=?=≤≤.,0,,11)()(其它b x a a b I a b x p b x a ??

???≥<

(2)指数分布()(~λe X ,其中0>λ):

)0()(>?=x x I e x p λλ, 。

)0()1()(>??=x x I e x F λ可描述电子元件、动物的寿命;排队的服务时间.

(3)标准正态分布():

)1,0(~N X )2exp(21)(2x x ?=π?, ∫∞??=Φx dt t x )2exp(21)(2

π

。 标准正态分布函数值有表可查:Φ(1.645)=0.95, Φ(1.96)=0.975,Φ(-1.645)=0.05。 一般正态分布(,其中),(~2

σμN X 0>σ): )2)(exp(21)(22σμσ

π??=x x p , )()(σμ?Φ=x x F , 可描述测量误差; 信号噪声;考试成绩; 产品的质量指标; 生物的生理指标等等。后面的中心极限定理告诉我们:大量独立同分布的随机变量的和近似正态分布!

问题2.7:假设机床加工的部件长度X 服从正态分布,部件的长度在10),10(2σN +0.01内才算作合格品。要使合格率达到99%,应当如何控制加工精度σ ?

题目要求 ,由一般正态分布函数计算公式不难得到

%99)01.0|10(|≥

查标准正态分布函数表,有 58.201.0≥σ,故 00388.0≤σ。

注: 由P (|X - μ|<3σ)=99.73%可知,正态变量的99.73%的值落在(μ?3σ, μ+3σ)内,此性质被称为“3σ原则”。始于1945年的工业用质量控制图就是根据这个原则制定的。他们认为,产品质量特性服从正态分布;当生产中不存在系统误差时,如果生产处于受控状态,则样本观测值一定落在此3σ范围内;否则生产过程就不稳定,需要改进。

三、多维随机变量及其联合分布

在问题2.1的解答中,我们曾用十维随机变量及其联合分布列来完整刻画 Jordan 10次投篮的所有可能结果;其它一些随机现象也需要多维随机变量来描述。下面重点介绍二维随机变量。

),,(101X X L 1.二维离散型随机变量:

(1)完整刻画二维离散型随机变量取值的统计规律的联合分布列定义为 ),(Y X

ij j i p y Y x X P ===),(, i,j ≥1. (2)联合分布列有两条基本性质:

(i) ,i,j ≥1; (ii) 0≥ij p 111=∑∑≥≥i j ij p

(3)X 的边缘分布列为 ()(,)i i j j j ij P X x P X x Y y p

=====∑∑,i ≥1;

Y 的边缘分布列为 ()(,)j i j i i

ij P Y y P X x Y y p =====∑∑,j ≥1。

(4)X 与独立的充要条件是 Y ij ij ij

j i p p p =?∑∑,i,j ≥1。

问题2.8:目前常用DXA (双能X 线吸收测定法)和QUS (定量超声波)诊断骨质疏松症。假设它们的灵敏度分别为、, 则n 个骨质疏松症患者中用两种技术诊断正确的人数分别为、。请问如何完整描述同时用两种技术诊断的结果? +1p 1+p ),(~11++p n B X ),(~11++p n B X 对每个骨质疏松症患者同时用两种技术进行诊断,可能的结果为:两种技术都诊断正确,仅DXA 诊断正确,仅QUS 诊断正确,两种技术都诊断错误。注意到这四种人总数是n ,如果令分别表示前三种人的个数,那么可以用服从四项分布的三维离散型随机变量来描述诊断结果,其联合分布列如下(其中i ,j ,k ≥0, i+j+k ≤n ): 011011,,X X X ),,(011011X X X k

j i n 011011k 01j 10i 11011011)p p p (1p p p k)!

j i (n k!j!i!n!k)X j,X i,P(X ?????????====2.二维连续型随机变量 (1)完整刻画二维随机变量取值的统计规律的联合分布函数定义为

),(Y X F (x ,y )=P (X ≤x ,Y ≤y )

(2)称(X ,Y )为具有联合密度的二维连续型随机变量,如果),(y x p ),(,+∞?∞∈?y x ,都有

∫∫∞?∞?=

x y

dudv v u p y x F ),(),(

(3)联合密度有两条基本性质:

(i) ; (ii)

0),(≥y x p 1),(=∫∫+∞∞?+∞∞?dxdy y x p (4)概率计算公式:,这里R 为平面上任一可测区域。 ∫∫=

∈R dxdy y x p R Y X P ),()),(((5)X 的边缘密度为 ;Y 的边缘密度为

。 ∫+∞∞?=

dy y x p x p X ),()(∫+∞

∞?=dx y x p y p Y ),()((6)X 与独立的充要条件是 Y )()(),(y p x p y x p Y X ?=,),(,+∞?∞∈?y x 。 (7)二维正态随机变量(,其中),,,,(~),(222121ρσσμμN Y X 0,21>σσ,1||<ρ):

??

???????????????+???????=2222212121212221)())((2)()1(21exp 121

),(σμσσμμρσμρρσπσy y x x y x p 定理2.2:若,则

),,,,(~),(222121ρσσμμN Y X (i ),; ),(~211σμN X ),(~222σμN Y (ii )X 与Y 独立的充要条件是 ρ=0(即后面称的X 与Y 线性无关)

。 问题2.9:2005至2006年发行的广东篮球彩票竞猜的是美国NBA 单场比赛四节的胜平负(共81种可能)和终场比分(共2601种不同的结果,其中70分包含小于70,120分包含大于120),全部猜对才算中奖。如果只关心单场比赛的终场比分,那么应该如何描述呢? 虽然单场比赛的比分取值是离散的,但总共有512 =2601种可能,如果用二维离散型随

机变量来描述,会相当麻烦,我们考虑引入连续型随机变量,而建立概率统计模型的依据是NBA 2004 -2005赛季常规赛与季后赛的1307组数据。先按有无加时进行统计分组,再利用如散点图等统计方法对问题进行量的分析,并结合对问题质的分析,我们提议对无加时和有加时的单场比分均构造二维正态模型,即认为相应的主、客队得分分别为

,,密度分别为

),,,,(~),(1212211121111ρσσμμN Y X ),,,,(~),(2222221222122ρσσμμN Y X ?????????????????+???????=

212212121112111211211212112111)())((2)()1(21exp 121),(σμσσμμρσμρρσπσy y x x y x p ?????????????????+???????=222222222122212221221222222212)())((2)()1(21exp 121

),(σμσσμμρσμρρσπσy y x x y x p 又设需要打加时赛的概率为,于是NBA 2004 -2005赛季主、客队的得分(,e p )X Y 的联合密度为 ),(),()1(),(21y x p p y x p p y x p e e +?=。

至于其中的未知参数,基于上面的数据,容易得到它们的最大似然估计值分别为

%4.6?=e p

,, 41.0?,7.11?,6.11?,9.94?,1.98?112111211=====ρσσμμ89.0?,8.11?,5.10?,0.107?,7.106?222212221=====ρσσμμ

。 这样,描述NBA 2004 -2005赛季常规赛与季后赛单场比赛的终场比分的概率统计模型就完全确定了;其中的最大似然估计请见后面的数理统计方法。

3.随机变量函数的分布

概率统计中还会用到一些分布,它们是由前面介绍的常用分布构造出来的。

定理2.3:若, 则

),(~2σμN X (1) 标准化随机变量)1,0(~)(*N X X σμ?=; (2) ;

),(~22σμb b a N bX a ++(3)服从对数正态分布。

X e Y =定理2.4:设相互独立。

n X X ,,1L (1)若,,则

; ),(~2i i i N X σμn i ,,1L =),(~1211∑∑∑===n i i n i i n i i N X σμ(2)若,,则

; ),(~p n B X i i n i ,,1L =),(~11p n B X n i i n i i ∑∑==(3)若)(~i i P X λ,,则

; n i ,,1L =)(~11∑∑==n i i n i i P X λ(4)若,,则

(负二项分布); )(~p G X i n i ,,1L =),(~1p n Nb X

n i i ∑=(5)若)(~λe X i ,,则 (Gamma 分布); n i ,,1L =),(~1

λn Ga X n i i

∑=(6)若,,则 (分布)

; )1,0(~N X i n i ,,1L =)(~212n X n i i χ∑=2χ定理2.5:设X 与Y 相互独立,且,,则)1,0(~N X )(~2n Y χ)(~n t n

Y X t =。

定理2.6:设X 与Y 相互独立,且,,则)(~2n X χ)(~2m Y χ),(~m n F m Y n X F =。 第三章 随机变量的数字特征

回到问题0.2,你从1到6之中选取一个数字(比如6),然后机器掷出三颗骰子。如果三颗骰子出现的三个数字都是你选取的数字6,机器会支付你3美元;如果三颗骰子的数字中有两个6,机器会支付你2美元;如果三颗骰子的数字中仅有一个6,机器会支付你1美

元。只有当你选取的数字没有出现时,你才需要付给它钱——仅仅1美元。好象这个游戏看起来挺吸引人的,因为掷三颗骰子,你有三个机会能赢,并且有时你可赢取1美元以上,而1美元则是你的最大损失。请问你愿意赌吗?

可以从两方面考虑问题。若是抱着玩的心态,只赌一两次,输了也无所谓,那就赌呗!但是如果有足够的赌本,准备与赌博机好好切磋的话,那就要研究你输赢的理论平均值。 令一次赌博你可赢Y 美元,则其分布列为 Y -1 1 2 3

P 125/216 75/216 15/216 1/216

于是Y 的期望平均值(即取值与相应概率的乘积之和)是

E (Y )= -1×125/216+1×75/216+2×15/216+3×1/216= -17/216≈-0.08。

即是说,长此以往下去,你平均会输8美分;当然不应该赌了!

从本例可知,虽然分布函数全面刻画了随机变量取值的统计规律,但有些问题需要从侧面描述随机变量某方面的数字特征,比如平均水平、离散程度等等。

一、 数学期望

1. 离散型随机变量X 的数学期望定义为 ∑≥=?=1)()(k k k x X P x

X E 。

我们要求级数绝对收敛,使得级数的和(即随机变量的平均值)与各项的排列顺序无关。

问题3.1:美国二战期间大量征兵,需对应征者验血。若按常规将每人的血分别检验,则平均每人需要检验一次。有什么办法可以减少验血的工作量呢?

统计学家提出分组检验方法:每k 人一组,混合血液检验。如果检验结果为阴性,就说明这k 人都没问题,一次检验即可;否则这组人中至少有一个有问题,需要再逐个检验,总次数为k +1。设平均每人检验次数为X ,若检验的阴性率为q ,则X 的分布列为

k q k X P ==)1(,k q k X P ?=+=1)11(

于是 k k k q k q k q k X E ?+=?++?=11)1)(11(1)(。

故只要 111

q k ,即 k k q >,

分组方法就可减少验血次数,而且还可选择适当的k 使其达到最小。譬如,若q=0.99,则k =11时,平均验血次数最少,验血工作量可减少80%左右,效率真的提高不少哟!

2. 连续型随机变量X 的数学期望定义为 ,如果上述广义积分绝对收

敛,其中是∫+∞∞?=

dx x xp X E )()()(x p X 的密度;否则称数学期望不存在。 )(X E 实际问题要求我们不仅会算随机变量的数学期望,也能求随机变量函数的数学期望。 问题3.2:假设国际市场上每年对我国某种出口商品的需求量X 服从[2000,4000] (单位:吨)上的均匀分布。每销售一吨,可赚外汇3万元;而销售不出,每吨需库存费1万元。问应组织多少货源,才能使收益最大?

设应组织货源吨,显然应有t 400020000≤≤t ,于是收益为

???

X t X t X t X g Y ,4,3)( 因为X 的密度为

???≤≤=otherwise x x p ,

040002000,20001)( 利用下面关于随机变量函数的数学期望的计算公式(定理3.2),不难得到

∫∫==∞∞?40002000)(20001)()()(dx x g dx x p x g Y E ??

????+?=∫∫400020003)4(20001t t tdx dx t x ()

400000070001000

12+??=t t 当时,达到最大。

3500=t )(Y E 3. 随机变量函数的数学期望 定理3.1:设离散型随机变量X 的分布列为 ()i i P X x p ==,,

1≥i 则随机变量函数的数学期望是,如果此级数绝对收敛。

()Y g X =1(())()i

i i E g X g x p ∞==∑定理3.2:设连续型随机变量X 的概率密度为,则函数)(x p ()Y g X =的数学期望是

∫+∞

∞?=

dx x p x g X g E )()())((,

如果此广义积分绝对收敛。

定理3.3:设二维连续型随机变量(,)X Y 的联合概率密度为,则随机变量函数

),(y x p (,)Z g X Y =的数学期望是,如果它绝对收敛。 ∫∫+∞∞?+∞

∞?=

dxdy y x p y x g Y X g E ),(),()),((4. 数学期望的性质

(1) ()E C C =;(2) 11

()(n n i i i i i i )E c X c E X ===∑∑.

(3) ,如果相互独立. 11()(n n

i i

i i E X E X ===∏∏)12,,,n X X X L

问题3.3:假设投资于房地产、商业的收益率X (%)、Y (%)的分布列分别为

X 110 30 -30 Y 60 40 -10

P 0.2 0.7 0.1 P 0.2 0.7 0.1

请问:如果不考虑组合投资,那么该投资于房地产还是商业?

问题是在两种投资策略中二选一。由于收益率X 与Y 都有三个不同的取值,直接进行比较总嫌不太方便。人们通常考虑比较收益率两方面的特征:平均收益率和风险。 先计算平均收益率(即收益率的数学期望):

E (X )= 40(%),E (Y )=39(%)。

如果只考虑平均收益,则似乎投资房地产较好。不过,由X 与Y 的分布列直观感觉到,如果赢利的话,投资房地产会比商业赚得更多,但若是世道不济,房地产又会比商业亏多一些;这就暗示投资房地产风险较大,而这个风险可以用收益率的标准差刻画。

由即将给出的标准差计算公式,两者的风险分别为:

(%)2.391540)()(===X D X σ, (%)1.18329)(==Y σ

所以综合权衡收益和风险,还是投资商业好:虽然平均收益率少1%,但风险要小一半以上!

二、方差与标准差

1. 随机变量X 的方差和标准差分别定义为:、2()()D X E X EX =?()X σ= 它们可用来描述随机变量分布的离散程度;方差和标准差越大,离散程度越大。

2. 方差的计算公式:22()()()D X E X EX =?.

3. 方差的性质:

(1);(2) ()0D C =2()()D CX C D X =;

(3)()()()D X Y D X D Y +=+,若X 、Y 独立。

4. 常用分布的数学期望与方差

X

)(X E )(X D ),(p n B

np )1(p np ? )(p G p 1 2)1(p p ?

)(λP

λ λ ],[b a U

2)(b a + 12)(2a b ? )(λe λ1

21λ ),(2σμN μ 2σ

问题3.4:已知正常成年男性每毫升血液中的白细胞数平均是7300, 标准差是700。试问:每毫升血液中的白细胞数在5900至8700间的概率是多少?

要求概率,需要知道每毫升血液中的白细胞数X 的分布。若,则

),(~2

σμN X P (5900

但是如果不知道X 的分布, 那么无法计算概率的准确值。不过,下面的切比雪夫不等式可以给出概率的一个下界:

P (5900

细心的读者或许发现,相对于正态分布下的精确值,这个下界确实有一定差距。

5.切比雪夫不等式:

若随机变量X 的方差存在,则 2)()|)((|εεX D X E X P ≤≥?。

切比雪夫不等式给出大偏差“|X-EX |≥ε”发生概率的上界;方差愈小,随机变量X 取值离开其均值的可能性愈小。下面的定理进一步说明:方差为0,意味着X 取值集中在一点上。

定理3.4:(1)D (X )=0 的充要条件是 P (X=EX )=1;

(2)E (X 2)=0 的充要条件是 P (X=0)=1.

6.协方差和相关系数:

随机变量X 与Y 的协方差定义为 Cov(X ,Y )=E (X -EX )(Y-EY )=E (XY )-(EX )(EY ).

为消除单位的影响,令 X *=(X -EX )/σ(X ), Y *=(Y -EY )/σ(Y );X 与Y 的相关系数定义为

Corr(X ,Y )=Cov(X*,Y*)=[E (XY )-(EX )(EY )]/[σ(X )σ(Y )]

定理3.5:(1) |Corr(X ,Y )|≤1; (2) |Corr(X ,Y )|=1 当且仅当 P (Y=a+bX )=1.

(3) 若X ,Y 独立, 则 Corr(X ,Y )=0.

注:(1)相关系数刻划随机变量之间的线性相关性;相关系数绝对值越大,随机变量之间的线性关系越密切;相关系数为0,称随机变量线性无关;

(2)相关系数等于零只是独立的必要条件,而非充分条件。不过,在二维正态条件下,相关系数为零是随机变量独立的充要条件!

第四章 大数定律和中心极限定理

一、大数定律

在问题2.1中,我们用统计方法求抛一硬币时正面朝上的概率:重复抛此硬币n 次,则当n 充分大时,正面朝上的频率m/n 可作为概率p 的估计。这是由下面大数定律保证的。

定理4.1(伯努利大数定律)设事件A 在n 次独立试验中出现的频率是,而每次试验中)(A f n A 发生的概率为 则对任意(),P A p =0ε>, 有: lim (|()|)0n n P f A p ε→∞

?≥=. 定理4.2(辛钦大数定律)设独立同分布的随机变量序列的方差存

在,且12,,,,n X X X L L i E X (),μ=n 1,2,,,i =L L ,则对任意0ε>,有: 1

1lim (||)0n

i n i P X n με→∞=?≥=∑. 概率论中用来阐明大量随机现象平均结果的稳定性的一系列定理统称为大数定律.

二、中心极限定理

问题4.1:(拥挤的水房)某校有学生5000人,只有一个开水房,共45个水龙头。由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向学校总务处提议增设水龙头。学校总务处同意学生的意见,但应该增设多少个水龙头呢?

毛主席说过:没有调查,就没有发言权。我们说,光调查是不够的,还需要非常讲究的统计分析和/或精算。假设调查发现,傍晚一般有1%的学生在同一时刻打水,于是同时打水的学生人数,则发生拥挤的概率是

)01.0,5000(~B X ∑=?=≥5000

465000500099.001.0)46(k k k k C X P

上式的计算复杂,也没有现存的表可查。如果象问题2.3那样利用Poisson 分布作近似计算,由于5001.05000=×=λ,一般情况下无表可查。不过,我们有正态分布逼近可用。 由下面的De Moivre-Laplace 中心极限定理,即得,故

)5.49,50(~N X &%9.73)64.0()5

.49505.45(1)5.45(1)46(=Φ=?Φ?≈

现在希望多装m 个水龙头来解决问题,但并不能做到绝对不发生拥挤,只能以较大的概率(如95%)作保证。这样问题化为求m ,使得

95.0)45(≥+≤m X P 。

即 )645.1()5.495.4(

)5.45()45(Φ≥?Φ≈+<=+≤m m X P m X P , 故 645.15.495

.4≥?m ,,取1.16≥m 17=m 。

因此,要以95%以上的概率保证不拥挤,需再装水龙头17个。

定理4.3(De Moivre-Laplace 中心极限定理)设在独立试验序列中,事件A 在各次试验中发生的概率为p (0

lim ()n P x x →∞??≤=Φ???

. 注:当n 充分大且5))1(,min(>?p n np 时,二项分布(,)B n p 可用正态分布近似。注意,实际近似计算中常用下列公式:对任意整数,有 (,(1))N np np p ?1m m <2))1(5.0())1(5.0()5.05.0()(122121p np np

m p np np

m m Y m P m Y m P n n ???Φ???+Φ≈+<

定理4.4(Levy 中心极限定理)设独立同分布随机变量12,,,n X X X L 存在方差:2(),()0,1,2,,i i .E X D X i μσ==>=L n 则当时,它们的和的极限分布是正态分布,即对任意实数n →∞x ,都有

22lim ()n x t i n X n P x e dt μ?→∞??????≤==Φ????∑∫x 2.

注:Levy 中心极限定理认为,

若被研究的随机变量可以表示为大量独立同分布随机变量之和,则该随机变量近似服从正态分布。故当n 充分大时,对1x x <,有 )()()(

)(12211211σμ

σμ

σμ

σμσμn n x n n x n n x n n X n n x P x X x P n i i n i i ?Φ??Φ≈?≤?

有关随机变量之和的极限分布为正态分布的定理称为中心极限定理。

数三概率论与数理统计教学大纲

数三《概率论与数理统计》教学大纲 教材:四川大学数学学院邹述超、何腊梅:《概率论与数理统计》,高等教育出版社出,2002年8月。 参考书:袁荫棠:《概率论与数理统计》(修订本),中国人民大学出版社。 四川大学数学学院概率统计教研室:《概率论与数理统计学习指导》 总学时:60学时,其中:讲课50学时,习题课10学时。 学分:3学分。 说明: 1.生源结构:数三的学生是由高考文科生和一部分高考理科生构成。有些专业全是文科生或含极少部分理科生(如:旅游管理,行政管理),有些专业约占1/4~1/3的理科生(国贸,财政学,经济学),有些专业全是理科生(如:国民经济管理,金融学)。 2.高中已讲的内容:高中文、理科都讲了随机事件的概率、互斥事件的概率、独立事件的概率,即教材第一章除条件概率以及有关的内容以外,其余内容高中都讲了。高中理科已讲离散型随机变量的概率分布(包括二项分布、几何分布)和离散型随机变量的期望与方差,统计基本概念、频率直方图、正态分布、线性回归。而高中文科则只讲了一点统计基本概念、频率直方图、样本均值和样本方差的简单计算。 3.基本要求:学生的数学基础差异大,不同专业学生对数学课重视程度的差异大,这就给讲授这门课带来一定的难度,但要尽量做到“分层次”培养学生。高中没学过的内容要重点讲解,学过的内容也要适当复习或适当增加深度。讲课时,既要照顾数学基础差的学生,多举基本例子,使他们掌握大纲要求的基本概念和方法;也要照顾数学基础好的学生,使他们会做一些综合题以及简单证明题。因为有些专业还要开设相关的后继课程(如:计量经济学),将用到较多的概率统计知识;还有一部分学生要考研,数三的概率考研题往往比数一的难。 该教材每一章的前几节是讲述基本概念和方法,习题(A)是针对基本方法的训练而编写的,因此,这一部分内容须重点讲解,并要求学生必须掌握;每一章的最后一节是综合例题,习题(B)具有一定的综合性和难度,可以选讲部分例题,数学基础好的学生可选做(B)题。 建议各章学时分配(+号后面的是习题课学时): 第一章随机事件及其概率 一、基本内容 随机事件的概念及运算。概率的统计定义、古典定义及公理化定义。概率的基本性质、加法公式、条件概率与乘法公式、全概率公式、贝叶斯公式。事件的独立性,独立随机试验、

(完整版)概率论与数理统计课后习题答案

·1· 习 题 一 1.写出下列随机试验的样本空间及下列事件中的样本点: (1)掷一颗骰子,记录出现的点数. A =‘出现奇数点’; (2)将一颗骰子掷两次,记录出现点数. A =‘两次点数之和为10’,B =‘第一次的点数,比第二次的点数大2’; (3)一个口袋中有5只外形完全相同的球,编号分别为1,2,3,4,5;从中同时取出3只球,观察其结果,A =‘球的最小号码为1’; (4)将,a b 两个球,随机地放入到甲、乙、丙三个盒子中去,观察放球情况,A =‘甲盒中至少有一球’; (5)记录在一段时间内,通过某桥的汽车流量,A =‘通过汽车不足5台’,B =‘通过的汽车不少于3台’。 解 (1)123456{,,,,,}S e e e e e e =其中i e =‘出现i 点’ 1,2,,6i =L , 135{,,}A e e e =。 (2){(1,1),(1,2),(1,3),(1,4),(1,5),(1,6)S = (2,1),(2,2),(2,3),(2,4),(2,5),(2,6) (3,1),(3,2),(3,3),(3,4),(3,5),(3,6) (4,1),(4,2),(4,3),(4,4),(4,5),(4,6) (5,1),(5,2),(5,3),(5,4),(5,5),(5,6) (6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}; {(4,6),(5,5),(6,4)}A =; {(3,1),(4,2),(5,3),(6,4)}B =。 ( 3 ) {(1,2,3),(2,3,4),(3,4,5),(1,3,4),(1,4,5),(1,2,4),(1,2,5) S = (2,3,5),(2,4,5),(1,3,5)} {(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5)}A = ( 4 ) {(,,),(,,),(,,),(,,),(,,),(,,), S ab ab ab a b a b b a =--------- (,,),(,,,),(,,)}b a a b b a ---,其中‘-’表示空盒; {(,,),(,,),(,,),(,,),(,,)}A ab a b a b b a b a =------。 (5){0,1,2,},{0,1,2,3,4},{3,4,}S A B ===L L 。 2.设,,A B C 是随机试验E 的三个事件,试用,,A B C 表示下列事件:

概率论与数理统计及其应用第二版课后答案浙江大学

第1章 随机变量及其概率 1,写出下列试验的样本空间: (1) 连续投掷一颗骰子直至6个结果中有一个结果出现两次,记录投 掷的次数。 (2) 连续投掷一颗骰子直至6个结果中有一个结果接连出现两次, 记录投掷的次数。 (3) 连续投掷一枚硬币直至正面出现,观察正反面出现的情况。 (4) 抛一枚硬币,若出现H 则再抛一次;若出现T,则再抛一颗骰子,观 察出现的各种结果。 解:(1)}7,6,5,4,3,2{=S ;(2)},4,3,2{Λ=S ;(3)},,,,{ΛTTTH TTH TH H S =;(4)}6,5,4,3,2,1,,{T T T T T T HT HH S =。 2,设B A ,就是两个事件,已知,125.0)(,5.0)(,25.0)(===AB P B P A P ,求)])([(),(),(),(___ ___AB B A P AB P B A P B A P ??。 解:625.0)()()()(=-+=?AB P B P A P B A P , 375.0)()(])[()(=-=-=AB P B P B A S P B A P , 875.0)(1)(___ --=AB P AB P , 5.0)(625.0)])([()()])([()])([(___=-=?-?=-?=?AB P AB B A P B A P AB S B A P AB B A P 3,在100,101,…,999这900个3位数中,任取一个3位数,求不包含数字1个概率。 解:在100,101,…,999这900个3位数中不包含数字1的3位数的个数为648998=??,所以所求得概率为

概率论与数理统计第三章课后习题答案

习题三 1.将一硬币抛掷三次,以X 表示在三次中出现正面的次数,以Y 表示三次中出现正面次数与 出现反面次数之差的绝对值.试写出X 和Y 的联合分布律. 【解】X 和Y 的联合分布律如表: 222??222 ??= 2.盒子里装有3只黑球、2只红球、2只白球,在其中任取4只球,以X 表示取到黑球的只数,以Y 表示取到红球的只数.求X 和Y 的联合分布律. 【解】X 和Y 的联合分布律如表: 324 C 35= 32 4 C 35= 322 4 C 35= 11322 4 C C 12C 35=132 4 C 2C 35 = 21322 4 C C 6C 35 = 2324 C 3 C 35 = 3.设二维随机变量(X ,Y )的联合分布函数为 F (x ,y )=?????≤ ≤≤≤., 020,20,sin sin 其他ππy x y x 求二维随机变量(X ,Y )在长方形域? ?? ? ??≤<≤<36,40πππy x 内的概率. 【解】如图πππ {0,}(3.2)463 P X Y <≤ <≤公式 ππππππ(,)(,)(0,)(0,)434636 F F F F --+

ππππππ sin sin sin sin sin0sin sin0sin 434636 2 (31). 4 =--+ =- 题3图 说明:也可先求出密度函数,再求概率。 4.设随机变量(X,Y)的分布密度 f(x,y)= ? ? ?> > + - . ,0 ,0 ,0 ,)4 3( 其他 y x A y x e 求:(1)常数A; (2)随机变量(X,Y)的分布函数; (3)P{0≤X<1,0≤Y<2}. 【解】(1)由-(34) 00 (,)d d e d d1 12 x y A f x y x y A x y +∞+∞+∞+∞ + -∞-∞ === ???? 得A=12 (2)由定义,有 (,)(,)d d y x F x y f u v u v -∞-∞ =?? (34)34 00 12e d d(1e)(1e)0,0, 0, 0, y y u v x y u v y x -+-- ??-->> ? == ?? ? ?? ?? 其他 (3) {01,02} P X Y ≤<≤< 12(34)38 00 {01,02} 12e d d(1e)(1e)0.9499. x y P X Y x y -+-- =<≤<≤ ==--≈ ?? 5.设随机变量(X,Y)的概率密度为 f(x,y)= ? ? ?< < < < - - . ,0 ,4 2,2 ), 6( 其他 y x y x k

概率论与数理统计第二版_课后答案_科学出版社_参考答案_

习题2参考答案 X 2 3 4 5 6 7 8 9 10 11 12 P 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36 解:根据 1)(0 ==∑∞ =k k X P ,得10 =∑∞ =-k k ae ,即111 1 =---e ae 。 故 1-=e a 解:用X 表示甲在两次投篮中所投中的次数,X~B(2, 用Y 表示乙在两次投篮中所投中的次数, Y~B(2, (1)两人投中的次数相同 P{X=Y}= P{X=0,Y=0}+ P{X=1,Y=1} +P{X=2,Y=2}= 1 1 2 2 020********* 2222220.70.30.40.60.70.30.40.60.70.30.40.60.3124C C C C C C ?+?+?=(2)甲比乙投中的次数多 P{X>Y}= P{X=1,Y=0}+ P{X=2,Y=0} +P{X=2,Y=1}= 1 2 2 1 110220022011222222 0.70.30.40.60.70.30.40.60.70.30.40.60.5628C C C C C C ?+?+?=解:(1)P{1≤X ≤3}= P{X=1}+ P{X=2}+ P{X=3}=12321515155 ++= (2)P{

解:(1)P{X=2,4,6,…}=246211112222k +++L =11[1()] 14 41314 k k lim →∞-=- (2)P{X ≥3}=1―P{X<3}=1―P{X=1}- P{X=2}=111 1244 --= 解:设i A 表示第i 次取出的是次品,X 的所有可能取值为0,1,2 12341213124123{0}{}()(|)(|)(|)P X P A A A A P A P A A P A A A P A A A A ====18171615122019181719 ???= 1123412342341234{1}{}{}{}{} 2181716182171618182161817162322019181720191817201918172019181795 P X P A A A A P A A A A P A A A A P A A A A ==+++=???+???+???+???= 12323 {2}1{0}{1}1199595 P X P X P X ==-=-==- -= 解:(1)设X 表示4次独立试验中A 发生的次数,则X~B(4, 34 314044(3)(3)(4)0.40.60.40.60.1792P X P X P X C C ≥==+==+= (2)设Y 表示5次独立试验中A 发生的次数,则Y~B(5, 3 4 5 324150555(3)(3)(4)(5)0.40.60.40.60.40.60.31744P X P X P X P X C C C ≥==+=+==++= (1)X ~P(λ)=P ×3)= P 0 1.51.5{0}0! P X e -=== 1.5 e - (2)X ~P(λ)=P ×4)= P(2) 0122 222{2}1{0}{1}1130!1! P X P X P X e e e ---≥=-=-==--=-

概率论与数理统计课程教学大纲

概率论与数理统计课程教学大纲 一、课程说明 (一)课程名称:概率论与数理统计 所属专业:物理学 课程性质:必修 学分:3 (二)课程简介、目标与任务; 《概率论与数理统计》是研究随机现象规律性的一门学科;它有着深刻的实际背景,在自然科学、社会科学、工程技术、军事和工农业生产等领域中有广泛的应用。通过本课程的学习,使学生掌握概率与数理统计的基本概念,并在一定程度上掌握概率论认识问题、解决问题的方法。同时这门课程的学习对培养学生的逻辑思维能力、分析解决问题能力也会起到一定的作用。 (三)先修课程要求,与先修课与后续相关课程之间的逻辑关系和内容衔接; 先修课程:高等数学。后续相关课程:统计物理。《概率论与数理统计》需要用到高等数学中的微积分、级数、极限等数学知识与计算方法。它又为统计物理、量子力学等课程提供了数学基础,起了重要作用。 (四)教材与主要参考书。 教材: 同济大学数学系编,工程数学–概率统计简明教程(第二版),高等教 育出版社,2012. 主要参考书: 1.浙江大学盛骤,谢式千,潘承毅编,概率论与数理统计(第四版), 高等教育出版社,2008. 2.J.L. Devore, Probability and Statistics(fifth ed.)概率论与数 理统计(第5版)影印版,高等教育出版社,2004. 二、课程内容与安排 第一章随机事件 1.1 样本空间和随机事件; 1.2 事件关系和运算。

第二章事件的概率 2.1概率的概念;2.2 古典概型;2.3几何概型;2.4 概率的公理化定义。第三章条件概率与事件的独立性 3.1 条件概率; 3.2 全概率公式; 3.3贝叶斯公式;3.4 事件的独立性; 3.5 伯努利试验和二项概率。 第四章随机变量及其分布 4.1 随机变量及分布函数;4.2离散型随机变量;4.3连续型随机变量。 第五章二维随机变量及其分布 5.1 二维随机变量及分布函数;5.2 二维离散型随机变量;5.3 二维连续随机变量;5.4 边缘分布; 5.5随机变量的独立性。 第六章随机变量的函数及其分布 6.1 一维随机变量的函数及其分布;6.2 多元随机变量的函数的分布。 第七章随机变量的数字特征 7.1数学期望与中位数; 7.2 方差和标准差; 7.3协方差和相关系数; *7.4大数律; 7.5中心极限定理。 第八章统计量和抽样分布 8.1统计与统计学;8.2统计量;8.3抽样分布。 第九章点估计

概率论与数理统计教程习题(第二章随机变量及其分布)(1)答案

概率论与数理统计练习题 系 专业 班 姓名 学号 第六章 随机变量数字特征 一.填空题 1. 若随机变量X 的概率函数为 1 .03.03.01.02.04 3211p X -,则 =≤)2(X P ;=>)3(X P ;=>=)04(X X P . 2. 若随机变量X 服从泊松分布)3(P ,则=≥)2(X P 8006.0413 ≈--e . 3. 若随机变量X 的概率函数为).4,3,2,1(,2)(=?==-k c k X P k 则=c 15 16 . 4.设A ,B 为两个随机事件,且A 与B 相互独立,P (A )=,P (B )=,则()P AB =____________.() 5.设事件A 、B 互不相容,已知()0.4=P A ,()0.5=P B ,则()=P AB 6. 盒中有4个棋子,其中2个白子,2个黑子,今有1人随机地从盒中取出2个棋子,则这2个棋子颜色相同的概率为____________.( 13 ) 7.设随机变量X 服从[0,1]上的均匀分布,则()E X =____________.( 12 ) 8.设随机变量X 服从参数为3的泊松分布,则概率密度函数为 __. (k 3 3(=,0,1,2k! P X k e k -==L )) 9.某种电器使用寿命X (单位:小时)服从参数为1 40000 λ=的指数分布,则此种电器的平 均使用寿命为____________小时.(40000) 10在3男生2女生中任取3人,用X 表示取到女生人数,则X 的概率函数为 11.若随机变量X 的概率密度为)(,1)(2 +∞<<-∞+= x x a x f ,则=a π1 ;=>)0(X P ;==)0(X P 0 . 12.若随机变量)1,1(~-U X ,则X 的概率密度为 1 (1,1) ()2 x f x ?∈-? =???其它

天津理工大学概率论与数理统计同步练习册标准答案详解

天津理工大学概率论与数理统计同步练习册答案详解

————————————————————————————————作者:————————————————————————————————日期: 2

第一章 随机变量 习题一 1、写出下列随机试验的样本空间 (1)同时掷三颗骰子,记录三颗骰子点数之和 Ω= { }1843,,,Λ (2)生产产品直到有10件正品为止,记录生产产品的总件数 Ω= { }Λ,,1110 (3)对某工厂出厂的产品进行检验,合格的记上“正品”,不合格的记上“次品”, 如连续查出2个次品就停止,或检查4个产品就停止检查,记录检查的结果。用“0”表示次品,用“1”表示正品。 Ω={111111101101011110111010110001100101010010000,,,,,,,,,,,} (4)在单位圆内任意取一点,记录它的坐标 Ω= }|),{(122<+y x y x (5)将一尺长的木棍折成三段,观察各段的长度 Ω=},,,|),,{(1000=++>>>z y x z y x z y x 其中z y x ,,分别表示第一、二、三段的长度 (6 ) .10只产品中有3只次品 ,每次从其中取一只(取后不放回) ,直到将3只次品都取出 , 写出抽取次数的基本空间U = “在 ( 6 ) 中 ,改写有放回抽取” 写出抽取次数的基本空间U = 解: ( 1 ) U = { e3 , e4 ,… e10 。} 其 中 ei 表 示 “ 抽 取 i 次 ” 的 事 件 。 i = 3、 4、 …、 10 ( 2 ) U = { e3 , e4 ,… } 其 中 ei 表 示 “ 抽 取 i 次 ” 的 事 件 。 i = 3、 4、 … 2、互不相容事件与对立事件的区别何在?说出下列各对事件的关系 (1)δ<-||a x 与δ≥-||a x 互不相容 (2)20>x 与20≤x 对立事件 (3)20>x 与18x 与22≤x 相容事件 (5)20个产品全是合格品与20个产品中只有一个废品 互不相容 (6)20个产品全是合格品与20个产品中至少有一个废品 对立事件

概率论与数理统计在生活中的应用

概率论与数理统计在生活中的应用 单位:兴隆场初级中学姓名:姜宏琼 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键字:概率、保险、彩票、统计、数据、应用 由赌徒的问题引起,概率逐渐演变成一门严谨的科学。1654年,有一个法国赌徒梅勒遇到了一个难解的问题:梅勒和他的一个朋友每人出30个金币,两人谁先赢满3局谁就得到全部赌注。在游戏进行了一会儿后,梅勒赢了2局,他的朋友赢了1局。这时候,梅勒由于一个紧急事情必须离开,游戏不得不停止。他们该如何分配赌桌上的60个金币的赌注呢?梅勒的朋友认为,既然他接下来赢的机会是梅勒的一半,那么他该拿到梅勒所得的一半,即他拿20个金币,梅勒拿40个金币。然而梅勒争执道:再掷一次骰子,即使他输了,游戏是平局,他最少也能得到全部赌注的一半——30个金币;但如果他赢了,并可拿走全部的60个金币。在下一次掷骰子之前,他实际上已经拥有了30个金币,他还有50%的机会赢得另外30个金币,所以,他应分得45个金币。 赌本究竟如何分配才合理呢?后来梅勒把这个问题告诉了当时法国著名的数学家帕斯卡,这居然也难住了帕斯卡,因为当时并没有相关知识来解决此类问题,而且两人说的似乎都有道理。帕斯卡又写信告诉了另一个著名的数学家费马,于是在这两位伟大的法国数学家之间开始了具有划时代意义的通信,在通信中,他们最终正确地解决了这个问题。他们设想:如果继续赌下去,梅勒(设为甲)和他朋友(设为乙)最终获胜的机会如何呢?他们俩至多再赌2局即可分出胜负,这2局有4种可能结果:甲甲、甲乙、乙甲、乙乙。前3种情况都是甲最后取胜,只有最后一种情况才是乙取胜,所以赌注应按3:1的比例分配,即甲得

《概率论与数理统计》课程教学大纲

《概率论与数理统计》课程教学大纲 一、课程基本信息 课程编号:450006 课程名称:概率论与数理统计 课程类别:公共基础课(必修) 学时学分:理论48学时/3学分 适用专业:计算机、自动化、经管各专业 开课学期:第一学期 先修课程:高等数学 后续课程: 执笔人: 审核人: 制(修)订时间:2015.9 二、课程性质与任务 概率论与数理统计是研究随机现象客观规律性的数学学科,是高等学校理、工、管理类本科各专业的一门重要的基础理论课。通过本课程的教学,应使学生掌握概率论与数理统计的基本概念,了解它的基本理论和方法,从而使学生初步掌握处理随机事件的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力。 三、课程教学基本要求 本课程以课堂讲授为主,致力于讲清楚基本的概率统计思想,使学生掌握基本的概率、统计计算方法。注意培养基本运算能力、分析问题和解决实际问题的能力。讲授中运用实例来说明本课程应用的广泛性和重要性。每节课布置适量的习题以巩固所学知识,使学生能够运用概率统计思想和方法解决一些实际问题。 四、课程教学内容及各教学环节要求 (一)概率论的基本概念

1、教学目的 理解随机现象、样本空间、随机事件、概率等概念,掌握事件的关系与运算,掌握古典概犁及其计算、条件概率的计算、全概率公式和贝叶斯公式的应用。 2、教学重点与难点 (1)教学重点 ① 概率、条件概率与独立性的概念; ② 加法公式;乘法公式;全概率公式;贝叶斯公式。 (2)教学难点 ① 古典概型的有关计算;② 全概率公式的应用; ③ 贝叶斯公式的应用。 3、教学方法 采用传统教学方式,以课堂讲授为主,课堂讨论、多媒体演示、课下辅导等为辅的教学方法。加强互动教学,学生对课程的某一学术问题通过检索资料、实际调查来提高自学能力和实践应用能力。 4、教学要求 (1)理解随机试验、样本空间、随机事件等基本概念;熟练掌握事件的关系及运算 (2)理解频率和概率定义;熟练掌握概率的基本性质 (3)理解等可能概型的定义性质;,会计算等可能概型的概率 (4)理解条件概率的定义;熟练掌握加法公式、乘法公式、全概率公式和贝叶斯公式(5)理解事件独立性概念,掌握应用独立性进行概率计算 (二)随机变量及其分布 1、教学目的 了解随机变量的概念;理解离散型随机变量的分布律和连续型随机变量的概率密度的概念及性质,会利用性质确定分布律和概率密度;理解分布函数的概念及性质,会利用此概念和性质确定分布函数,会利用概率分布计算有关事件的概率;掌握正态分布、均匀分布、指数分布、0-1分布、二项分布、泊松分布,会求简单的随机变量函数的分布 2、教学重点与难点 (1)教学重点 ① 随机变量及其概率分布的概念; ② 离散型随机变量分布律的求法;

概率论与数理统计及其应用第二版课后答案

第1章 随机变量及其概率 1,写出下列试验的样本空间: (1) 连续投掷一颗骰子直至6个结果中有一个结果出现两次,记录 投掷的次数。 (2) 连续投掷一颗骰子直至6个结果中有一个结果接连出现两次, 记录投掷的次数。 (3) 连续投掷一枚硬币直至正面出现,观察正反面出现的情况。 (4) 抛一枚硬币,若出现H 则再抛一次;若出现T ,则再抛一颗骰 子,观察出现的各种结果。 解:(1)}7,6,5,4,3,2{=S ;(2)},4,3,2{ =S ;(3)},,,,{ TTTH TTH TH H S =;(4)}6,5,4,3,2,1,,{T T T T T T HT HH S =。 2,设B A ,是两个事件,已知,125.0)(,5.0)(,25.0)(===AB P B P A P ,求 )])([(),(),(),(___ ___ AB B A P AB P B A P B A P ??。 解:625.0)()()()(=-+=?AB P B P A P B A P , 375.0)()(])[()(=-=-=AB P B P B A S P B A P , 875.0)(1)(___ --=AB P AB P , 5 .0)(625.0)])([()()])([()])([(___ =-=?-?=-?=?AB P AB B A P B A P AB S B A P AB B A P 3,在100,101,…,999这900个3位数中,任取一个3位数,求不包含数字1个概率。

解:在100,101,…,999这900个3位数中不包含数字1的3位数的个数为648998=??,所以所求得概率为 72.0900 648 = 4,在仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数中,任取一个三位数。(1)求该数是奇数的概率;(2)求该数大于330的概率。 解:仅由数字0,1,2,3,4,5组成且每个数字之多出现一次的全体三位数的个数有100455=??个。(1)该数是奇数的可能个数为 48344=??个,所以出现奇数的概率为 48.0100 48 = (2)该数大于330的可能个数为48454542=?+?+?,所以该数大于330的概率为 48.0100 48 = 5,袋中有5只白球,4只红球,3只黑球,在其中任取4只,求下列事件的概率。 (1)4只中恰有2只白球,1只红球,1只黑球。 (2)4只中至少有2只红球。 (3)4只中没有白球。 解: (1)所求概率为338 4 12 1 31425=C C C C ;

(完整版)概率论与数理统计课程标准

《概率论与数理统计》课程标准 一、课程概述 (一)课程定位 《概率论与数理统计》(Probability Theory and Mathematical Statistics),由概率论和数理统计两部分组成。它是研究随机现象并找出其统计规律的一门学科,是广泛应用于社会、经济、科学等各个领域的定量和定性分析的科学体系。从学科性质讲,它是一门基础性学科,它为建筑专业学生后继专业课程的学习提供方法论的指导。 (二)先修后续课程 《概率论与数理统计》的先修课程为《高等数学》、《线性代数》等,这些课程为本课程的学习奠定了理论基础。 《概率论与数理统计》的后续课程为《混凝土结构设计》、《地基与基础》等课程。通过该课程的学习可为这些课程中的模型建立等内容的知识学习奠定良好的基础,在教学中起到了承上启下的作用。 二.课程设计思路 本课程的基本设计思路是极力用较为通俗的语言阐释概率论的基本理论和数理统计思想方法;理论和方法相结合,以强调数理统计理论的应用价值。总之,强调理论与实际应用相结合的特点,力求在实际应用方面做些有益的探索,也为其它学科的

进一步学习打下一个良好的基础。 三、课程目标 《概率论与数理统计》是一门几乎遍及所有的科学技术领域以及工农业生产和国民经济各部门之中。通过学习该课程使学生掌握概率、统计的基本概念,熟悉数据处理、数据分析、数据推断的各种基本方法,并能用所掌握的方法具体解决工程实践中所遇到的各种问题。 (一)能力目标 力求在简洁的基础上使学生能从整体上了解和掌握该课程的内容体系,使学生能够在实际工作中、其它学科的学习中能灵活、自如地应用这些理论。 (二)知识目标 1.理解掌握概率论中的相关概念和公式定理; 2.学会应用概率论的知识解决一些基本的概率计算; 3.理解数理统计的基本思想和解决实际问题的方法。 (三)素质目标 1.培养学生乐于观察、分析、不断创新的精神; 2.培养具有较好的逻辑思维、较强的计划、组织和协调能力; 3.培养具有认真、细致严谨的职业能力。 四、课程内容 根据能力培养目标的要求,本课程的主要内容是随机事件、随机变量、随机向量、数字特征、极限定理。具体内容和学时分配见表4-1。 表4-1 课程内容和学时分配

概率论与数理统计课后习题答案

习题1.1解答 1. 将一枚均匀的硬币抛两次,事件C B A ,,分别表示“第一次出现正面”,“两次出现同一面”,“至少有一次出现正面”。试写出样本空间及事件C B A ,,中的样本点。 解:{=Ω(正,正),(正,反),(反,正),(反,反)} {=A (正,正),(正,反)};{=B (正,正),(反,反)} {=C (正,正),(正,反),(反,正)} 2. 在掷两颗骰子的试验中,事件D C B A ,,,分别表示“点数之和为偶数”,“点数之和小于5”,“点数相等”,“至少有一颗骰子的点数为3”。试写出样本空间及事件D C B A BC C A B A AB ---+,,,,中的样本点。 解:{})6,6(,),2,6(),1,6(,),6,2(,),2,2(),1,2(),6,1(,),2,1(),1,1( =Ω; {})1,3(),2,2(),3,1(),1,1(=AB ; {})1,2(),2,1(),6,6(),4,6(),2,6(,),5,1(),3,1(),1,1( =+B A ; Φ=C A ;{})2,2(),1,1(=BC ; {})4,6(),2,6(),1,5(),6,4(),2,4(),6,2(),4,2(),5,1(=---D C B A 3. 以C B A ,,分别表示某城市居民订阅日报、晚报和体育报。试用C B A ,,表示以下事件: (1)只订阅日报; (2)只订日报和晚报; (3)只订一种报; (4)正好订两种报; (5)至少订阅一种报; (6)不订阅任何报; (7)至多订阅一种报; (8)三种报纸都订阅; (9)三种报纸不全订阅。 解:(1)C B A ; (2)C AB ; (3)C B A C B A C B A ++; (4)BC A C B A C AB ++; (5)C B A ++; (6)C B A ; (7)C B A C B A C B A C B A +++或C B C A B A ++ (8)ABC ; (9)C B A ++ 4. 甲、乙、丙三人各射击一次,事件321,,A A A 分别表示甲、乙、丙射中。试说明下列事件所表示的结果:2A , 32A A +, 21A A , 21A A +, 321A A A , 313221A A A A A A ++. 解:甲未击中;乙和丙至少一人击中;甲和乙至多有一人击中或甲和乙至少有一人未击中;甲和乙都未击中;甲和乙击中而丙未击中;甲、乙、丙三人至少有两人击中。 5. 设事件C B A ,,满足Φ≠ABC ,试把下列事件表示为一些互不相容的事件的和:C B A ++,C AB +,AC B -. 解:如图:

概率论与数理统计

《概率论与数理统计》 姓名:黄淑芹 学号:1543201000276 班级:数学与应用数学E 时间:2017年6月

概率论与数理统计 摘要:随机现象无处不在,渗透于日常生活的方方面面和科学技术的各个领域,概率论就是通过研究随机现象及其规律从而指导人们从事物表象看到其本质的一门科学。生活中买彩票显示了小概率事件发生的几率之小,抽签与体育比赛赛制的选择用概率体现了公平与不公平,用概率来指导决策,减少错误与失败等等,显示了概率在人们日常生活中越来越重要。数理统计在人们的生活中也不断的发挥重要的作用,如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。 关键词:概率、统计、数学期望、方差、实际问题、应用 概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学。随着社会的不断发展,概率论与数理统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与人们生活息息相关的领域。本文将就概率论与数理统计的方法与思想,在日常生活中的应用展开一些讨论,,推导出某些表面上并非直观的结论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷性和实用性。 (一)、概率 要学习与概率有关的知识,首先要知道事件的定义与分类及与它们有关的运算性质: 随机事件 在抛掷一枚均匀硬币的试验中,“正面向上”是一个随机事件,可用A={正面向上}表示。 【1】随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。全体样本点组成的集合称为这个试验的样本空间,记作Ω.即Ω={ω1,ω2,…,ωn,…}。仅含一个样本点的随机事件称为基本事件,含有多个样本点的随机事件称为复合事件。 在随机试验中,随机事件一般是由若干个基本事件组成的。样本空间Ω的任一子集A称为随机事件。属于事件A的样本点出现,则称事件A发生。例如,在试验E中,令A表示“出现奇数点”,A就是一个随机事件,A还可以用样本点的集合形式表示,即A={1,3,5},它是样本空间Ω的一个子集,在试验中W中,令B表示“灯泡的寿命大于1000小时”,B也是一个随机事件,B也可用样本点的集合形式表示,即B={t|t>1000},B也是样本空间的一个子集。

《概率论与数理统计》课程重点与难点要记

《概率论与数理统计》课程重点与难点要记 第一章:随机事件及其概率 题型一:古典概型 1.房间里有10个人,分别佩戴从1号到10号的纪念章,任选3人记录其纪念章的号码,求最小号码为5的概率,及最大号码是5的概率。 2.设袋中有5个白球,3个黑球,从袋中随机摸取4个球,分别求出下列事件的概率: 1)采用有放回的方式摸球,则四球中至少有1个白球的概率; 2)采用无放回的方式摸球,则四球中有1个白球的概率。 3.一盒子中有10件产品,其中4件次品,每次随机地取一只进行检验, 1)求第二次检验到次品的概率; 2)求第二才次检验到次品的概率。 4.在1-2000的整数中随机的取一个数,问取到的整数既不能被6整除,又不能被8整除 的概率是多少?(合理的设置事件,通过概率的性质解题也很重要) 课后习题:P16:2,3,4,5, 7,9,10,11,12,13,14 P30:8,9,10,16 题型二:利用条件概率、乘法公式及事件的独立性计算事件的概率 1。3人独立去破译一个密码,他们能译出的概率分别为1/5、1/4、1/3,问能将此密码译出的概率。 2。设口袋有2n-1只白球,2n 只黑球,一次取出n 只球,如果已知取出的球都是同一种颜色,试计算该颜色是黑色的概率。 3。设袋中装有a 只红球,b 只白球,每次自袋中任取一只球,观察颜色后放回,并同时放入m 只与所取出的那只同色的球,连续在袋中取球四次,试求第一、第二次取到红球且第三次取到白球,第四次取到红球的概率。 课后习题:P23:1,2,3,4,6,10,11 P28:1,2,4,5,6,7,9,10,12, 13 题型三:全概率与贝叶斯公式 1.在一个每题有4个备选答案的测验中,假设有一个选项是正确的,如果一个学生不知道问题的正确答案,他就作随机选择。知道正确答案的学生占参加测验者的90%,试求: (1)学生回答正确的概率; (2)假如某学生回答此问题正确,那么他是随机猜出的概率。 2.一通讯通道,使用信号“0”和“1”传输信息。以A 记事件收到信号“1”,以B 记事件发出信号“1”。已知()0.4,(/)0.95,(/)0.90P B P A B P A B ===。 1)求收到信号“1”的概率? 2)现已收到信号“1”,求发出信号是“1”的概率? 课后习题:P23:7,8,9,12 P31:19,26,27,28 第二章:随机变量及其分布 题型一:关于基本概念:概率分布律、分布函数、密度函数 1.一房间有三扇同样大小的窗子,其中只有一扇是打开的。有一只鸟自开着的窗子飞入了

概率论与数理统计课本_百度文库

第二章随机变量及其分布第一节随机变量及其分布函数 一、随机变量 随机试验的结果是事件,就“事件”这一概念而言,它是定性的。要定量地研究随机现象,事件的数量化是一个基本前提。很自然的想法是,既然试验的所有可能的结果是知道的,我们就可以对每一个结果赋予一个相应的值,在结果(本事件)数值之间建立起一定的对应关系,从而对一个随机试验进行定量的描述。 例2-1 将一枚硬币掷一次,观察出现正面H、反面T的情况。这一试验有两个结果:“出现H”或“出现T”。为了便于研究,我们将每一个结果用一个实数来代表。比如,用数“1”代表“出现H”,用数“0”代表“出现T”。这样,当我们讨论试验结果时,就可以简单地说成结果是1或0。建立这种数量化的关系,实际上就相当于引入一个变量X,对于试验的两个结果,将X的值分别规定为1或0。如果与样本空间 { } {H,T}联系起来,那么,对于样本空间的不同元素,变量X可以取不同的值。因此,X是定义在样本空间上的函数,具体地说是 1,当 H X X( ) 0,当 T 由于试验结果的出现是随机的,因而X(ω)的取值也是随机的,为此我们称 X( )X(ω)为随机变量。 例2-2 在一批灯泡中任意取一只,测试它的寿命。这一试验的结果(寿命)本身就是用数值描述的。我们以X记灯泡的寿命,它的取值由试验的结果所确定,随着试验结果的不同而取不同的值,X是定义在样本空间 {t|t 0}上的函数 X X(t) t,t 因此X也是一个随机变量。一般地有 定义2-1 设 为一个随机试验的样本空间,如果对于 中的每一个元素 ,都有一个实数X( )与之相对应,则称X为随机变量。 一旦定义了随机变量X后,就可以用它来描述事件。通常,对于任意实数集合L,X在 L上的取值,记为{X L},它表示事件{ |X( ) L},即 。 {X L} { |X( ) L} 例2-3 将一枚硬币掷三次,观察出现正、反面的情况。设X为“正面出现”的次数,则X是一个随机变量。显然,X的取值为0,1,2,3。X的取值与样本点之间的对应关系如表2-1所示。 表2-1 表2-1

【概率论】概率论与数理统计在生活中的应用

概率论与数理统计在生活中的应用 材料学院 1211900133 缪克松

摘要:数学在生活中的应用越来越广,而概率也发挥着重要的作用。它不仅在科学技术、工 农业生产和经济管理中发挥着重要作用。而且它常常就发生在我们身边, 出现在我们每一 个人的生里, 只要我们善于利用概率的知识去解决问题, 概率论就会对我们的生活产生积极 的影响。 关键字:概率论;数理统计;生活 概率论与数理统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规 律进行演绎和归纳的科学。随着社会的不断发展,概率论与数理统计的知识越来越重要, 运用抽样数据进行推断已经成为现代社会一种普遍适用并且强有力的思考方式。目前,概率论与数理统计的很多原理方法已被越来越多地应用到交通、经济、医学、气象等各种与 人们生活息息相关的领域。本文将就概率论与数理统计的方法与思想,在日常生活中的应 用展开一些讨论,从中可以看出概率方法与数理统计的思想在解决问题中的高效性、简捷 性和实用性。 一.随机现象与概率 在自然界和现实生活中, 一些事物都是相互联系和不断发展的。在它们彼此间的联系 和发展中, 根据它们是否有必然的因果联系, 可以分成两大类: 一类是确定性的现象, 指 在一定条件下, 必定会导致某种确定的结果。如, 在标准大气压下, 水加热到 100 ℃, 就 必然会沸腾。事物间的这种联系是属于必然性的。另一类是不确定性的现象。这类现象在 一定条件下的结果是不确定的。例如, 同一个工人在同一台机床上加工同一种零件若干个, 它们的尺寸总会有一点差异。又如, 在同样条件下, 进行小麦品种的人工催芽试验, 各颗 种子的发芽情况也不尽相同有强弱和早晚之别等。为什么在相同的情况下, 会出现这种不 确定的结果呢? 这是因为, 人们说的“相同条件”是指一些主要条件来说的, 除了这些主 要条件外, 还会有许多次要条件和偶然因素是人们无法事先预料的。这类现象, 人们无法 用必然性的因果关系, 对现象的结果事先做出确定的答案。事物间的这种关系是属于偶然 性的, 这种现象叫做偶然现象,或者叫做随机现象。概率, 简单地说, 就是一件事发生的可能性的大小。比如: 太阳每天都会东升西落, 这件事发生的概率就是 100% 或者说是 1, 因为它肯定会发生; 而太阳西升东落的概率就是 0, 因为它肯定不会发生。但生活中的很 多现象是既有可能发生, 也有可能不发生的, 比如某天会不会下雨、买东西买到次品等等, 这类事件的概率就介于 0 和 100% 之间, 或者说 0 和 1 之间。在日常生活中无论是股市涨跌, 还是发生某类事故, 但凡捉摸不定、需要用运气来解释的事件, 都可用概率模型进行定量分析。不确定性既给人们带来许多麻烦, 同时又常常是解决问题的一种有效手段甚 至唯一手段。 二. 社会热点与概率论诠释 社会热点 1 进入 21 世纪后,各种特大自然灾害不断出现,日本发生里氏 9. 0 级强震、冰岛南部冰川火山喷发、印尼地震引发海啸等,“ 2012 地球毁灭之说”是否是真的。 社会热点 2 中国福利彩票巨奖频现,继 2009 年河南彩民独中 3. 6 亿元之后, 2010 年一河南彩民博得 2. 58 亿元,近日浙江一彩民狂揽 5. 65 亿元。这几把接力“火炬”,无 疑让中国福彩业沸腾了,但并非人人都有这样的好运气。 概率论知识———小概率事件必然发生 以上热点 1 和热点 2 都是概率论里提及的小概率事件,意指发生可能性很小的事件。小概率事件的原理又称为似然推理,即如果一个事件发生的概率很小,那么在一次 试验中,可以把它看成是不可能事件。如考虑福彩双色球每一注中 500 万大奖的概率为p,则 p=1C633* C116=11 107 568* 16≈5. 64*10^-8,是典型的小概率事件,在一次

相关文档
相关文档 最新文档