《概率论与数理统计》总复习提纲
第一块随机事件及其概率
内容提要
基本内容:随机事件与样本空间,事件的关系与运算,概率的概念和基本性质,古典概率,几何概率,条件概率,与条件概率有关的三个公式,事件的独立性,贝努里试验.
1、随机试验、样本空间与随机事件
(1)随机试验:具有以下三个特点的试验称为随机试验,记为.
1)试验可在相同的条件下重复进行;
2)每次试验的结果具有多种可能性,但试验之前可确知试验的所有可能结果;
3)每次试验前不能确定哪一个结果会出现.
(2)样本空间:随机试验的所有可能结果组成的集合称为的样本空间记为Ω;试验的每一个可能结果,即Ω中的元素,称为样本点,记为.
(3)随机事件:在一定条件下,可能出现也可能不出现的事件称为随机事件,简称事件;也可表述为事件就是样本空间的子集,必然事件(记为)和不可能事件(记为).
2、事件的关系与运算
(1)包含关系与相等:“事件发生必导致发生”,记为或;且.
(2)互不相容性:;互为对立事件且.
(3)独立性:
(1)设为事件,若有,则称事件与相互独立. 等价于:若
().
(2)多个事件的独立:设是n个事件,如果对任意的,任意的
,具有等式,称个事件相互独立.
3、事件的运算
(1)和事件(并):“事件与至少有一个发生”,记为.
(2)积事件(交):“事件与同时发生”,记为或.
(3)差事件、对立事件(余事件):“事件发生而不发生”,记为称为与的差事件;
称为的对立事件;易知:.
4、事件的运算法则
1) 交换律:,;
2) 结合律:,;
3) 分配律:,;
4) 对偶(De Morgan)律:,,
可推广
5、概率的概念
(1)概率的公理化定义:
(2)频率的定义:事件在次重复试验中出现次,则比值称为事件在次重复试验中出现的频率,记为,即.
(3)统计概率:称为事件的(统计)概率.
在实际问题中,当很大时,取
(4)古典概率:若试验的基本结果数为有限个,且每个事件发生的可能性相等,
则(试验对应古典概型)事件发生的概率为:
.
(5)几何概率:若试验基本结果数无限,随机点落在某区域g的概率与区域g的测度(长度、面积、体积等)成正比,而与其位置及形状无关,则(试验对应几何概型),“在区域中随机地取一点落在区域中”这一事件发
生的概率为:
.
(6)主观概率:人们根据经验对该事件发生的可能性所给出的个人信念.
6、概率的基本性质
(1)不可能事件概率零:=0.
(2)有限可加性:设是n个两两互不相容的事件,即=,(),则有=+.
(3)单调不减性:若事件,且
.
(4)互逆性:且.
(5)加法公式:对任意两事件,有-;此性质可推广到任意个事件
的情形.
(6)可分性:对任意两事件,有,且
7、条件概率与乘法公式
(1)条件概率:设是两个事件,即,则
称为事件发生的条件下事件发生的条件概率.
(2)乘法公式:设且则
称为事件的概率乘法公式.
8、全概率公式与贝叶斯(Bayes)公式
(1)全概率公式:设是的一个划分,且,,则对任何事件,有
称为全概率公式.
(2)贝叶斯(Bayes)公式:设是的一个划分,且,则对任何事件,有
称为贝叶斯公式或逆概率公式.
9、贝努里(Bernoulli)概型
(1)只有两个可能结果的试验称为贝努里试验,常记为.也叫做“成功—失败”试验,“成功”的概率常用表示,其中=“成功”.
(2)把重复独立地进行次,所得的试验称为重贝努里试验,记为.
(3)把重复独立地进行可列多次,所得的试验称为可列重贝努里试验,记为.以上三种贝努里试验统称为贝努里概型.
(4)中成功次的概率是:其中.
疑难分析
1、必然事件与不可能事件
必然事件是在一定条件下必然发生的事件,不可能事件指的是在一定条件下必然不发生的事件.它们都不具有随机性,是确定性的现象,但为研究的方便,把它们看作特殊的随机事件.
2、互逆事件与互斥(不相容)事件
如果两个事件与必有一个事件发生,且至多有一个事件发生,则、为互逆事件;如果两个事件与
不能同时发生,则、为互斥事件.因而,互逆必定互斥,互斥未必互逆.区别两者的关键是:当样本空间只
有两个事件时,两事件才可能互逆,而互斥适用与多个事件的情形.作为互斥事件在一次试验中两者可以都不发生,而互逆事件必发生一个且只发生一个.
3、两事件独立与两事件互斥
两事件、独立,则与中任一个事件的发生与另一个事件的发生无关,这时;而两事件互斥,则其中任一个事件的发生必然导致另一个事件不发生,这两事件的发生是有影响的,
这时.可以用图形作一直观
解释.在图1.1左边的正方形中,
图1.1
,表示样本空间中两事件的独立关系,而在右边的正方形中,,表示样本空间中两事件的互斥关系.
4、条件概率与积事件概率
是在样本空间内,事件的概率,而是在试验增加了新条件发生后的缩减的样本空间中计算事件的概率.虽然、都发生,但两者是不同的,一般说来,当、同时发生时,常用,而在有包含关系或明确的主从关系时,用.如袋中有9个白球1个红球,作不放回抽样,每次任取一球,取2次,求:(1)第二次才取到白球的概率;(2)第一次取到的是白球的条件下,第二次取到白球的概率.问题(1)求的就是一个积事件概率的问题,而问题(2)求的就是一个条件概率的问题.
5、全概率公式与贝叶斯(Bayes)公式
当所求的事件概率为许多因素引发的某种结果,而该结果又不能简单地看作这诸多事件之和时,可考虑用全概率公式,在对样本空间进行划分时,一定要注意它必须满足的两个条件.贝叶斯公式用于试验结果已知,追查是何种原因(情况、条件)下引发的概率.
第二块随机变量及其分布
内容提要
基本内容:随机变量,随机变量的分布的概念及其性质,离散型随机变量的概率分布,连续型随机变量的概率分布,常见随机变量的分布,随机变量函数的分布.
1、随机变量
设是随机试验的样本空间,如果对于试验的每一个可能结果,都有唯一的实数与之对应,则称为定义在上的随机变量,简记为.随机变量通常用大写字母等表示.
2、离散型随机变量及其分布列
如果随机变量只能取有限个或可列个可能值,则称为离散型随机变量.如果的一切可能值为
,并且取的概率为,则称
为离散型随机变量的概率函数(概率分布或分布律).也称分布列,常记为
其中.
常见的离散型随机变量的分布有:
(1)两点分布(0-1分布):记为,分布列为
或
(2)二项分布:记为,概率函数
(3)泊松分布,记为,概率函数
泊松定理设是一常数,是任意正整数,设,则对于任一固定的非负整数,有
.
当很大且很小时,二项分布可以用泊松分布近似代替,即
,其中
(4)超几何分布:记为,概率函数
,其中为正整数,且.
当很大,且较小时,有
(5)几何分布:记为,概率函数
.
3、分布函数及其性质
分布函数的定义:设为随机变量,为任意实数,函数
称为随机变量的分布函数.
分布函数完整地描述了随机变量取值的统计规律性,具有以下性质:
(1)有界性;
(2)单调性如果,则;
(3)右连续,即;
(4)极限性;
(5)完美性.
4、连续型随机变量及其分布分布
如果对于随机变量的分布函数,存在非负函数,使对于任一实数,有,则称为连续型随机变量.函数称为的概率密度函数.
概率密度函数具有以下性质:
(1);(2);
(3);(4);
(5)如果在处连续,则.
常用连续型随机变量的分布:
(1)均匀分布:记为,概率密度为
分布函数为
(2)指数分布:记为,概率密度为
分布函数为
(3)正态分布:记为,概率密度为
,
相应的分布函数为
当时,即时,称服从标准正态分布.这时分别用和表示的密度函数和分布函数,即
具有性质:①.
②一般正态分布的分布函数与标准正态分布的分布函数有关系:
.
5、随机变量函数的分布
(1)离散型随机变量函数的分布
设为离散型随机变量,其分布列为(表2-2):
表2-2
则任为离散型随机变量,其分布列为(表2-3):
表2-3
……
有相同值时,要合并为一项,对应的概率相加.
(2)连续型随机变量函数的分布
设为离散型随机变量,概率密度为,则的概率密度有两种方法可求.
1)定理法:若在的取值区间内有连续导数,且单调时,是连续型随机变量,其概率密度为
.
其中是的反函数.
2)分布函数法:先求的分布函数
然后求.
疑难分析
1、随机变量与普通函数
随机变量是定义在随机试验的样本空间上,对试验的每一个可能结果,都有唯一的实数与之对应.从定义可知:普通函数的取值是按一定法则给定的,而随机变量的取值是由统计规律性给出的,具有随机性;又普通函数的定义域是一个区间,而随机变量的定义域是样本空间.
2、分布函数的连续性
定义左连续或右连续只是一种习惯.有的书籍定义分布函数左连续,但大多数书籍定义分布函数为
右连续. 左连续与右连续的区别在于计算时,点的概率是否计算在内.对于连续型随机变量,由于
,故定义左连续或右连续没有什么区别;对于离散型随机变量,由于,则定义左连续或右连续时值就不相同,这时,就要注意对定义左连续还是右连续.
第三块多维随机变量及其分布
内容提要
基本内容:多维随机变量及其分布函数二维离散型随机变量的联合分布列,二维连续型随机变量的联合分布函数和联合密度函数,边际分布,随机变量的独立性和不相关性,常用多维随机变量,随机向量函数的分布.
1、二维随机变量及其联合分布函数
为n维(n元)随机变量或随机向量.
联合分布函数的定义设
随机变量,
为随机向量的联合分布函数
二维联合分布函数具有以下基本性质:
(1)单调性
是变量或的非减函数;
(2)有界性
;
(3)极限性
(3)连续性
关于右连续,关于也右连续;
(4)非负性对任意点,若,则
.
式表示随机点落在区域内的概率为:.
2、二维离散型随机变量及其联合分布列
如果二维随机变量所有可能取值是有限对或可列对,则称为二维离散型随机变量.
设为二维离散型随机变量,它的所有可能取值
为
将
或表3.1称为的联合分布列.
表3.1
……
……
联合分布列具有下列性质:(1);(2).
3、二维连续型随机变量及其概率密度函数
如果存在一个非负函数,使得二维随机变量的分布函数对任意实数有
,则称是二维连续型随机变量,称为的联合密度函数(或概率密度函数).
联合密度函数具有下列性质:
(1)非负性对一切实数,有;
(2)规范性;
(3)在任意平面域上,取值的概率
;
(4)如果在处连续,则.
4、二维随机变量的边缘分布
设为二维随机变量,则称
分别为关于和关于的边缘(边际)分布函数.
当为离散型随机变量,则称
分别为关于和关于的边缘分布列.
当为连续型随机变量,则称
分别为关于和关于的边缘密度函数.
5、二维随机变量的条件分布(了解)
(1)离散型随机变量的条件分布
设为二维离散型随机变量,其联合分布律和边缘分布列分别为
,则当固定,且
时,称
为条件下随机变量的条件分布律.同理,有
(2)连续型随机变量的条件分布
设为二维连续型随机变量,其联合密度函数和边缘密度函数分别为:.则当
时,在和的连续点处,在条件下,的条件概率密度函数为
.
同理,.
6、随机变量的独立性
设及分别是的联合分布函数及边缘分布函数.如果对任何实数有
则称随机变量与相互独立.
设为二维离散型随机变量,与相互独立的充要条件是
.
设为二维连续型随机变量,与相互独立的充要条件是对几乎一切实数,有
.
7、两个随机变量函数的分布
设二维随机变量的联合概率密度函数为,是的函数,则的分布函数为
.
(1)的分布
若为离散型随机变量,联合分布列为,则的概率函数为:
或.
若为连续型随机变量,概率密度函数为,则的概率函数为:
.
(2)的分布
若为连续型随机变量,概率密度函数为,则的概率函数为:
.
8.最大值与最小值的分布
则
9.数理统计中常用的分布
(1)正态分布:
(2):
(3):
(4):
疑难分析
1、事件表示事件与的积事件,为什么不一定等于
?
如同仅当事件相互独立时,才有一样,这里
依乘法原理.只有事件与
相互独立时,才有
,因为.
2、二维随机变量的联合分布、边缘分布及条件分布之间存在什么样的关系?
由边缘分布与条件分布的定义与公式知,联合分布唯一确定边缘分布,因而也唯一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由知,一个条件分布和它对应的边缘分布,能唯一确定联合分布.
但是,如果相互独立,则,即.说明当独立时,边缘分布也唯一确定联合分布,从而条件分布也唯一确定联合分布.
3、两个随机变量相互独立的概念与两个事件相互独立是否相同?为什么?
两个随机变量相互独立,是指组成二维随机变量的两个分量中一个分量的取值不受另一个分量取值的影响,满足.而两个事件的独立性,是指一个事件的发生不受另一个事件发生的影响,故有.两者可以说不是一个问题.
但是,组成二维随机变量的两个分量是同一试验的样本空间上的两个一维随机变量,而
也是一个试验的样本空间的两个事件.因此,若把“”、“”看作两个事件,那么两者的意义近乎一致,从而独立性的定义几乎是相同的.
第四块随机变量的数字特征
内容提要
基本内容:随机变量的数学期望和方差、标准差及其性质,随机变量函数的数学期望,原点矩和中心矩,协方差和相关系数及其性质.
1、随机变量的数学期望
设离散型随机变量的分布列为,如果级数绝对收敛,则称级数的和为随机变量的数学期望.
设连续型随机变量的密度函数为,如果广义积分绝对收敛,则称此积分值
为随机变量的数学期望.
数学期望有如下性质:
(1)设是常数,则;
(2)设是常数,则;
(3)若是随机变量,则;
对任意个随机变量,有
;
(4)若相互独立,则;
对任意个相互独立的随机变量,有
.
2、随机变量函数的数学期望
设离散型随机变量的分布律为,则的函数的数学期望为
,式中级数绝对收敛.
设连续型随机变量的密度函数为,则的函数的数学期望为,式中积分绝对收敛.
3、随机变量的方差
设是一个随机变量,则称为的方差.称为的标准差或均方差.
计算方差也常用公式.
方差具有如下性质:
(1)设是常数,则;
(2)设是常数,则;
(3)若相互独立,则;
对任意个相互独立的随机变量,有
;
(4)的充要条件是:存在常数,使.
4、几种常见分布的数学期望与方差
(1);
(2);
(3);
(4);
(5);
(6);
(7);
(8).
5、矩
设是随机变量,则称为的阶原点矩.
如果存在,则称为的阶中心矩.
设是二维随机变量,则称为的阶混合原点矩;
称为的阶混合中心矩.
6、协方差与相关系数
随机变量的协方差为.它是1+1阶混合中心矩,有计算公式:
.
随机变量的相关系数为
.
相关系数具有如下性质:
(1);
(2)存在常数,使=1,即与以概率1线性相关;
(3)若独立,则,即不相关.反之,不一定成立.
(4)(Schwarz inequality) 设(X,Y)是二维随机变量,若X与Y的方差都存在,则
疑难分析
1、随机变量的数字特征在概率论中有什么意义?
知道一个随机变量的分布函数,就掌握了这个随机变量的统计规律性.但求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征则比较简单易求,也能满足我们研究分析具体问题的需要,所以在概率论中很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义.
例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均时间、平均成绩、期望利润、期望成本等;方差反映了随机变量取值的波动程度;偏态系数、峰态系数则反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的实际问题.
2、在数学期望定义中为什么要求级数和广义积分绝对收敛?
首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数有同样的意义.要求级数和广义积分绝对收敛是为了保证数学期望的存在与求出.
3、相关系数反映了随机变量和之间的什么关系?
相关系数是用随机变量和的协方差和标准差来定义的,它反映了随机变量和之间的相关程度.当时,称与依概率1线性相关;当时,称与不相关;当时,又分为强相关与弱相关.
4、两个随机变量与相互独立和不相关是一种什么样的关系?
(1)若、相互独立,则、不相关.因为、独立,则,故
,从而
,所以、不相关.
(2)若、不相关,则、不一定独立.如:
因为,
,知、不相关.但,
,,知、不独立.
(3)若、相关,则、一定不独立.可由反证法说明.
(4)若、不相关,则、不一定不相关.因为、不独立,
,但若时,可以有,从而可以有、不相关.
但是,也有特殊情况,如服从二维正态分布时,、不相关与、独立是等价的.
第五块大数定律和中心极限定理
内容提要
基本内容:切比雪夫(Chebyshev)不等式,切比雪夫大数定律,伯努里(Bernoulli)大数定律,辛钦(Khinchine)大数定律,棣莫弗-拉普拉斯(De Moivre-Laplace)定理,列维-林维德伯格(Levy-Lindberg)定理.
1、切贝雪夫不等式
设随机变量的数学期望,方差,则对任意正数,有不等式
或成立.
2、大数定律
(1)切贝雪夫大数定律:设是相互独立的随机变量序列,数学期望和方差都
存在,且,则对任意给定的,有
.
(2)贝努利大数定律:设是次重复独立试验中事件发生的次数,是事件在一次试验中发生的概率,则对于任意给定的,有.
贝努利大数定理给出了当很大时,发生的频率依概率收敛于的概率,证明了频率的稳定性.
(3)辛钦大数定律:设相互独立,服从同一分布的随机变量序列,且(),则对任意给定的,有
3、中心极限定律
(1)林德贝格-勒维中心极限定理:设是独立同分布的随机变量序列,有有限的数学期望和方差,,.则对任意实数,随机变量的
分布函数满足.
(2)李雅普诺夫定理:设是不同分布且相互独立的随机变量,它们分别有数学期望和方差:
,.记,若存在正数,,使得当时,有