则称为连续型随机向量;并称f(x,y) 为 =( X, Y)的
分布密度或称为X 和 Y 的联合分布密度。
分布密度 f(x,y) 具有下面两个性质:
(1)f(x,y)≥0;
(2)
(2)二维随
机变量的本
质
(3)联合分设( X, Y)为二维随机变量,对于任意实数x,y,二元函数
布函数
称为二维随机向量(X ,Y )的分布函数,或称为随机变量X 和 Y 的联合分布
函数。
分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数 F(x,y) 具有以下的基本性质:
( 1)
( 2) F( x,y )分别对 x 和 y 是非减的,即
当 x2>x1 时,有 F( x2,y)≥F(x1,y);当 y2>y1 时,有 F(x,y2)≥F(x,y1);
(3) F( x,y )分别对 x 和 y 是右连续的,即
(4)
(5)对于
.
(4)离散
型与连续型
的关系
(5)边缘分离散型X 的边缘分布为
布;
Y的边缘分布为
。
连续型X 的边缘分布密度为
Y 的边缘分布密度为
(6)条件分离散型在已知X=xi的条件下,Y 取值的条件分布为
布
在已知Y=yj的条件下,X 取值的条件分布为
连续型在已知Y=y的条件下,X 的条件分布密度为
;
在已知X=x的条件下,Y 的条件分布密度为
F(X,Y)=FX(x)FY(y)
(7)独立性一般型
离散型
有零不独立
连续型f(x,y)=fX(x)fY(y)
直接判断,充要条件:
①可分离变量
②正概率密度区间为矩形
二维正态分布
=0
随机变量的函数若 X1,X2, ?Xm,Xm+1,?Xn相互独立,h,g 为连续函
数,则:
h(X1 ,X2, ? Xm)和 g( Xm+1,? Xn )相互独立。
特例:若 X 与 Y 独立,则: h(X )和 g( Y)独立。
例如:若 X 与 Y 独立,则: 3X+1 和 5Y-2 独立。
(8)二维均设随机向量(X , Y )的分布密度函数为
匀分布
其中 SD 为区域 D 的面积,则称( X ,Y )服从 D 上的均匀分布,记为( X ,Y )~
U(D)。
例如图 3.1、图 3.2 和图 3.3。
y
1
D1
O1x
图 3.1
y
D2
1
1
O 2 x
图3.2
y
D3
d
c
O a b x
图3.3
(9)二维正设随机向量( X , Y )的分布密度函数为
态分布
其中是 5 个参数,则称( X , Y)服从二维正态分布,记
为( X,Y)~ N(
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,
即 X~N(
但是若 X ~ N(, (X , Y) 未必是二维正态分布。
( 10 )函数 Z=X+Y根据定义计算:
分布对于连续型, fZ(z) =
两个独立的正态分布的和仍为正态分布()。
n 个相互独立的正态分布的线性组合,仍服从正态分布。
,
Z=max,min(X1,X2,? Xn)若相互独立,其分布函数分别为,则
Z=max,min(X1,X2, ? Xn)的分布函数为:
分布设 n 个随机变量相互独立,且服从标准正态分布,可
以证明它们的平方和
的分布密度为
我们称随机变量W 服从自由度为n 的分布,记为
W~,其中
它是随机变
所谓自由度是指独立正态随机变量的个数,
量分布中的一个重要参数。
分布满足可加性:设
则
t 分布设 X,Y是两个相互独立的随机变量,且
可以证明函数
的概率密度为
我们称随机变量T 服从自由度为n 的 t分布,记为T ~
t(n)。
F 分布设,且X 与Y 独立,可以证明的概率密度函数为
n1,第二个自
我们称随机变量 F 服从第一个自由度为
由度为 n2 的 F 分布,记为F~ f(n1, n2).
第四章随机变量的数字特征
(1)一离散型连续型
维随机期望设 X 是离散型随机变量,其分布设 X 是连续型随机变量,其概率密
变量的期望就是平均值律为 P( )= pk, k=1,2,?,n,度为 f(x) ,
数字特
征(要求绝对收敛)(要求绝对收敛)
函数的期望Y=g(X)Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差
,
矩①对于正整数 k,称随机变量 X 的①对于正整数 k,称随机变量 X 的 k
k 次幂的数学期望为 X 的 k 阶原点次幂的数学期望为X 的 k 阶原点矩,
矩,记为 vk, 即记为 vk, 即
ν k=E(Xk)= , k=1,2,?.ν k=E(Xk)=
②对于正整数 k,称随机变量 X 与 k=1,2, ?.
E( X )差的 k 次幂的数学期望为②对于正整数 k,称随机变量 X 与 E
X 的 k 阶中心矩,记为,即( X )差的 k 次幂的数学期望为 X 的
k 阶中心矩,记为,即
= , k=1,2, ?.
=
k=1,2, ?.
切比雪夫不等式设随机变量 X 具有数学期望 E( X ) =μ,方差 D( X ) =σ2,则对于任
意正数ε,有下列切比雪夫不等式
切比雪夫不等式给出了在未知X 的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期(1)E(C)=C
望的性(2)E(CX)=CE(X)
质(3)E(X+Y)=E(X)+E(Y) ,
(4)E(XY)=E(X) E(Y),充分条件: X 和 Y 独立;
充要条件: X 和 Y 不相关。
(3)方(1)D(C)=0 ; E(C)=C
差的性(2)D(aX)=a2D(X) ; E(aX)=aE(X)
质(3)D(aX+b)= a2D(X) ; E(aX+b)=aE(X)+b
(4)D(X)=E(X2)-E2(X)
(5)D(X±Y)=D(X)+D(Y) ,充分条件: X 和 Y 独立;
充要条件: X 和 Y 不相关。
D(X±Y)=D(X)+D(Y)±2E[(X-E(X))(Y-E(Y))] ,无条件成立。
而 E(X+Y)=E(X)+E(Y) ,无条件成立。
(4)常期望方差
见分布0-1 分布p
的期望二项分布np
和方差泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
n2n
t 分布0(n>2)
(5)二期望
维随机
变量的函数的期望==
数字特
征方差
协方差对于随机变量X 与 Y,称它们的二阶混合中心矩为 X与Y的协方差
或相关矩,记为,即
相关系数与记号相对应,
对于随机变量X
X
与
与 Y 的方差 D( X)与 D( Y )也可分别记为
Y,如果 D (X ) >0, D(Y)>0 ,则称
与。
为 X 与Y 的相关系数,记作(有时可简记为)。
| |≤1,当| |=1 时,称X 与 Y完全相关:
完全相关
而当时,称X与Y不相关。
以下五个命题是等价的:
① ;
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩对于随机变量
原点矩,记为X 与 Y ,如果有存在,则称之为
;k+l 阶混合中心矩记为:
X 与Y 的k+l阶混合
(6)协 (i)方差的 (ii)性质(iii)
cov (X, Y)=cov (Y, X);
cov(aX,bY)=ab cov(X,Y);
cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);
(iv)cov(X,Y)=E(XY)-E(X)E(Y).
(7)独(i )若随机变量X 与 Y 相互独立,则;反之不真。
立和不(ii )若(X,Y)~N(),
相关则 X 与 Y 相互独立的充要条件是X 和 Y 不相关。
第五章大数定律和中心极限定理
(1)大数定律切比雪设随机变量X1 , X2 ,?相互独立,均具有有限方差,且被同
夫大数一常数 C 所界: D (Xi ) 定律
特殊情形:若X1 ,X2 ,?具有相同的数学期望E( XI )=μ,
则上式成为
伯努利设μ是 n 次独立试验中事件 A 发生的次数, p 是事件 A 在每次
大数定试验中发生的概率,则对于任意的正数ε,有
律
伯努利大数定律说明,当试验次数 n 很大时,事件 A 发生的频
率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大设 X1 ,X2 ,?, Xn ,?是相互独立同分布的随机变量序列,
数定律且 E(Xn )=μ,则对于任意的正数ε有
(2)中心极限定理列维-设随机变量 X1 , X2 ,?相互独立,服从同一分布,且具有相
林德伯同的数学期望和方差:,则随机变量
格定理
的分布函数Fn(x) 对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗设随机变量为具有参数n, p(0
-拉普数 x,有
拉斯定
理
(3)二项定理若当,则
超几何分布的极限分布为二项分布。
(4)泊松定理若当,则
其中 k=0 ,1, 2,?, n,?。
二项分布的极限分布为泊松分布。
第六章样本及抽样分布
( 1 )数理统总体在数理统计中,常把被考察对象的某一个(或多个)指标的全
计的基本概体称为总体(或母体)。我们总是把总体看成一个具有分布的随
念机变量(或随机向量)。
个体总体中的每一个单元称为样品(或个体)。
样本我们把从总体中抽取的部分样品称为样本。样本中所含的样品
数称为样本容量,一般用n 表示。在一般情况下,总是把样本
看成是 n 个相互独立的且与总体有相同分布的随机变量,这样
的样本称为简单随机样本。在泛指任一次抽取的结果时,表示
n 个随机变量(样本);在具体的一次抽取之后,表示 n 个具体
的数值(样本值)。我们称之为样本的两重性。
样本函数和统设为总体的一个样本,称
计量()
为样本函数,其中为一个连续函数。如果中不包含任何未知
参数,则称()为一个统计量。
常见统计量及样本均值
其性质样本方差
样本标准差
样本 k 阶原点矩
样本 k 阶中心矩
,,
,,
其中,为二阶中心矩。
( 2 )正态总正态分布设为来自正态总体的一个样本,则样本函数体下的四
大
分布t 分布设为来自正态总体的一个样本,则样本函数
其中 t(n-1)表示自由度为 n-1 的 t 分布。
设为来自正态总体的一个样本,则样本函数
其中表示自由度为n-1 的分布。
F 分布设为来自正态总体的一个样本,而为来自正态总体的一个
样本,则样本函数
其中
表示第一自由度为,第二自由度为的F分布。
(3 )正态总与独立。
体下分布的
性质
第七章参数估计
(1)点估矩估计设总体X的分布中包含有未知数,则其分布函数可以表成它的k 计点矩中也包含了未知参数,即。又设为总体X的n个样本值,本的 k 阶原点矩为阶原其样
这样,我们按照―当参数等于其估计量时,总体矩等于相应的样本
矩原则建立方程,即有
‖的
由上面的m 个方程中,解出的m 个未知参数即为参数()的矩估计
量。
若为的矩估计,为连续函数,则为的矩估计。
极大似然当总体 X 为连续型随机变量时,设其分布密度为,其中为未知参数。
估计又设为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体 X 为离型随机变量时,设其分布律为,则称
为样本的似然函数。
若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。
若为的极大似然估计,为单调函数,则为的极大似然估计。
(2)估计无偏性设为未知参数的估计量。若 E ()=,则称为的无偏估计量。
量的评选E() =E( X ), E( S2)=D (X )
标准有效性设和是未知参数的两个无偏估计量。若,则称有效。
一致性设是的一串估计量,如果对于任意的正数,都有
则称为的一致估计量(或相合估计量)。
若为的无偏估计,且则为的一致估计。
只要总体的E(X) 和 D(X) 存在,一切样本矩和样本矩的连续函数都是相
应总体的一致估计量。
(3)区间置信区间设总体 X 含有一个待估的未知参数。如果我们从样本出发,找出两个估计和置信度统计量与,使得区间以的概率包含这个待估参数,即
那么称区间为的置信区间,为该区间的置信度(或置信水平)。单正
态总设为总体的一个样本,在置信度为下,我们来确定的置信区间体的期望
具体步骤如下:
。和方差的( i )选择样本函数;
区间估计( ii )由置信度,查表找分位数;
( iii )导出置信区间。
已知方差,估计均值
未知方差,估计均值
方差的区间估计
( iii )导出的置信区间
第八章基本思想假设检验
假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会
发生的,即小概率原理。
为了检验一个假设H0 是否成立。我们先假定H0 是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0 是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称 H0 是相容的。与H0 相对的假设称为备择假设,用H1 表示。
这里所说的小概率事件就是事件,其概率就是检验水平α,通常我们取α=0.05,有时也取 0.01 或 0.10。
基本步骤假设检验的基本步骤如下:
(i)提出零假设H0;
(ii)选择统计量 K ;
(iii)对于检验水平α查表找分位数λ;
(iv)由样本值计算统计量之值 K ;
两类错误将进行比较,作出判断:当时否定H0,否则认为H0 相容。
第一类错误当 H0 为真时,而样本值却落入了否定域,按照我们规定的
检验法则,应当否定H0 。这时,我们把客观上H0 成立判为
H0 为不成立(即否定了真实的假设),称这种错误为―以真
当假‖的错误或第一类错误,记为犯此类错误的概率,即
P{ 否定 H0|H0 为真 }=;
(ii) 查表找分位数
( iii )导出置信区间
( i)选择样本函数
(ii) 查表找分位数
( iii )导出置信区间
( i)选择样本函数
( ii )查表找分位数
( i)选择样本函数
此处的α恰好为检验水平。
第二类错误当 H1 为真时,而样本值却落入了相容域,按照我们规定的
检验法则,应当接受 H0 。这时,我们把客观上 H0。不成立判为
H0 成立(即接受了不真实的假设),称这种错误为―以假当
真‖的错误或第二类错误,记为犯此类错误的概率,即
P{ 接受 H0|H1 为真 }=。
两类错误的关系人们当然希望犯两类错误的概率同时都很小。但是,当容量
n 一定时,变小,则变大;相反地,变小,则变大。取定要
想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给
定显著性水平α。α大小的选取应根据实际情况而定。当
我们宁可―以假为真‖、而不愿―以真当假‖时,则应把α
取得很小,如 0.01,甚至 0.001。反之,则应把α取得大些。单正态总体均值和方差的假设检验
条件零假设统计量对应样本
否定域函数分布
已知N ( 0,1)未知
未知
公式整理
1.随机事件及其概率
A A A
吸收律: A A A
A (AB) A A(AB)A
A B AB A( AB)
反演律:A B A B AB A B
n n n n
A i A i A i A i
i 1i 1i 1i1
2.概率的定义及其计算
P( A)1P( A)
若 A B P(B A)P( B)P( A)
对任意两个事件 A, B,有P(B A) P(B)P( AB)
加法公式:对任意两个事件A, B,有
P( A B)P( A) P(B)P( AB)
P( A B)P( A) P( B)
n n n
( 1) n 1 P( A1 A2 A n ) 3.P( A i )P( A i )P( A i A j )P( A i A j A k )
i 1i 1 1 i j n 1 i j k n
条件概率P B A P( AB) P( A)
乘法公式
P( AB)P( A)P B A(P(A)0)
P( A1 A2A n ) P( A1 )P A2 A1P A n A
1
A
2
A
n 1全概率公式
(P(A1A2A n 1 ) 0) n n
P( A)
i1P( AB i )
i 1
P( B i ) P( A B i )
Bayes 公式
P( B k A)P( AB k )P(B k ) P( A B k ) P( A)n
P( B i ) P(A B i )
i 1
4.随机变量及其分布
分布函数计算
P( a X b) P( X b) P(X a)
F (b) F (a)
5.离散型随机变量
(1)0–1 分布
P( X k ) p k (1 p)1 k , k0,1
(2)二项分布 B( n, p)
若P ( A ) = p
P( X k ) C n k p k (1 p) n k , k 0,1,, n
* Possion 定理
lim np n
n
l i mC n k p n k (1 p n ) n k k
有
e
n
k!
k 0,1,2,
(3) Poisson 分布
P( )
k
P( X
k ) e
, k 0,1,2,
k!
6.连续型随机变量 (1)
均匀分布
U (a, b)
1
, a x b
0,
其他
0,
x a
F ( x)
,
b a 1
(2) 指数分布 E( ) f ( x)
F ( x)
e x , x 0
0,
其他
0, x 0
1 e x , x 0
(3) 正态分布 N( ,
2)
1
( x
)2
2 2
f ( x)
e
2
1
x
( t )2
2 F ( x)
e
2
d t
2
* N (0,1) — 标准正态分布
x 2
(x)
1 e 2
x
x
2
1 t 2
x
x
(x)
e 2 dt
2
7.多维随机变量及其分布
二维随机变量 ( X ,Y )的分布函数
F ( x, y)
xy
f (u,v)dvdu
边缘分布函数与边缘密度函数
x
F X ( x) f (u, v) dvdu f X ( x)
f ( x,v)dv
y
F Y ( y) f (u, v) dudv f Y ( y)
f (u, y)du
8. 连续型二维随机变量
(1) 区域 G 上的均匀分布, U ( G )
1 ( x, y) G
f ( x, y)
, A
0,
其他
(2) 二维正态分布
( x
1 )2
2 ( x
1 )( y
2
)
1
2
1 2
1
2 ) 2
2(1
2
) ( y
f ( x, y)
1
e
2
1
2
1
2
x , y
2 2
9. 二维随机变量的 条件分布
f ( x, y) f X ( x) f Y X ( y x)
f X ( x) 0
f Y ( y) f X Y (x y)
f X ( x) f ( x, y)dy f Y ( y) f ( x, y)dx
f X Y (x y)
f ( x, y) f Y ( y)
f Y X ( y x)
f ( x, y) f X ( x)
f Y ( y) 0
f X Y ( x y) f Y ( y)dy
f Y X ( y x) f X (x)dx
f Y X ( y x) f X (x)
f Y ( y)
f X Y ( x y) f Y ( y)
f X ( x)
10. 随机变量的数字特征
数学期望
E( X )
x k p k
k 1
E( X ) xf (x)dx
随机变量函数的数学期望
X 的 k 阶原点矩 E( X k )
X 的 k 阶绝对原点矩 E (| X |k )
X 的 k 阶中心矩 E(( X
E( X ))k )
X 的 方差 E((X E(X ))2) D(X ) X ,Y 的 k + l 阶混合原点矩 E( X k Y l ) X ,Y 的 k + l
阶混合中心矩
E (X E( X )) k (Y E(Y))l
X ,Y 的 二阶混合原点矩 E(XY )
X ,Y 的二阶混合中心矩
X ,Y 的协方差
E (X
E(X ))(Y E(Y))
X ,Y 的相关系数
E
( X E( X ))(Y E(Y))
D(X) D(Y)
XY
X 的方差
D (X ) =
E ((X - E(X))2)
D(X)
E(X 2) E 2(X)
协方差
cov( X ,Y) E ( X E( X ))(Y E(Y))
E(XY) E(X)E(Y)
相关系数
XY
1
D(X
Y) D(X )
D(Y)
cov( X ,Y )
D( X ) D(Y)
1 ( t
)2
x
2
F ( x)
2
e 2
d t
* N (0,1) — 标准正态分布
1 x 2
(x)
2
x
e
2
1
t 2
(x)
x
x
2
e 2 dt
7.多维随机变量及其分布
二维随机变量 ( X ,Y )的分布函数
F ( x, y)
xy
f (u,v)dvdu
边缘分布函数与边缘密度函数
F X ( x) x
f (u, v) dvdu f X ( x)
f ( x,v)dv
F Y ( y) y
f (u, v) dudv f Y ( y)
f (u, y)du
8. 连续型二维随机变量
(1) 区域 G 上的均匀分布, U ( G )
1 , ( x, y) G
f ( x, y)A
0,
其他
(2) 二维正态分布
f ( x, y)
1
e
2
1
2
1
2
x , y
( x
1 )2
( x 1 )( y
2
)
1
2
2
1 2
1
2 ) 2
2(1 2
) ( y
2
2
9. 二维随机变量的
条件分布
f ( x, y) f X ( x) f Y X ( y x)
f X ( x) 0 f Y ( y) f X Y (x y)
f Y ( y) 0
f X ( x)
f ( x, y)dy
f X Y ( x y) f Y ( y)dy