文档视界 最新最全的文档下载
当前位置:文档视界 › Poisson分布的参数估计

Poisson分布的参数估计

Poisson分布的参数估计
Poisson分布的参数估计

Poisson 分布的参数估计

作者:高晨 指导老师:戴林送

摘要 泊松分布是概率统计学科中一种重要的离散分布,在参数估计这块,对点估计,矩估计,最大似然

估计以及近似的区间估计等,该文中对泊松分布的相关知识,包括其性质,参数的相关估计,研究了泊松分布的一些性质,参数的估计,以及一些在生活中的简单应用。

关键词

P o i s s o 分布 参数估计 性质 简单应用

1 引言

Poisson 分布是离散型随机变量X 作为大量试验中稀有事件出现的频数的概率分布的数学模型,其中X 可能取值为0,1,2,……而取各个值的概率为:

{},0,1,2!

k e P x k k k λ

λ-==

=

其中0λ>是常数,称X 服从参数为λ的泊松~(;)X P k x .

1.1相关定义

1. 离散型随机变量X 的函数分布律{},0,1,2k k P X x P k === ,若级数1k k k x p ∞

=∑绝

对收敛,称级数

1

k

k k x

p ∞

=∑为随机变量X 的数学期望[]E x ,

[]E x =1k k k x p ∞

=∑.

2. 定理:Y 是随机变量X 的函数,(),(Y g x g =是连续函数),X 是离散型随机变量,

1

()k

k

k g x p ∞

=∑绝对收敛,则

[][()]E Y E g x ==1

()k k k g x p ∞

=∑.

3. 随机变量X ,若2{[()]}E X E X -存在,则称2{[()]}E X E X -为X 的方差,记

为()D x 或()Var x ,即

()D x =()Var x =2{[()]}E X E X -.

()()x D X σ=(与X 有相同的量纲)

,称为标准差或均方差。 注记:()D x 是刻画X 取值分散程度的一个量,也可以看成是函数()g x =2[()]X E X -的数学期望。离散型随机变量X ,

()D x =2

1

[()]k k k x E X p ∞

=-∑.

其中{},1,2,3k k P X x p k === 是X 的分布律。()D x =22()[()].E x E x -

2 性质

2.1.Poisso n 分布中{}0,0,1,2P x k k =≥=

具有

{}1!

!k k

k k k e P x k e

e e k k λ

λ

λλλλ-∞∞

--

========∑∑

即{}P x k =满足1

0,0,1,2;

1.k k

k P k P

=≥==∑

我们知道,无论是离散型或是非离散型的随机变量X 都可以借助分布函数

(){},F x P X x x =≤-∞≤≤+∞ 来描述,X 落在任意区间12[,]x x 的概率

1221{}()()P x X x F x F x <<=-.

{},0,0,1,2,~(;)!

k

P X k e k X P k x k λλλ-==

>= .

2.2 数字特征

2.21 数学期望

Poisson 分布:

{},0,1,2!

k e P x k k k λ

λ-==

=

[]E x =1

1

.!

(1)!k k k k e k

e

e e k k λ

λ

λλλλλλλ--∞

--

=====-∑∑

2.22 方差

Poisson 分布:

{},0,1,2!

k e P x k k k λ

λ-==

= ,0λ>的方差()D x .

由上知,Poisson 分布的数学期望为参数λ,

2[][(1)]E X E X X X =-+=[(1)][]E X X E X -+

02

22

2222[(1)]()(1)

!

(2)!()()[()].

k k k k E X X E X e k k k e

k e e D X E X E x λ

λ

λλλλ

λλλ

λλλλλ-∞

=-∞

-=--+=-+=+-=+=+=-=∑∑

Poisson 分布[]E x =()D x =λ,也就是说在Poisson 分布中只含有一个参数λ,只要知道一个Poisson 分布的数学期望或者方差就能够完全确定它的分布。

3 相关定理

定理【1】 随机变量(1,2,3)n x n = 服从二项分布,其分布律为

{}(1),0,1,2,.k k

n k n n n n P x k C p p k n -==-=

又设0n np λ=>是常数,则

lim {}!

k n n e P x k k λ

λ-→∞

==

.

证明 由0n np λ=>得:

{}n P x k ==

(1)(1)[][1]!n n k n n n k k n n

λλ

---+- =

121{1[1][1][1]}[1]!n k

n

n n k k n n n n

λλ-

-?-?-??-?-

显然当k=0时,故{}n P x k e λ-=→。当1k ≥且k →∞时,有

1211[1][1][1]1k n n n -?-?-??-→ ,[1]n k

n n

e n

λλ-

--→

从而

{}!

k n e P x k k λ

λ-=→

lim {}!

k n n e P x k k λ

λ-→∞

==

.

定理 [ 2 ] 设p λ是服从参数为λ的泊松分布的随即向量,则:

2

2

1

lim {()

}2x

t

P p x e

dt λλλλπ

--∞

→∞

-<=

?

证明 已知λε的特征函数为1

()

()it e

t e λλ-Φ=,故()

λλεληλ

-=

的特征函数为:

1

()()it

e i t

t

g t e

e

λλλλλλ

--=Φ=

对任意的t,有

()2112!it

it

t e

λ

λλλλ??

=+-+O →∞????

.

于是

()221122it t t e i t λ

λλλλλ????--=-+?O →-→∞ ? ?????

从而对任意的点列λ→∞,有

22

lim ()n n t g t e

λλ-

→∞

=.

但是2

2

t e

-是()0,1N 分布的特征函数,由于分布函数列(){}

n F x 弱收敛于分布函数()F x 的

充要条件是相应的特征函数列(){}

n t Φ收敛于()F x 的特征函数()t Φ. 所以

()

2

2

1lim 2t n x

n

n P x e

dt λλελλπ--∞

→∞??-<=- ?

??

?

?

成立;又因为λ是可以任意选取的,这就意味着

()2

2

1lim 2t x

p P x e

dt λλλλπ--∞

→∞-??

<=- ???

?

成立.

4 参数估计

4.1 Poisson 分布参数的点估计

~(;)!

x

P x e x λλξλ-=

。()(0)0,1,2x λ>= (){}0,:R λλ

+Θ=+∞=∈ 为估计母体的参数θ值的大小,具体抽取样本值()12,,n x x x 。再把样本值()12,,n x x x 放

入原来的样本()12,,n ξξξ 。构造统计量 θ()12,,n ξξξ 。把()12,,n x x x 代入得θ的统计

值 1()n

x x q 用作θ的近似值,用来计算参数θ的估计值的统计量 θ()12,,n ξξξ 称为参数

θ的估计量。

4.2 参数的两个最大似然估计

{},0,1,2!

k e P x k k k λ

λ-==

= λ>0为未知参数

设12,n x x x 为子样12,,n ξξξ 一组观测值 似然函数

()()1

1

1211;,,!

!

!!

n

i

n

i x x x n n n L L x x x e e

e x x x x λ

λ

λλ

λ

λ

λλ=---∑==

=

()1

1

ln ln ln !n

n

i i i i L n x x λλ===-+-∑∑

L 是λ的可导函数,用导数求极值

ln 10i L n x λλ

?=-+=?∑得 x λ= 22

ln 0x

L λλ=?

(),u u U

θθ=∈,又设θ是X 的概率分布中

参数θ的最大似然估计,则 ()u

u θ=为()u θ最大似然估计。 易知,由e

λ

-的单调性,得e

λ

-的一个最大似然估计为 1

X u e -= 在讨论估计量的性质之前,给出该参数的另一个最大似然估计量。对样本做如下变换:

1,0,

0,0.

i i i X Y X =?=?

≠? 这样得到来自总体Y 的样本,其中Y 服从两点分布()1,b θ, 其中{1}{0}P Y P X e

λ

θ-=====,这正是待估计的参数。容易知道e

λ

θ-=的最大似然

估计为12,,,n Y Y Y 的样本均值 ()2

011

111i n n

i X i i u

Y n n =====∑∑,

其中()01,0,

10,0

i

i X i X X ==?=?

≠?

为示性函数。这样我们就得到同一个参数的两个最大似然估计量:

12

(0)11,1i

n

X X i u e u n -====∑. 由于前者利用了泊松分布的信息,而后者没有利用分布信息,所以称前者为“参数的最大似然估计”,后者为“非参数的最大似然估计”。

4.3 参数的无偏估计

当总体为泊松分布()P λ时,即

{},0,1,2,!

x

P X x e x x λλ-==

=

未知参数0θλ=>,可以证明样本均值X 和样本方差2

1

1()1n i i S X X n ==--∑都是总体参

数θλ=的无偏估计。推广到一般情况,对任意的实数2,01,(1)X S αααα≤≤+-也都是

λ的无偏估计,即X θλ==或2S 或2(1)X S αα+-。

引理1 设1()n X X 是来自该总体泊松分布的一个样本,则1

~()n

i

i nX X

P n λ==

∑。

证明 因为12~(),~()X P X P λλ,且1X 和2X 相互独立, 12X X X =+的概率分布为

1220

(2)()()(),!X

X

X X x P X P x P X x e X λ

λ-==-=∑

12~(2)X X X P λ=+.

由归纳法得到

1

~()n

i i nX X P n λ==∑.

结论 1 设函数11()()g g e λθλ==,可以证明1()g λ的无偏估计为2

i

X ,而不是

1()X g e θ=.

证明 有引理1,

1

()1100

(())(())()()

()()!n X X

n

X X n n

n

X X E g E g E e E e

n e P nX X e e e X λ

λ

θλλ∞

-========≠∑∑.

20

(2)2()2

!

(2)

!i

x

X x x

i x x x

x E P X x e x e e e e x λ

λλλλλλ∞∞

-==∞

--=======∑∑∑

.

结论 2 已知函数222()()g g e λθλ-==

可以证明2()g λ的无偏估计为

1,()1

i t X ?=?-? (i X 取偶数值时为1,i X 取奇数值时为-1)

, 而不是22()X g e θ-=.

证明

222(())(())()X E g E g E e θλ-==

2

2()0220

()()

()!

X n X n

n

X X X

n n

X E e

e

P nX X n e

e e X λ

λλ--∞

=-∞

--=====≠∑∑

令估计量()()i i t X f X = ,而

2(())()()(1)

(1)

!

!

.

i

i x x

x

x

x

x x E t X f x P X x e

e

x x e e e λ

λ

λλλλλ∞

=∞

--==---===

-=-==∑∑∑

结论 3 再考虑2

33()()g g θλλ==也是未知参数λ的一个函数,但它的无偏估计不是

2

X 而是1

1(1)n

i i i X X n =-∑.

证明

2

22

2

2

2

1

()20

2

()()()

()!

Z n X n

n X Z Z

n n

X E X E e e P nX X n e e Z λ

λλ∞

=∞-=====≠∑∑

2

1112

112

112

111((1))(())11()()11()n n n i i i i i i i n n i i i i n n i i E X X E X E X n n n E X E X n n n n λλλλ=======-=-=-=+-=∑∑∑∑∑∑∑

结论 4 已知函数44()()g g e λθλ-==,可以证明4()g λ的无偏估计为

1,0(),0,0i X e X X =?=?≠?

而不是4()X g e θ-=。 证明

1

()4400

(())(())()()

()()!

n X X n

X

X X n n

n

X X E g E g E e E e

n e

P nX X e

e e X λ

λ

θλλ----∞

∞--========≠∑∑。

令估计量 ()()i i

d X g X =,而 0

1

(())()()()!

01!

0!

x

i i

x x x

x E d X g x P X x g x e x e e e x λ

λλλ

λλ

λ

-==∞

---=====+=∑∑∑

.

一般性结论

命题1 无偏估计不一定存在。

比如,设样本X 来自二项分布(,)B n p 总体,样本量为1,n 已知,而p 未知,01p <<,函数()sin f p p =的无偏估计不存在。

命题 2 设1θ 和2θ分别是未知参数θ的可估函数,1(;)1F x λλ→+∞-→和2()g θ的无偏

估计量,则1122c c θθ+是1122()()c g c g θθ+的无偏估计量。这里1c ,2c 为任意实数。 证明 因为1122()(),()()E g E g θθθθ==, 又因为

112211221122()()()()()E c c c E c E c g c g θθθθθθ+=+=+,

所以1122c c θθ+是1122()()c g c g θθ+的无偏估计量。 命题 3 无偏估计量不一定唯一。

样本均值X 和样本方差2

21

1()1n

i i S X X n ==--∑都是总体参数θλ=的无偏估计。 命题 4 能借助θ的无偏估计来求()g θ的无偏估计。

设总体X 服从指数分布总体()e λ,从总体中抽取一组样本1()n X X ,设 θ

是θ的无偏估计量。X 的概率密度为()f x ,记0θλ=>,这里θλ=为未知参数。θ的无偏估计是

X θλ==。今由θ的无偏估计构造22()g θθλ==的无偏估计,为此取a 为修正系数,要

使222(())E a X θλ==成立,而

22222

11(())()(())n E X D X E X n n

λλλ+=+=

+= 故取系数1n a n +=

。此时222(())E a X θλ=+成立,故22

θλ+的无偏估计为2()1

n X n +。

4.4 参数的区间估计

泊松分布的λ区间估计,一般是利用中心极限定理来实现。对于大容量样本,这种估计

是可行的,然而,对于同样的置信水平,这种近似估计的误差会随着容量的减小而增大。可以通过建立Poisson 分布和Γ分布的某种联系给出一种较为理想的区间估计,实际表明这种计较用中心极限定理效果好。

设总体X 服从参数为λ(0λ>)的Poisson 分布,则X 的分布函数为

(;)(0)!

t

t n

F x e t λλλλ-≤=>∑

对于固定的x ,把(;)F x λ视为λ的函数,则易证(;)F x λ具有下述性质 1 当0λ+

→时;(;)1F x λ→

2 当λ→+∞时;(;)0F x λ→

3 (;)F x λ是关于的连续可导函数。

对于前两项性质,还可以描述为

'1 当0,1(;)0F x λλ+→-→ '2 当,1(;)1F x λλ→+∞-→

性质''

1,2,3会使我们意识到对固定的,关于应具备分布函数的性质,为得到这一结论,先

给出下面引理:

引理 设λ为任意实数,为正整数,则下式成立

011!

(1)

t

m t m e t e dt t m λλλλ∞

--=+=

Γ+∑

? (*) 证明 取

1

1

()!

(1)t

m t m f e

t e dt t m λλ

λλλ∞

--=+=

-Γ+∑

? 只需证明()0,(*)f λ=式便成立。

显然 ()f λ是定义在(,)-∞+∞内的连续可导函数,且有

1

'

1

1

121

1

1

1

()!!

(1)1

(1)

(1)!(1)!!

(1)

10()!

!

!

!

t t

m t m t m m

t t

m t m t m m

u

t

m u m t m f t e

e e t t m m e

e e e m t t m e

e

e e m u t m λ

λλ

λ

λ

λλλ

λ

λλ

λλλλλλλλλλλλ-∞

---=+=+-∞

----=+=+∞

----=+=+=

--

Γ+=++-

-

+-Γ+=

+

-

-

=∑

∑∑

所以()f λ在(,)-∞+∞内恒为常数,而(0)0,f =故()0f λ≡即(*)式成立。特别地当

0λ>时,(*)式仍成立。

定理 设(;)F x λ为泊松总体的分布函数,0λ>为参数,若把x 固定,视λ为随机变量,则λ的分布函数为1(;)0F x λ->,则λ服从(1,1)m Γ+,其中[]m x =。 证明 由于

{}!

k

P X k e k λλ-==

所以

(;){}(0)!

t

t x

F x P X x e x t λλλ-≤=≤=>∑

从而

[]1

1

1(;)1!

!

!

!

t

t

t

t

t x

t x

t x t m F x e

e

e t t t t λ

λ

λ

λβλλλ∞

---≤>=+=+-=-==

=

由引理知

1

1!

(1)t

m t

t m e

t e dt t m λλ

λ+∞

--=+=Γ+∑

? 故

1

1(;)~(1,1)(1)m t F x t e dt m m λλ--=Γ+Γ+?

由此可知,当([])x m x =固定时,1(;)F x λ-是变量λ的分布函数,且为(1,1)m Γ+分布,利用泊松分布与Γ分布的这种内在联系,通过计算固定的观察值,注意到Γ分布与2χ分布的关系,可以构造出参数λ的置信区间。

设12(,,)n X X X 是取自泊松总体(参数为λ)的简单子样,由泊松分布的可加性知

1

n i i T X ==∑仍为泊松分布,且参数为n λ,对于给定的一组观测值121

,,,n

n i i x x x T x ==∑ 为

定值,由上面结论可知,n λ服从(1,1)m Γ+分布。于是λ的置信度为1α-的置信上下限

,λλ可由下面两式确定

011(1,1)2

n m t t e dt m λα-=-Γ+? 注意到等式 22

10011(1,1)2(1)

t

x x m t m m t e dt t e dt m m --+=Γ+Γ+?? 上式右边为2(22)m χ+分布的分布函数。从而,λλ可以用2χ分位数表示,即有

22

1012(1)2t

n m m t e dt m λα-+=Γ+? 22

10112(1)2

t

n m m t e dt m λα-+=-

Γ+? 于是

2

212

2

2(22),2(22)n

n n m n m λχ

λχ-=+=+

从而有

2

2

12

2

(22)

(22)

,22n n m m n n χχλλ-++=

=

.

由此便得到λ的置信度为1α-的置信区间为

2212

2

(22)(22),22n n m m n n χχ-??++ ? ? ??

?

. 5 贝叶斯框架下的参数估计

人们通常是在给定的损失函数下对其进行研究,设12,n X X X 是容量为n 的一个泊松简单随机样本,其联合概率分布为

1

()121(,,)!n T x n n i i f x x x x e λλλ--=??

=????

∏ ,

其中12,,n x x x 为样本12,,n X X X 的一组实现值,1

()n

i

i T X X

==∑,本文对给定的泊松样

本12,,n X X X ,在,p q 对称损失函数

(,)()()2(,)p q L p q Z λδλδδλ

=+-∈ (1)

意义下考虑参数的估计问题,由分析问题知,损失函数(1)关于估计量δ 是凸的,且关于δ在δλ=处取得最小值。

在贝叶斯框架下,利用损失函数(1)来研究参数λ的贝叶斯估计的一般形式。下面给出参数λ的一般形式。

定理 1 令12(,,)n X X X X = ,在损失函数(1)下,对于任何先验分布,参数λ的贝叶斯估计为

1

()

()().()p

p q n q pE X X qE X λδλ+-??

= ? ?

??

证明 设()X δ为λ的任意估计,对应的贝叶斯风险为

()()

{2}{{2}}()()p

q p q p q p q

X X E E E X X X λδλδδλδλ

+-=+-,

这里等号左端E 表示关于λ和X 的联合分布取数学期望。欲使贝叶斯风险达到最小,只需

要极小化()

{2}()p

q p q x E X X λδδλ

+-即可。

记()

()

()2()()

p q p q

E X x h X E X λδδδλ=+-,对()h δ关于δ求导,易知()h δ是关于δ的凸函数,并且在1()

()()()p

p q q pE X X qE X λδλ+-??

=

? ???

处取得唯一极小值,从而参数λ的贝叶斯估计为

1

()

()()()p

p q B q pE X X qE X λδλ+-??= ? ?

??

. 下面考虑在给定的先验分布后,参数λ的贝叶斯估计的精确形式。

定理 2 若参数λ的先验分布为11(,)(()),0,0k k k k e k βλββλβ---Γ=Γ>>,则λ的贝叶斯估计为

1

()

1(()2)(),(()2)p q B p T X k p X n q T X k q δβ+??

Γ+-= ?

+Γ++??

并且是可容许的。

证明 由于λ的先验分布为伽玛分布(,)k βΓ,从而λ的后验分布为

()1()12(,,),0,0,T X k n n h X X X e k βλλλβ+--+∝>>

于是有

001(())

()(),()(())(())()()(),

(())

p p p q

q q T X k p E X h X d n T X k T X k q E X h X d n T X k λλλλβλλλλβ∞

∞--Γ++==+Γ+Γ+-==+Γ+??

从而

1

1

()

()

()1(()2)().()(()2)p p q p q q pE X p T X k p X qE X n q T X k q λδλβ++-??

??

Γ+-== ? ? ?

+Γ++??

??

.

由于参数λ

在损

1)下关于先验密度1

1()(())

k

k k e βλπλβλ---=Γ的贝叶斯估计是

唯一的,因此该估计也是可容许的。

定理 3 在先验分布1

1()(())

k

k k e βλπλβλ---=Γ,0,0,0k λβ>>>下,对给定置信概率

1α-,参数λ的最大后验区间估计D 为

22122(2())(2()),

2()2()T X k T X k n n ααχχββ-??

++ ? ?++??

. 证明 由于参数的后验密度为()1()12(,,),0,0,T X k n n h X X X e k βλ

λλ

β+--+∝>> ,

所以对于给定置信概率1α-,参数λ的最大后验区间估计D 满足:

(1)()()1,D

P D X h X d λλλα∈==-?

(2)对于12,D D λλ?∈?总有不等式12()()h X h X λλ≥.

下面求参数λ的最大后验区间估计的精确形式。 由于22()(2())n T X k βλχ++ ,所以对给定的(0,1)α∈,

有222

2

((2()))2()(2())1P T X k n T X k α

αχβλχα+≤+≤+=-.

记22122(2())(2())

,

2()2()T X k T X k D n n ααχχββ-??++ ?=++

???

,则对12,D D λλ?∈?

,总有不等式12()()h X h X λλ≥。于是参数λ的最大后验区间估计D 为

22122(2())(2()),

2()2()T X k T X k n n ααχχββ-??

++ ? ?++??

. 6 简单应用研究

1) 二项分布泊松近似常常被应用于研究稀有事件,即每次试验中的事件出现的概率p 很小

而贝努里试验的次数n 很大时,事件才会发生。

例1 通过某路口的每辆汽车发生事故的概率为0.0001,p =假设在某段时间内有1000辆汽车通过此路口,试求在次时间内发生事故次数X 的概率分布和发生2次以上事故的概率。

分析 首先在某段内发生事故属于稀有事件,观察通过路口的1000辆汽车发生事故与否,可视为是1000n =次伯努里试验,出现事故的概率为0.0001p =,因此X 服从二项分布的,即~(1000,0.0001)X B .

1000999(2)1{0}{1}10.999910000.00010.9999Q p x p x p x =≥=-=-==--??

由于1000n =很大,且0.0001p =很小,上面的式子计算工作量很大,则可以用:

{}(1)

(0,1,,)!

m m m

n m

np

n n

n

np p v m p e m n m p

C --==-≈= 来求近似。 注意到10000.00010.1,np =?= 有

00.10.1

0.10.1{2}10.0045

0!1!

p x e e --≥=--=

1

11

1

{}(1)

1(1)1(1)0.9

lg 0.1

919.8827

lg 0.9975

n

k k n k k n p x n p p p p p n ∞

--==+≤=-=-

-=--≥≥

=∑∑

2) 泊松分布可以计算大量试验中稀有事件出现频数的概率.这里的频数是指在相同条件下

进行大量的试验,在这大量试验中,稀有事件发生的次数。 例2 一直患色盲者占0.25%,试求:为发现一例色盲者至少要检查25人的概率;为使发现色盲者的概率不小于0.9,至少要对多少人的辨色力进行检查?

分析 设X 表示恰好发现一例色盲者所需要的检查人数,则~(0.0025)X G 。

解 25

242425

{25}(1)

(1)(0.9975)0.94k k p x p p p ∞

-=≥=

-=-=≈∑

设至少对n 个人的辨色力进行检查,于是{}0.9p x n ≤≥。从而:

1

11

1

{}(1)

1(1)1(1)n

k k n k k n p x n p p p p p ∞

--==+≤=-=-

-=--∑∑

由1(1)0.9n p --≥得lg 0.1

919.8827lg 0.9975

n ≥=。因此至少要检查920人。

结束语

目前关于Poisson 分布的性质及其应用的研究已经取得丰富的成果,在参数估计这块,对点估计,矩估计,最大似然估计以及近似的区间估计等,文章中对泊松分布的相关知识,包括其性质,参数的相关估计,还有一些简单的应用一些整理和论述,希望能有一些帮助。还有一些简单的应用一些整理和论述在实际中有着广泛的应用,它常与单位时间或者单位面积及单位产品上的计数过程相联系。

参考文献

【1】魏宗舒等。概率论与数理统计教程[]M .北京:高等教育出版社,1983. 【2】茆诗松等。概率论与数理统计教程[]M .北京:高等教育出版社,2004. 【3】周概容.概率论与数理统计[M].北京:高等教育出版社,1984. 【4】王梓坤.概率论基础及其应用 [M].北京:科学教育出版社,1976.

【5】蒋福坤,刘玉春.指数分布参数的最短区间估计[J].数理统计与管理,2004,23(3). 【6】Ash.R.B. Real Analysis and Probability[M].New York :Academic Process.Inc,1972.

【7】RICHARDLB ,FAIRES J D. Numerical Analysis[M].Bejing:Higher Education Press.Thomson Learning

Inc.2001.

【8】刘彬清.关于一些数值的求积公式的渐近性[J].应用数学与计算数学学报,2000,14(2):83-87.

Estimation of Parameter in Poisson Distribution

Author: Gao chen Supervisor: Dai linsong

Abstract:Poisson distribution is an important subject in probability and statistics of discrete distribution, parameter estimation this, in for point estimates, moment estimators, maximum likelihood estimation and approximate interval estimation, the paper in such relevant to poisson distribution, including its nature, knowledge, estimates that the related parameters was studied some properties of poisson distribution, parameters.the estimation of parameters and some in the life of the simple application

Key Words: Poisson Distribution estimation of parameter in Poisson Distribution characters applied

Gamma分布与指数分布

Gamma分布与指数分布 "Gamma 分布gamma distribution; form of gamma distribution;" 在学术文献中的解释 1、在地震序列的有序性、地震发生率的齐次性、计数特征具有独立增量和平稳增量情况下,可以导出地震发生i 次时间的概率密度为Gamma 密度函数(亦称为Gamma分布) r (称为伽马函数,它是用一个积分式定义的,不是初等函数。伽马函数有性质: r(x+i)=x , (r) (0)=1, r (1/2)=,▽对证整数n,有r (n+1)=n伽马分布里面r ( a ,(分布函数已经了解)。a ,个指代何种意义的参数?比如在化工里面有这样一个问题,说反应器管道的长度L服从r ( a分布,那么a,是和管道形状和尺度相关的参数。a,是两个分布调整参量,该分布的期望二C+(a /也就是说a /调整期望;分布的方差二a / (3,由此并不需要单独定义二者,应该共同对分布起作用! 伽马函数r(z)的定义域是,C-{-n,n=0,1,2,...}其中C为复数域,Re (z) >0 时,常见的积分是收敛,也就是说r(z)可用常见的积分定义。 如 1 种常见的积分: r (z)二/ {0

指数分布 如果随机变量X 的概率密度为 公式 P (X>0二入乘以(e的一入X次方);p(x<0)=0 则称X遵从指数分布(参数为为。 在概率论和统计学中,指数分布( Exponentialdistribution )是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。 许多电子产品的寿命分布一般服从指数分布。有的系统的寿命分布也可用指数分布来近似。它在可靠性研究中是最常用的一种分布形式。指数分布是伽玛分布和威布尔分布的特殊情况,产品的失效是偶然失效时,其寿命服从指数分布。 指数分布可以看作当威布尔分布中的形状系数等于 1 的特殊分布,指数分 布的失效率是与时间t 无关的常数,所以分布函数简单。

指数分布

指数分布 设连续型随机变量X 的密度函数为0 ()00x e x f x x λλ-?≥=?为常数。 其分布函数为0 10 ()()00x x e x F x f t dt x λ-?-≥==? >,我们有 (|)()x P X s t X t e P X s λ->+>==>,如果X 解释为寿命,这表明如果已知X 的 寿命大于t 年,则它再活s 年的概率与年龄t 无关,这是指数分布的重要特征。因此指数分布为“永远年青”的分布。 例:某型号计算机,无故障工作的时间X (单位h )服从参数为1 100 的指数 分布,求它无故障工作50—100h 的概率是多少?它的运转时间少于100h 的概率是多少? 解 由题设X 的密度函数为1100 10 ()100 00x e x f x x -?≥? =??===在内无冲击 于是X 的分布函数为()1()1,0t F t R t e t λ-=-=->

第二章 多元正态分布及参数的估计汇总

第二章多元正态分布及参数的估计 在多元统计分析中,多元正态分布占有相当重要的地位.这是因为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参 数的估计问题. 目录 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 多元正态分布的参数估计 §2.1 随机向量 本课程所讨论的是多变量总体.把p个随机变量放在一起得X=(X1,X2,…,Xp)′为一个p维随机向量,如果同时对p维总体进行一次观测,得一个样品为p维数据.常把n个样品排成一个n×p矩阵,称为样本资料阵.

?? ? ? ?? ??'''= ?????? ??=)()2()1(2 1 2222111211n np n n p p X X X x x x x x x x x x X def =(X 1,X 2,…,X p ) 其中 X(i)( i =1,…,n)是来自p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布,独立性;X 的均值向量,X 的协差阵和相关阵,X 与Y 的协差阵)要求大家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设X ,Y 为随机向量,A ,B 为常数阵,则 E(AX )=A·E(X ), E(AXB )=A·E(X )·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若X,Y 相互独立,则COV(X,Y)=O;反之不成立. 若COV(X,Y)=O,我们称X 与Y 不相关.故有: 两随机向量若相互独立,则必不相关;

参数估计在实际问题中当所研究的总体分布类型已知但分布

第六章 参数估计 在实际问题中, 当所研究的总体分布类型已知, 但分布中含有一个或多个未知参数时, 如何根据样本来估计未知参数,这就是参数估计问题. 参数估计问题分为点估计问题与区间估计问题两类. 所谓点估计就是用某一个函数值作为总体未知参数的估计值;区间估计就是对于未知参数给出一个范围,并且在一定的可靠度下使这个范围包含未知参数. 例如, 灯泡的寿命X 是一个总体, 根据实际经验知道, X 服从),(2σμN , 但对每一批灯泡而言, 参数2,σμ是未知的,要写出具体的分布函数, 就必须确定出参数. 此类问题就属于参数估计问题. 参数估计问题的一般提法: 设有一个统计总体, 总体的分布函数为),(θx F , 其中θ为未知参数(θ可以是向量). 现从该总体中随机地抽样, 得一样本 n X X X ,,,21 , 再依据该样本对参数θ作出估计, 或估计参数θ的某已知函数).(θg 第一节 点估计问题概述 内容分布图示 ★ 引言 ★ 点估计的概念 ★ 例1 ★ 评价估计量的标准 ★ 无偏性 ★ 例2 ★ 例3 ★ 有效性 ★ 例4 ★ 例5 ★ 例6 ★ 相合性 ★ 例7 ★ 例8 ★ 内容小结 ★ 课堂练习 ★ 习题6-1 内容要点: 一、点估计的概念 设n X X X ,,,21 是取自总体X 的一个样本, n x x x ,,,21 是相应的一个样本值. θ是总体分布中的未知参数, 为估计未知参数θ, 需构造一个适当的统计量 ),,,,(?2 1 n X X X θ 然后用其观察值 ),,,(?21n x x x θ 来估计θ的值. 称),,,(?21n X X X θ为θ的估计量. 称),,,(?21n x x x θ为θ的估计值. 在不致混淆的情况下, 估计量与估计值统称为点估计,简称为估计, 并简记为θ?. 注: 估计量),,,(?21n X X X θ是一个随机变量, 是样本的函数,即是一个统计量, 对不同的样本值, θ的估计值θ?一般是不同的. 二、评价估计量的标准 从例1可见,参数点估计的概念相当宽松, 对同一参数,可用不同的方法来估计, 因而得到不同的估计量, 故有必要建立一些评价估计量好坏的标准. 估计量的评价一般有三条标准:

指数分布应用 ()

指数分布相关问题一. 在概率论中有一种分布是指数分布,其概率密度函数为 f(x)=λe^(-λ) x>0 (0 x<=0 ) 这种分布具有无记忆性,和寿命分布类似。举个例子来说就是,一个人已经活了20岁和他还能再活20岁这两件事是没有关系的。因此指数分布也被戏称为“永远年轻”。另外正态分布也用到了指数函数,只不过表达式比较复杂,这在高中数学中也有涉及到。 二. 在复变函数中,也经常用到指数形式表示一个负数。比如说1+i=根号2*e^(πi/4) 这是根据著名的欧拉公式得到的:cosa+isina=e^(ai),当然复指数与实数范围内的指数有很多不同的地方,在复变函数中还会学深入的学到。 复指数在信号的频谱分析中还有很重要的应用,要研究一个周期信号的还有那些频率分量就要把它展开成若干个复指数函数的线性组合,这个过程叫傅里叶分解,是法国数学家、物理学家傅里叶(Fourier)发现的。学习电信类的相关专业会对信号的分析有一个系统的学习。 幂函数最重要的应用就是级数。不严谨的说,就是把一个函数展开成无穷项等比数列求和的形式,只不过每项都是关于x的幂函数,利用这个幂级数,可以把任意一个函数表示成多项式,方便近似计算。另外,刚才提到的傅里叶分解也就是把一个周期函数(信号)展开成傅里叶级数。如果函数是非周期的(即周期无限大)这个过程就叫做傅里叶变换。 指数分布的应用: 一. 许多电子产品的寿命分布一般服从指数分布。有的系统的寿命分布也可用指数分布来近似。它在可靠性研究中是最常用的一种分布形式。指数分布是伽玛分布和威布尔分布的特殊情况,产品的失效是偶然失效时,其寿命服从指数分布。 指数分布可以看作当威布尔分布中的形状系数等于1的特殊分布,指数分布的失效率是与时间t无关的常数,所以分布函数简单。 二. 在电子元器件的可靠性研究中,指数分布应用广泛,在日本的工业标准和美国军用标准中,半导体器件的抽验方案都是采用指数分布。此外,指数分布还用来描述大型复杂系统(如计算机)的故障间隔时间的失效分布。但是,由于指数分布具有缺乏“记忆”的特性.因而限制了它在机械可靠性研究中的应用,所谓缺乏“记忆”,是指某种产品或零件经过一段时间t0的工作后,仍然如同新的产品一样,不影响以后的工作寿命值,或者说,经过一段时间t0的工作之后,该产品的寿命分布与原来还未工作时的寿命分布相同,显然,指数分布的这种特性,与机械零件的疲劳、磨损、腐蚀、蠕变等损伤过程的实际情况是完全矛盾的,它违背了产品损伤累积和老化这一过程。所以,指数分布不能作为机械零件功能参数的分布形式。 指数分布虽然不能作为机械零件功能参数的分布规律,但是,它可以近似地作为高可靠性的复杂部件、机器或系统的失效分布模型,特别是在部件或机器的整机试验中得到广泛的应用。 三. 排队论,也称随机服务系统理论。排队是在日常生活中经常遇到的现象,在医院中,目前要求服务的数量通常都超过服务机构的容量。对服务系统进行定量分析,综合平衡患者与服机构的设置,以期提高服务质量。

参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布

指数分布定义

概率密度函数 累积分布函数 [1] 期望值: 方差:

若随机变量x服从参数为λ的指数分布,则记为X~ e(λ). 3特性 无记忆性 指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布 当s,t≥0时有P(T>s+t|T>t)=P(T>s) 分位数 率参数λ的四分位数函数(Quartile function)是: F^-1(P;λ)= -LN(1-P)\λ 第一四分位数:ln(4/3)\λ 中位数:ln(2)\λ 第三四分位数:ln(4)/λ 4分布 在概率论和统计学中,指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。 许多电子产品的寿命分布一般服从指数分布。有的系统的寿命分布也可用指数分布来近似。它在可靠性研究中是最常用的一种分布形式。指数分布是伽玛分布和威布尔分布的特殊情况,产品的失效是偶然失效时,其寿命服从指数分布。 指数分布可以看作当威布尔分布中的形状系数等于1的特殊分布,指数分布的失效率是与时间t无关的常数,所以分布函数简单。

在电子元器件的可靠性研究中,通常用于描述对发生的缺陷数或系统故障数的测量结果。这种分布表现为均值越小,分布偏斜的越厉害。 指数分布应用广泛,在日本的工业标准和美国军用标准中,半导体器件的抽验方案都是采用指数分布。此外,指数分布还用来描述大型复杂系统(如计算机)的平均故障间隔时间MTBF的失效分布。但是,由于指数分布具有缺乏“记忆”的特性.因而限制了它在机械可靠性研究中的应用,所谓缺乏“记忆”,是指某种产品或零件经过一段时间t0的工作后,仍然如同新的产品一样,不影响以后的工作寿命值,或者说,经过一段时间t0的工作之后,该产品的寿命分布与原来还未工作时的寿命分布相同,显然,指数分布的这种特性,与机械零件的疲劳、磨损、腐蚀、蠕变等损伤过程的实际情况是完全矛盾的,它违背了产品损伤累积和老化这一过程。所以,指数分布不能作为机械零件功能参数的分布形式。 指数分布虽然不能作为机械零件功能参数的分布规律,但是,它可以近似地作为高可靠性的复杂部件、机器或系统的失效分布模型,特别是在部件或机器的整机试验中得到广泛的应用。 指数分布比幂分布趋近0的速度慢很多,所以有一条很长的尾巴。指数分布很多时候被认为是长尾分布。互联网网页链接的出度入度符合指数分布 指数分布的参数为λ,则指数分布的期望为1/λ,方差为(1/λ)的平方。

指数分布

指数分布是连续型随机变量,指数分布具有无记忆性,指数分布是特殊的gamma分布。 指数分布(Exponential distribution)是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。 指数分布的定义形式: λ就表示平均每单位时间发生该事件的次数,是指数函数的分布参数;f(x:λ) = λe^(-λx),表示在该时刻发生时间的概率。比如放射性衰变就遵循这一分布,这里的半衰期就对应1/λ.

指数分布的期望为1/Lamta,方差为1/Lamta^2。 指数分布中最关键的一点,如何理解率参数。给定独立同分布样本x= (x1, ...,x n),最大化似然概率得到参数的似然值为: lamta^ = 1/x; 指数分布表示随机变量的概率只与时间间隔有关,而与时间起点无关。数学语言表达为: p(T>s+t | T >t ) = p(T>s) for all s,t >= 0 指数分布常用来描述“寿命”类随机变量的分布,例如家电使用寿命,动植物寿命,电话问题里的通话时间等等。“寿命”类分布的方差非常大,以致于 已经使用的时间是可以忽略不计的。 例如有一种电池标称可以充放电500次(平均寿命),但实际上,很多充放电次数数倍于500次的电池仍然在正常使用,也用很多电池没有使用几次

就坏了——这是正常的,不是厂方欺骗你,是因为方差太大的缘故。随机取一节电池,求它还能继续使用300次的概率,我们认为与这节电池是否使用过与曾经使用过多少次是没有关系的。 有人戏称服从指数分布的随机变量是“永远年轻的”,一个60岁的老人与一个刚出生的婴儿,他们能够再活十年的概率是相等的,你相信吗?——如果人的寿命确实是服从指数分布的话,回答是肯定的。 贴一道题加深理解

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

Poisson分布的参数估计

Poisson 分布的参数估计 作者:高晨 指导老师:戴林送 摘要 泊松分布是概率统计学科中一种重要的离散分布,在参数估计这块,对点估计,矩估计,最大似然 估计以及近似的区间估计等,该文中对泊松分布的相关知识,包括其性质,参数的相关估计,研究了泊松分布的一些性质,参数的估计,以及一些在生活中的简单应用。 关键词 P o i s s o 分布 参数估计 性质 简单应用 1 引言 Poisson 分布是离散型随机变量X 作为大量试验中稀有事件出现的频数的概率分布的数学模型,其中X 可能取值为0,1,2,……而取各个值的概率为: {},0,1,2! k e P x k k k λ λ-== = 其中0λ>是常数,称X 服从参数为λ的泊松~(;)X P k x . 1.1相关定义 1. 离散型随机变量X 的函数分布律{},0,1,2k k P X x P k === ,若级数1k k k x p ∞ =∑绝 对收敛,称级数 1 k k k x p ∞ =∑为随机变量X 的数学期望[]E x , []E x =1k k k x p ∞ =∑. 2. 定理:Y 是随机变量X 的函数,(),(Y g x g =是连续函数),X 是离散型随机变量, 若 1 ()k k k g x p ∞ =∑绝对收敛,则 [][()]E Y E g x ==1 ()k k k g x p ∞ =∑. 3. 随机变量X ,若2{[()]}E X E X -存在,则称2{[()]}E X E X -为X 的方差,记 为()D x 或()Var x ,即 ()D x =()Var x =2{[()]}E X E X -.

Gamma分布与指数分布

Gamma分布与指数分布 "Gamma分布gamma distribution; form of gamma distribution;" 在学术文献中的解释 1、在地震序列的有序性、地震发生率的齐次性、计数特征具有独立增量和平稳增量情况下,可以导出地震发生i次时间的概率密度为Gamma密度函数(亦称为Gamma分布) Γ(x)称为伽马函数,它是用一个积分式定义的,不是初等函数。伽马函数有性质:Γ(x+1)=xΓ(x),Γ(0)=1,Γ(1/2)=√π,对正整数n,有Γ(n+1)=n! 伽马分布里面Γ(α,β)(分布函数已经了解)。α,β个指代何种意义的参数?比如在化工里面有这样一个问题,说反应器管道的长度L服从Γ(α,β)分布,那么α,β是和管道形状和尺度相关的参数。α,β是两个分布调整参量,该分布

的期望=C+(α/β),也就是说α/β调整期望;分布的方差=α/β^2,由此并不需要单独定义二者,应该共同对分布起作用! 伽马函数Γ(z)的定义域是,C-{-n,n=0,1,2,...},其中C为复数域, Re(z)>0时,常见的积分是收敛,也就是说Γ(z)可用常见的积分定义。 如1种常见的积分:Γ(z)=∫{0

3-第7章统计学参数估计练习题(20200627170347)

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用_________ 去估计____________ 。 2?点估计就是用_____________ 的某个取值直接作为总体参数的 _____________ 。 3. ______________________ 区间估计是在的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减___________ 得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的 比例称为___________ ,也成为_____________ 。 5. __________________________________________________________ 当样本量给定时,置信区间的宽度随着置信系数的增大而__________________________ ;当置信水 平固定时,置信区间的宽度随着样本量的增大而_____________ 。 6. 评价估计量的标准包含无偏性、 ___________ 和____________ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计 的可靠程度,就会___________ 置信区间的宽度;如要缩小置信区间的宽度,又不降 低置信程度,就要____________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、 ___________ 和___________ 的影响。 9?估计方差未知的正态总体均值置信区间用公式_____________ ;当样本容量大于等于30时,可以用近似公式__________ 。 10?估计正态总体方差的置信区间时,用___________ 分布,公式为___________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C?一定包含总体均值

正态总体参数的区间估计

第19讲 正态总体参数的区间估计 教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行 区间估计的方法。 教学重点:置信区间的确定。 教学难点:对置信区间的理解。 教学时数: 2学时。 教学过程: 第六章 参数估计 §6.3正态总体参数的区间估计 1. 区间估计的概念 我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。因此,对于未知参数θ,除了求出它的点估计?θ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。 设?θ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即 ?{||}1P θθεα -<=- 或 αεθθεθ-=+<<-1)??(P 这表明,随机区间)?,?(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)?,?(εθεθ+-就称为置信区间,1α-称为置信水平。 定义 设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得 12{}1P θθθα <<=-

则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。 注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。 (2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1α-的置信区间12(,)θθ,一方面置信水平1α-越大,估计的可靠性越高;另一方面区间12(,)θθ的长度(2)ε越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降(1α-变小),所以要找两方面的平衡点。 在学习区间估计方法之前,我们先介绍标准正态分布的α分位点概念。 设 () ~0,1X N ,若 z α 满足条件 { },01 P X z α αα>=<<,则称点z α为标准正态分布的α分位点。例如求0.01z 。按照α分位点定义,我们有 {}0.010.01P X z >=,则{}0.010.99P X z ≤=,即0.01()0.99z φ=。查表可得0.01 2.327z =. 又 由()x ?图形的对称性知1z z αα-=-。下面列出了几个常用的z α值: 2. 正态总体均值μ的区间估计 设已给定置信水平为1α-,总体()2~,X N μσ,12,,,n X X X 为一个样本,2 ,X S 分别是样本均值和样本方差。

相关文档