统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班
摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质,
然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之.
1. 三大分布函数[2]
1.12χ分布
2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅
(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。
定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,)
,则称统计量222
212n =+X X χ++…X 为服从自由度为n 的2χ
分布,记为22~()n χχ.
2χ分布的概率密度函数为
122210(;),2()200n x
n x e x n f x n x --?≥??=Γ??? 其中伽玛函数1
(),0t x x e t dt x +∞
--Γ=
>?
,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.
卡方分布具有如下基本性质:
性质1:22(()),(())2E n n D n n χχ==;
性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++;
性质3:2
n χ→∞→时,(
n )正态分布; 性质4:设)(~2
2n α
χχ,对给定的实数),10(<<αα称满足条
件:αχχα
χα
==>?+∞
)
(2
22)()}({n dx x f n P 的点)(2
n α
χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用.
2()n χ分布的上α分位数 1.2t 分布
t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置.
定义:设2
~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n
=
服从自由度为n 的t 分布,记为~()T t n .
t 分布的密度函数为
1
2
2
1
()
2
(;)(1),.
()
2
n
n
x
t x n t
n n
nπ
+
-
+
Γ
=+-∞<<+∞
Γ
t分布的密度函数图
t分布具有如下一些性质:
性质1:()
n
f t是偶函数,
2
2
,()()
2
t
n
n f t t e
?
π
-
→∞→=
;
性质2:设)
(
~n
t
T
α
,对给定的实数),1
0(<
<α
α称满足条件;
α
α
α
=
=
>?+∞)()(
)}
(
{
n
t
dx
x
f
n
t
T
P的点)(n
tα为)
(n
t分
布的水平α的上侧分位数. 由密度函数)
(x
f
的对称性,可得).
(
)
(
1
n
t
n
tα
α
-
=
-
类似地,我们
可以给出t分布的双侧分位数
,
)
(
)
(
)}
(
|
{|
)
(
)
(
2/
2
/
2
/α
α
α
α
=
+
=
>?
?+∞
-
∞
-n
t
n
t
dx
x
f
dx
x
f
n
t
T
P
显然有.
2
)}
(
{
;
2
)}
(
{
2/
2/
α
α
α
α
=
-
<
=
>n
t
T
P
n
t
T
P
对不同的α与n,t分布的双侧分位数可从附
表查得.
t分布的上α分位数
1.3F 分布
F 分布是随机变量的另一种重要的小样本分布,应用也相当广泛. 它可用来
检验两个总体的方差是否相等,多个总体的均值是否相等. F 分布还是方差分析和正交设计的理论基础.
定义:设22~(),~()X n Y m χχ,,X Y 相互独立,令则称统计量//X n
F Y m
=服从为第一自由度为n ,第二自由度为m 的F 分布.
F 分布的密度函数图
F 分布具有如下一些性质:
性质1:若~(,),1/~(,)F F n m F F m n 则; 性质2:若)(~n t X ,则2~(1,)X F n ; 性质3:设),(~m n F F α,对给定的实数
),10(<<αα称满足条件;
ααα==
>?
+∞
)
,()()},({m n F dx x f m n F F P
的点),(m n F α为),(m n F 分布的水平α的上侧
分位数.
F 分布的上α分位数
F 分布的上侧分位数的可自附表查得.
性质4:.)
,(1
),(1m n F n m F αα-= 此式常常用来求F 分布表中没有列出的某些上
侧分位数.
1.4正态分布
正态分布是数理统计中的一种重要的理论分布 ,是许多统计方法的理论基础. 高斯(Gauss )在研究误差理论时首先用正态分布来刻画误差的分布,所以正态分布又称为高斯分布. 正态分布有两个参数,μ和σ,决定了正态分布的位置和形态. 为了应用方便,常将一般的正态变量X 通过u 变换转化成标准正态变量u ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布N (0,1)
. 正态分布的密度函数和分布函数
若连续型随机变量X 具有概率密度()f x 为
22
()2(),,2x f x e x μσπσ
--
=
-∞<<+∞其中,(0)μσσ>为常数,则称X 服从参数
为μσ,的正态分布,记为2~()X N μσ,.
正态分布的密度函数图
特征1:正态曲线(normal curve )在横轴上方均数处最高;