文档视界 最新最全的文档下载
当前位置:文档视界 › 卡方分布的研究

卡方分布的研究

卡方分布的研究
卡方分布的研究

概率论小论文

题目:卡方分布的研究

:朱旋

学号:1130510223

院系:电信学院通信工程专业

卡方分布的研究

摘要:在概率论与数理统计领域,三大分布(卡方分布、t分布、F分布)占有者重要的地位,而其中的卡方分布是最基本也是运用最广泛的一种分布,本文就卡方分布的提出、容以及运用方面围绕卡方分布进行论述。

关键词:卡方分布,t分布,F分布,分布函数,赫尔默特,卡方检验

一、卡方分布简介

卡方分布,是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布。假设检验和置信区间的计算。

若n个相互独立的随机变量ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为分布,其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个正态分布一样,自由度不同就是另一个分布。记为或者卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,分布近似为正态分布。对于任意正整数k,自由度为 k的卡方分布是一个随机变量X的机率分布。

二、提出者介绍

卡方分布是德国测量学家赫尔默特(Friedrich Robert Helmert)于1875年提出的,为后来概率统计学奠定了基础。

赫尔默特是德国测量学家。1843年7月3日生于弗赖贝格,1917年6月15日卒于波茨坦。曾任亚琛大学、柏林大学教授,波茨坦普鲁士皇家测量研究所所长和国际测量学协会中央局主席。

他第一次系统地论述了最小二乘法平差计算的理论,他所阐述的“等值观测”理论,是相关观测理论的基础。在现代误差分析和误差统计方面,赫尔默特首先提出分析函数。其著作《测量学的数学和物理学原理》,系统地论述了测量的数学基础和物理基础,第一次给测量学以系统的、明确的概念。为了研究地球的形状和大小,他于1880年提出面积法代替经典的弧度测量法,这一方法成功地被用于推算地球椭球。他所推求出的地球扁率接近于最新精确值。在地球测量方面,他提出了水准椭球的新概念。他根据可倒摆理论测出波茨坦测量研究所的绝对重力值,被定为国际重力基准,称波茨坦重力系统,世界各用此系统达70年之久。著有《最小二乘法平差计算》、《垂线偏差》、《可倒摆理论》、《重力与地球质量分布》等。

三、卡方分布解释

(1)概率密度函数

其中,是伽玛函数。

(2)期望和方差

分布的均值为自由度n,记为E() = n。

分布的方差为2倍的自由度(2n),记为D() = 2n。

(3)性质

①分布在第一象限,卡方值都是正值,呈正偏态(右偏态),随着参数n 的增大,分布趋近于正态分布;

②卡方分布密度曲线下的面积都是1.

③分布的均值与方差可以看出,随着自由度n的增大,χ2分布向正无穷方向延伸(因为均值n越来越大),分布曲线也越来越低阔(因为方差2n越来越大)。

④不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。

⑤若互相独立,则:服从分布,自由度为;服从分布,自由度为。

四、卡方分布的意义与应用

(一)由卡方分布延伸出来皮尔森卡方检定常用于:

①样本某性质的比例分布与总体理论分布的拟合优度;

②同一总体的两个随机变量是否独立;

③二或多个总体同一属性的同素性检定。

(二)卡方检验

卡方检验主要应用于计数数据的分析,对于总体的分布不作任何假设,因此它属于非参数检验法中的一种。它由统计学家皮尔逊推导。

理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。一般用卡方检验方法进行统计检验时,要求样本容量不宜太小,理论次数≥5,否则需要进行校正。如果个别单元格的理论次数小于5,处理方法有以下四种:1、单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式。当某一期望次数小于5时,应该利用校正公式计算卡方值。

卡方检验的统计原理:

?卡方检验所检测的是样本观察次数﹙或百分比﹚与理论或总体次数﹙或百分比﹚的差异性。

?理论或总体的分布状况,可用统计的期望值(理论值)来体现。

?卡方的统计原理,是取观察值与期望值相比较。卡方值越大,代表统计量与理论值的差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论。

卡方检验的主要应用:

①独立性检验

②行*列表资料的独立性检验

③拟合性检验

(三)卡方分布临界值表

卡方分布不像正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,在分布表中还需要如标准正态分布表中给出不同P 值一样,列出概率值,只不过这里的概率值是值以上,分布曲线以下的概率。由于分布概率表中要列出很多分布的概率值,所以分布中所给出的P 值就不像标准正态分布中那样给出了400个不同的P 值,而只给出了有代表性的13个值,因此χ2分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。查分布概率表时,按自由度及相应的概率去找到对应的值。这里给出了卡方分布的临界值表:

五、参考文献

[1]王勇.概率论与数理统计.高等教育.2013

[2]周圣武.应用概率统计.大学.2004

[3]盛骤.概率论与数理统计.高等教育.2010

相关文档