文档视界 最新最全的文档下载
当前位置:文档视界 › 数理统计学习心得

数理统计学习心得

数理统计学习心得
数理统计学习心得

数理统计学习心得

现实中常常存在这种情况,我们所掌握的数据只是部分单位的数据或有限单位的数据,而我们所关心的却是整个总体甚至是无限总体的数量特征。例如民意测验谁会当选主席?体育锻炼对增强心脏功能是否有益?某种新药是否提高疗效?全国婴儿性别比例如何?等等。这时只靠部分数据的描述是无法获得总体特征的知识。我们利用统计推断的方法来解决。所谓统计推断就是以一定的置信标准要求,根据样本数据来判断总体数量特征的归纳推理的方法。统计推断是逻辑归纳法在统计推理的应用,所以称为归纳推理的方法。统计推断可以用于总体数量特征的估计,也可以用于对总体某些假设的检验,所以又有不同的推断方法,下面就参数估计和假设检验的基本概念及原理简单谈谈。

参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。参数估计包括点估计和区间估计两种方法。

点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点估计问题就是要构造一个只依赖于样本的量,作为未知参数或未知参数的函数的估计值。构造点估计常用的方法是:①矩估计法。用样本矩估计总体矩,如用样本均值估计总体均值。②最大似然估计法。于1912年由英国统计学家R.A.费希尔提出,利用样本分布密度构造似然函数来求出参数的最大似然估计。③最小二乘法。主要用于线性统计模型中的参数估计问题。④贝叶斯估计法。基于贝叶斯学派(见贝叶斯统计)的观点而提出的估计法。

区间估计是依据抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,作为总体分布的未知参数或参数的函数的真值所在范围的估计。例如人们常说的有百分之多少的把握保证某值在某个范围内,即是区间估计的最简单的应用。1934年统计学家J.奈曼创立了一种严格的区间估计理论。求置信区间常用的三种方法:①利用已知的抽样分布。②利用区间估计与假设检验的联系。

③利用大样本理论。

假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样

本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。假设检验的一般步骤

1、提出检验假设(又称无效假设,符号是H0))和备择假设(符号是H1)。H0:样本与总体或样本与样本间的差异是由抽样误差引起的; H1:样本与总体或样本与样本间存在本质差异;预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作α,通常取α=0.05或α=0.01。

2、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如X2值、t值等。根据资料的类型和特点,可分别选用Z检验,T检验,秩和检验和卡方检验等。

3、根据统计量的大小及其分布确定检验假设成立的可能性P的大小并判断结果。若P>α,结论为按α所取水准不显著,不拒绝H0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果P≤α,结论为按所取α水准显著,拒绝H0,接受H1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。P值的大小一般可通过查阅相应的界值表得到。

假设检验应注意的问题

1、做假设检验之前,应注意资料本身是否有可比性。

2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。

回归分析:应用数学的方法,通过对大量的试验数据进行处理和分析,从而得出正确的反映变量之间的相互关系的数学表达式,并判断其有效性。进而根据表达式,根据一些变量的取值去预测或控制另一变量的变化,并分析这些变量对另一变量的影响程度。(强调的是数学模型的建立,且用F检验验证所有自变量与因变量的显著性。用T检验验证模型中每个自变量单独与因变量的影响显著性。)

相关分析:在统计分析中,对两个及两个以上变量间数量关系的性质、特点、表现形式进行描述、处理的一种专门的统计分析技术。变量之间的不严格、不准确、不稳定的数量依存关系被称为相关关系,相关关系的强弱、疏密、因环境、时间的变化而呈现出一种独特的规律性。相关分析的目的就是探索相关关系的变动规律,并利用相关分析的结果,为回归分析及统计决策提供有力的依据。

相关系数只能描述变量间的关系密切程度,不能揭示现象间的本质联系。

相关系数:随机向量的各个变量之间线性关系的密切程度。

多重共线问题:当自变量之间存在一定程度的关联,即相关系数在0和1之间时,回归模型中的自变量就会削弱各自对因变量的影响,在一定程度上影响参数估计值的准确性和稳定性。

对多重共线问题的测度:

1,自变量的容忍度,以容许度指标表示。容许度=1-R平方。容许度越大,说明某个自变量X与方程中的其他自变量之间的线性关系越弱,多重共线性较低。反之,容许度接近0,说明某个自变量X与方程中的其他自变量之间的线性关系较强,多重共线性较高,应将此自变量剔除出模型。

2,方差膨胀因子。方差膨胀因子是容许度的倒数,其数值越大,说明自变量之间的多重共线越高。

3,D-W检验。检验模型中的误差项是否存在自相关的一种有效方法。D在0-4之间。D=2,残差之间独立。D<2,残差之间正相关。D>2,残差之间负相关。根据经验,D∈(1.5,2.5)之间表示没有显著自相关问题。

自变量:我们将变量中的原因变量称为自变量,即不受其他因素影响而发生变化在前的变量。

因变量:结果变量,受自变量变化影响而跟着发生变化的变量。

线性回归模型:是线性模型中的一种,变量之间的关系呈线性关系,数学基础是回归分析。(用回归分析方法建立的,变量之间的关系呈线性关系,用以揭示经济现象中的因果关系的模型)。

事件分析法:主要是分析某事件对于社会经济生活是否确实有冲击作用。需要首先界定事件发生作用的时间段,即事件窗口,然后通过事件窗口超额收益的大小来衡量事件的影响。所谓超额收益是指实际收益与假设发生该事件的期望收益之差,而期望收益是由计量经济模型计算。

事件窗口即为事件期。

配对T检验主要解决配对样本数据的两个总体均值有否显著差异的问题。主要解决来自配对样本数据的两个总体均值有否显著差异的问题。所谓配对样本,通常是指对同一观察对象在使用某种新方法前后的两组数据进行比照,用两组数据

的均值,有否显著差异来判断这种新方法的有效性。配对样本的T检验对数据的要求:1,抽取样本数据的两个总体必须服从正态分布。2,两个样本的样本容量相同。

显著性水平:假设检验中,常有=0.05,=0.01作为检验的显著水平。显著性水平是指当原假设为真时人们拒绝它的概率,亦称拒真概率。根据假设检验的原理,拒真概率应是一个小概率事件。如果在检验中发现用样本数据计算出来的实际概率小于或等于事先给定显著性水平(p≦),就可以认为这个在一次试验中不应该发生的更小概率,居然在一次试验中发生了,我们有理由怀疑原假设的真实性,所以拒绝原假设。(p>),接受原假设。

学习到连续型随机变量时已经与高中学习的相差很大,对连续型随机变量求其在去某值时的概率是无意义的,只能求变量落在某一范围内的概率。因为现实生活中的事件大多受到两个或多个因素影响,很多随机现象中,往往要涉及到多个随机变量,而且这些随机变量之间存在某种联系,因此多维随机变量的知识在生活中应用更广。随机变量的概率密度与分布直接反映出随机变量的分布情况,随机变量的数学期望,方差等在生活中可以帮助人们做出选择。比如大赛前选拔选手才赛,对某产品的质量估计等。

当一些随机变量的分布不易求出或不需要知道随机变量的概率分布,而只需要知道其数学期望,方差即可知道其大概分布情况。随机变量的数学期望反映了随机变量取值的平均值,而随机变量的方差反映了随机变量离开其平均值的平均偏离大小,反映了随机变量的稳定性。

学好数理统计这门课程,其实有很大的作用,它会让人对日常生活中一些涉及概率方面的问题有更加深刻的体会。如果没有统计学,人们在收集资料和进行各项的大型的数据收集工作是非常困难的,通过对统计方法的研究,使得我们处理各种数据更加简便,所以统计也是一门很实用的科学,应该受到大家的重视。

医药数理统计习题和答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1(D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C)

硕士生《数理统计》例题及答案

《数理统计》例题 1.设总体X 的概率密度函数为: 2 2 1)(ββ x e x f -= )0(>β 试用矩法和极大似然法估计其中的未知参数β。 解:(1)矩法 由于EX 为0, πβββββ βββββββ2 00 2 2 2 22 2 1][) ()2 (2) ()2(21 2)(2 2 2 2 2 2 2 2 2 2 = +-=- =- - ===???? ?∞ +-∞+- ∞ +- - ∞ +- ∞ ++∞ ∞ -dx e xe e d x x d xe dx e x dx x f x EX x x x x x πβ2 222 1= -=X E EX DX 令2S DX =得:S π β2 ?= (2)极大似然法 ∑= ==- =- ∏ n i i i x n n i x e e L 1 2 22 2 1 11 1 β ββ β ∑=- -=n i i x n L 1 22 1 ln ln ββ 2 31 ln 2n i i d L n x d βββ==-+∑ 令0ln =β d L d 得∑==n i i x n 1 2 2?β

2. 设总体X 的概率密度函数为: ?? ???<≥--=αα βαββαφx x x x ,0),/)(exp(1 ),;( 其中β>0,现从总体X 中抽取一组样本,其观测值为(2.21,2.23,2.25,2.16,2.14,2.25,2.22,2.12,2.05,2.13)。试分别用矩法和极大似然法估计其未知参数βα和。 解:(1)矩法 经统计得:063.0,176.2==S X β αβαβ φα β α α β ααβ α β α α β α α +=-=+-=-===∞ +-- ∞ +-- ∞ +-- -- ∞ +-- ∞ +∞ +∞-?? ? ?x x x x x e dx e xe e xd dx e x dx x x EX ][) (1 )( ) (222][) (1 222 22 2βαβαβαβ β α α αβ α β α α β α α ++=+=+-=-==--∞ +∞ +-- --∞ +-- ∞ +?? ?EX dx e x e x e d x dx e x EX x x x x 222)(β=-=EX EX DX 令???==2S DX X EX 即???==+2 2S X ββα 故063.0?,116.2?===-=S S X βα (2)极大似然法 ) (1 1 1),;(αβ β α β β βα---- == =∏X n n X n i e e x L i )(ln ln αβ β-- -=X n n L )(ln ,0ln 2αβ βββα-+-=??>=??X n n L n L 因为lnL 是L 的增函数,又12,,,n X X X α≥L 所以05.2?)1(==X α

(完整word版)医药数理统计大纲_试题及答案(1)

模拟训练题及参考答案 模拟训练题: 一、选择题: 1.下列事件中属于随机事件范畴的是( ) A. {人的的寿命可达500岁} B. {物体会热胀冷缩} C. {从一批针剂中抽取一支检验} D. {X2+1=0 有实数解} 2.依次对三个人体检算一次试验,令A={第一人体检合格},B={第二人体检合格},C={第三人体检合格},则{只有一人体检合格}可以表示为( ) A. A+B+C B. ABC C. C B A D. C B A C B A C B A ++ 3.一批针剂共100支,其中有10支次品,则这批针剂的次品率是( ) A. 0.1 B. 0.01 C. 0.2 D. 0.4 4.所谓概率是指随机事件发生的( )大小的数值表示。 A. 频率 B. 可能性 C. 次数 D. 波动性 5.若X~N (μ,σ2),则EX 的值为( ) A. μ B. μ2 C. σ2 D. σ 6.若X~B (K ;n ,p ),则DX 的值为( ) A. np B. μ C. σ2 D. np(1-p) 7.求一组数据(5,-3,2,0,8,6)的总体均数μ的无偏估计( ) A.2.4 B.3.1 C.3 D.4 8.作参数的区间估计时,给定的α越大,置信度1-α越小,置信区间处于( )变化。 A 变窄 B.变宽 C.没有 D.不确定 9.对于一组服从正态分布的试验数据,描述试验数据波动程度的特征统计量是( ). A. 样本算术平均数 B.中位数 C. 样本标准差 D.样本频数 10.伯努利概率模型具有的两个特点:( ) A.每次试验的结果具有对立性;重复试验时,每次试验具有独立性

医药数理统计习题及答案汇编

学习好资料 第一套试卷及参考答案 一、选择题 ( 40 分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制 ( B ) A 条图B 百分 条图或圆图C 线图D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式E负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检 验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A. 个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6、男性吸烟率是女性的10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D )率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t 检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n i和住,在进行成组设计资料的t 检 验时,自由度是( D ) (A) n i+ n2 (B) n i+ n2 - C) n1+ n2 +1 D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小E垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析, 又作直线相关分析。 令对相关系数检验的t值为t r,对回归系数检验的t值为t b, 二者之间具有什么关系?( C) A t r >t b B t r

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

医药数理统计第六章习题集(检验假设和t检验)

第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95%

答案:E D C D E 二、计算与分析 1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4 X=, 1.5 S=,450 n=,0.07 X S=== 95%可信区间为 下限: /2.101.4 1.960.07101.26 X X u S α=-?= -(g/L) 上限: /2.101.4 1.960.07101.54 X X u S α +=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。 2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ①均数的标准误可以用来衡量样本均数的抽样误差大小,即 30 S=mg/dl,100 n= 3.0 X S=== ②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5 X=,30 S=,100 n=,3 X S=,则95%可信区间为 下限: /2.207.5 1.963201.62 X X u S α=-?= -(mg/dl)

最新重庆大学研究生数理统计期末考试题

涉及到的有关分位数: ()()()()()()()()()()()()2 0.950.950.950.9750.9750.9752222220.9750.0250.0250.9750.950.97520.95 1.645,16 1.746,15 1.753,16 2.12,15 2.131,1628.851527.49,16 6.91,15 6.26,1 5.02,1 3.84,27.382 5.99 u t t t t χχχχχχχχ============= 一、设123,,X X X 是来自总体~(0,3)X N 的样本。记()2 332 i 11 11,32i i i X X S X X ====-∑∑, 试确定下列统计量的分布: (1)3113i i X =∑;(2)2 3119i i X =?? ???∑;(3)() 2 31 13i i X X =-∑;(4 X 解:(1)由抽样分布定理,3 1 1~(0,1)3i i X X N ==∑ (2)因311~(0,1)3i i X N =∑,故2 2 332 1111~(1)39i i i i X X χ==????= ? ????? ∑∑ (3)由抽样分布定理, ()() () 2 2 23 3 21 1 31211~(2)3 323i i i i S X X X X χ==-=?-=-∑∑ (4)因()222~(0,1), ~23 X N S χ,X 与2S ()~2X t 。 二、在某个电视节目的收视率调查中,随机调查了1000人,有633人收看了该节目,试根 据调查结果,解答下列问题: (1)用矩估计法给出该节目收视率的估计量; (2)求出该节目收视率的最大似然估计量,并求出估计值; (3)判断该节目收视率的最大似然估计是否是无偏估计; (4)判断该节目收视率的最大似然估计是否是有效估计。 解:总体X 为调查任一人时是否收看,记为~(1,)X B p ,其中p 为收视率 (1)因EX p =,而^ E X X =,故收视率的矩估计量为^ X p = (2)总体X 的概率分布为() 1()1,0,1x x f x p p x -=-= 11 11 ()(1)(1) (1)ln ()ln (1)ln(1)ln ()(1) 01n n i i i i i i n x n x x x n X n n X i L p p p p p p p L p nX p n X p d L p nX n X dp p p ==- --=∑∑=-=-=-=+---=-=-∏

医药数理统计方法试题(二)

医药数理统计方法 第五章t检验 一、单项选择题 1. 两样本均数比较,检验结果05 P说明 .0 A. 两总体均数的差别较小 B. 两总体均数的差别较大 C. 支持两总体无差别的结论 D. 不支持两总体有差别的结论 E. 可以确认两总体无差别 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 A. 两样本均数的差别具有实际意义 B. 两总体均数的差别具有实际意义 C. 两样本和两总体均数的差别都具有实际意义 D. 有理由认为两样本均数有差别 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P值越小说明 A. 两样本均数差别越大 B. 两总体均数差别越大 C. 越有理由认为两样本均数不同 D. 越有理由认为两总体均数不同 E. 越有理由认为两样本均数相同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 A. 减少Ⅰ类错误 B. 减少测量的系统误差 C. 减少测量的随机误差 D. 提高检验界值 E. 增加样本含量 5.两样本均数比较的t检验和u检验的主要差别是 A. t检验只能用于小样本资料 B. u检验要求方差已知或大样本资料 C. t检验要求数据方差相同 D. t检验的检验效能更高 E. u检验能用于两大样本均数比较 答案:D E D E B

二、计算与分析 1. 已知正常成年男子血红蛋白均值为140g/L ,今随机调查某厂成年男子60人,测其血红蛋白均值为125g/L ,标准差15g/L 。问该厂成年男子血红蛋白均值与一般成年男子是否不同? [参考答案] 因样本含量n >50(n =60),故采用样本均数与总体均数比较的u 检验。 (1)建立检验假设, 确定检验水平 00:μμ=H ,该厂成年男子血红蛋白均值与一般成年男子相同 11μμ≠:H ,该厂成年男子血红蛋白均值与一般成年男子不同 α=0.05 (2) 计算检验统计量 X X X u μ σ-= = =60 15125 140-=7.75 (3) 确定P 值,做出推断结论 7.75>1.96,故P <0.05,按α=0.05水准,拒绝0H ,接受1H ,可以认为该厂成年男子血红蛋白均值与一般成年男子不同,该厂成年男子血红蛋白均值低于一般成年男子。 2. 某研究者为比较耳垂血和手指血的白细胞数,调查12名成年人,同时采取耳垂血和手指血见下表,试比较两者的白细胞数有无不同。 表 成人耳垂血和手指血白细胞数(10g/L) 编号 耳垂血 手指血 1 9.7 6.7 2 6.2 5.4 3 7.0 5.7 4 5.3 5.0 5 8.1 7.5 6 9.9 8.3 7 4.7 4.6 8 5.8 4.2 9 7.8 7.5

北航2014级硕士研究生应用数理统计答案(B卷)

2014-2015 学年 第一学期期末试卷答案 学号 姓名 成绩 考试日期: 2015年1月13日 考试科目:《应用数理统计》(B 层) 一、填空题(本题共16分,每小题4分) 1.设122,,n x x x ,是来自正态总体2(,)N μσ的简单样本,则c = n m m - 时,统计量2 22112 2211 ()()m k k k n k k k m x x c x x η-=-=+-=-∑∑服从F -分布。 2. 设12,,n x x x ,是来自正态总体2 (0,)N σ的简单样本,用2 2 21 1?()n i i nx x n σ ===∑估计2σ,则均方误差2222?()E σσ σ- 42σ 。 3.设总体X 的密度函数为22 ,[0,] (;)0, [0,]x x p x x θθθθ?∈?=????,其中0θ>,12,,,n x x x 是 来自总体X 简单样本,则2()q θθ=的矩估计?q = 2 94 x 或2 1 2n i i x n =∑ 。 4.在双因素方差分析中,总离差平方和T S 的分解式为 T A B A B e S S S S S ?=+++ 其中2 111 ()p q r e ijk ij i j k S x x ?====-∑∑∑,11r ij ijk k x x r ?==∑, 则e S 的自由度是 (1)p q r - 或n pq -,其中n pqr = 。

二、(本题12分)设总体X 的密度函数为111,(0,1) (;)0,(0,1)x x f x x θ θθ-?∈?=???? ,其中0θ>, 12,,,n x x x 是来自总体X 的简单样本。 (1)求θ的极大似然估计?θ;(2)求θ的一致最小方差无偏估计;(3)问θ的一致最小方差无偏估计是否为有效估计?证 明你的结论。 解(1)似然函数为 (1)()1 1 {01}121 1 ()() (,,,)n n i x x n n i L x I x x x θ θθ-<≤<== ∏ 对数似然函数为 (1)(){01}121 1 ln ()ln (1)ln ln (,,,)n n i x x n i L n x I x x x θθθ <≤<==-+-+∑ 求导,有 2 1 ln ()1 ln n i i L n x θθθθ =?=--?∑ 令ln ()0L θθ?=?,可得θ的极大似然估计为1 1?ln n i i x n θ==-∑。 (2)因为 (1)()1 1 12{01}121 1 (,,,;)() (,,,)n n n i x x n n i f x x x x I x x x θ θθ-<≤<== ∏ (1)(){01}121 1 1 (,,,)exp{(1)ln }n n x x n i n i I x x x x θθ <≤<==-∑ 令1 ()n c θθ = ,(1)(){01}12()(,,,)n x x n h x I x x x <≤<= ,1 ()1w θθ = -,1 ln n i i T x ==∑,由于() w θ的值域(0,)+∞有内点,由定理2.2.4知1 ln n i i T x ==∑是完全充分统计量。而 1 1 1 1 (ln )(ln )i E x x x dx θθθ -= =-? 所以 1 1 (ln )(ln )n n i i i i E x E x n θ====-∑∑

数理统计考研复试题库及答案

2(1)未知函数u 的导数最高阶为2,u ``,u `,u 均为一次,所以它是二阶线性方程。 (2) 为y 最高阶导数为1,而y 2为二次,故它是一阶非线性常微分方程。 (3) 果y 是未知函数,它是一阶线性方程;如果将x 看着未知函数,它是一阶非线 性方程。 3. 提示:所满足的方程为y ``-2 y `+y=0 4. 直接代入方程,并计算Jacobi 行列式。 5.方程变形为dy=2xdx=d(x 2),故y= x 2+C 6. 微分方程求解时,都与一定的积分运算相联系。因此,把求解一个微分方程的过程称为一个微分方程。微分方程的解又称为(一个)积分。 7. 把微分方程的通解用初等函数或通过它们的积分来表达的方法。注意如果通解能归结为初等函数的积分表达,但这个积分如果不能用初等函数表示出来,我们也认为求解了这个微分方程,因为这个式子里没有未知函数的导数或微分。 8. y `=f(x,y)主要特征是f(x,y)能分解为两个因式的乘积,其中一个因式仅含有x,另一因式仅含y ,而方程p(x,y)dx+q(x,y)dy=0是可分离变量方程的主要特征,就像f(x,y)一样,p,q 分别都能分解成两个因式和乘积。 9 (1) 积分得x=-cosx+c (2) 将方程变形为x 2 y 2 dy=(y-1)dx 或1-y y 2=2x dx ,当xy ≠0,y ≠1时积分得 22x +y+ln 1-y +x 1=c (3)方程变形为 y dy +1=x x sin cos dx,当y ≠-1,sinx ≠0时积分得 y=Csinx-1 (4)方程变形为 exp(y)dy=exp(2x)dx,积分得 exp(y)= 2 1 exp(2x)+C (5)当y ≠±1时,求得通积分ln 1 1 +-y y =x+c (6)方程化为 x 2 ydx=(1- y 2 )(1+x 2 )dx 或2 2 1x x +dx=y y 21-dy,积分得 x -arctgx -ln y + 2 1y 2 =C

医学院校医药数理统计

医学院校医药数理统计范文 一、当代大学生心理特点以及医药数理统计课程的特点 1.当代大学生的心理特点。大学生在生理上进一步发育趋于成熟,心理上趋向主动和独立,思维能力迅速提高,抽象思维能力与逻辑推断思维能力获得显著地发展,追求新意,对问题和事物有着独特的见解和认识,从而使他们在精神方面的独立意识较之一般青年更为突出。而且当代大学生的这种强烈的自我意识,迫切需要同学、老师、社会以及自身的肯定,马斯洛的自我实现的需求在当代大学生身上表现得尤为突出。另一方面,当代大学生处在一个社会迅速变迁,科技日新月异,信息高度发达的阶段,使得他们探索问题的好奇心更加强烈,希望能够探索万事万物的真相,但大多数大学生怕吃苦,自制力和耐挫力较差。 2.医药数理统计课程的特点。虽然医药数理统计相对于高等数学等传统数学类课程具有更强的应用性和趣味性,但医药数理统计是建立在随机理论基础上的,对习惯了确定性思维的大学生,如何转换思维模式是一个挑战;医药数理统计方法的应用一方面需要结合学生的学科专业知识,另一方面需要结合软件实现,如何做到数理统计方法、医药专业知识和应用软件三方面的有机结合是医药数理统计教学过程中迫切需要解决的问题;医药数理统计方法的实际应用涉及的知识面较广,难度较大,如何将利用数理统计方法解决实际问题的完整过程简洁又不失生动地展现在学生面前也是一个关键问题。结合当代大学生心理特点和医药数理统计课程的学科特点,急需从教学内容、教

学方法及教学激励和评价机制等方面改革当前医药院校医药数理统计教学。 二、医药数理统计教学改革的内容和措施 1.教学内容的改革是《医药数理统计方法》教学改革的基础。认真研究和理解医药院校各专业学生的培养目标,在不破坏学科知识体系的情况下,在突出医药学特色和增加应用性这两个原则的指导下调整知识点,删减陈旧知识,弱化公式推导,增加结合医药学应用的新方法,增加应用型、研究性案例比重,将重点、难点放在医药特色实际应用的案例教学及科学思维方法的培养上,以应用需求为先导,以案例教学为媒介,以实验软件实现为辅助,实现教材内容与企业实际需求以及医药科研的同步更新,提高学生的学习兴趣和积极性。同时教学内容改革是龙头,必将带动其教学方法、考核方法等一系列的改革,为医药特色创新型、应用型人才的培养打下坚实的基础。 2.教学方法改革是《医药数理统计方法》教学改革的核心。通过教学内容的改革,可以使得教学内容能引起学生兴趣,但如何使学生对医药数理统计保持持久兴趣是最大的难题。如何将一时好奇升化为持久的兴趣、理想及自我价值的实现,必须结合当代大学生心理特点,采用实用有效的课堂教学方法。根据当代大学生的心理特点以及医药数理统计课程的特点,案例教学法是非常合适的教学方法。首先教师可以从较新的权威学术期刊,甚至是教师的科研课题里面寻找案例,或者以产学研合作项目为契机,深入了解企业现今最新需求,根据企业提供的基础资料,提炼经典案例。在案例教学过程中由教师把精选

研究生《应用数理统计基础》庄楚强 四五章部分课后答案

4-45. 自动车床加工中轴,从成品中抽取11根,并测得它们的直径(mm )如下: 10.52,10.41,10.32,10.18,10.64,10.77,10.82,10.67,10.59,10.38,10.49 试用W 检验法检验这批零件的直径是否服从正态分布?(显著性水平05.0=α) (参考数据:) 4-45. 解:数据的顺序统计量为: 10.18,10.32,10.38,10.41,10.49,10.52,10.59,10.64,10.67,10.77,10.82 所以 6131 .0][)()1(5 1 ) (=-= -+=∑k k n k k x x a L , 又 5264.10=x , 得 38197 .0)(11 1 2 =-∑=i i x x 故 984.0) (11 1 2 2 =-= ∑=i i x x L W , 又 当n = 11 时,85.005.0=W 即有 105.0<

昆明理工大学2007级硕士研究生数理统计考题

2007硕士研究生《数理统计》考题 题中可能涉及的值:645.105.0=z ,1824.3)3(025.0=t ,3534.2)3(05.0=t ,5706.2)5(025.0=t , 7459.1)16(05.0=t ,44.3)8,8(05.0=F ,)2(205.0χ=5.991,)3(205.0χ=7.815 一.填空题(每题3分,共36分) 1.向某一目标发射炮弹,设炮弹的弹着点到目标的距离为R 单位 , R 服从瑞利分布,其概率 密度为?? ???≤>=-0,00,252)(25/2r r e r r f r R ,若弹着点离目标不超过5个单位时,目标被摧毁。则(1) 发射一发炮弹能摧毁目标的概率为_______(2)为使至少有一枚炮弹能摧毁目标的概率不小于0.95, 则最少需要发射的炮弹数为________枚。 2.已知3,2,1,=i X i ,相互独立,且i X D i /1)(=,若 ∑==311i i a , ∑==31i i i X a Y ,要使)(Y D 达到最大,则1a =_________;2a =__________. 3.设总体)1,0(~N X ,161,,X X 是其一简单随机样本,2 S 为样本方差))((22σ=S E , 则)(2S D =________; ~ (2162) 1X X ++________;~/1516221∑=i i X X ___________. 4.某批电子元件的寿命服从均值为θ的指数分布,现从中抽取n 个元件在0=t 时同时投入寿命实验,截止时刻为T ,且已知到T 为止共有r 个元件损坏。(1)若此r 个元件具体损坏时刻未知,则θ的最大似然估计为__________;(2)若此r 个元件具体损坏时刻分别为r t t t ≤≤≤ 21,则θ的最大似然估计为__________. 5.对于具有s 个水平的单因素A 实验方差分析(水平i A 对应的总体为),(2σμi N , (i=1,2,…,s ),现取样,设各水平下的样本容量之和为n,以T E A S S S ,,分别表示因素A 的效 应平方和、误差平方和、总偏差平方和,则(1)T E A S S S ,,之间的关系是___________; (2)在s μμ==...1成立的条下,~) /()1/(s n S s S E A --___________;(3)在显著性水平α下,假 设“s H μμ==...:10,s H μμ,...,:11不全相等”的拒绝域形式是_________ 二.(10分)已知甲乙两地新生婴儿身高都是服从正态分布的随机变量,分别以X ,Y 表示,假设),(~),,(~2 221σμσμN Y N X (参数均未知),且相互独立,现从两总体中分别取样,容量均为9,样本值分别为46,47,…,54和51,52,…,59.(1)求21μμ-的置信水平

最新研究生《应用数理统计基础》庄楚强-何春雄编制---课后答案

研究生 习题2: 2-7. 设 )1,0(~N ξ,),,,,,(654321ξξξξξξ为其一样本,而26542321)()(ξξξξξξη+++++=, 试求常数c ,使得随机变量ηc 服从2 χ分布。 2-7解:设3211ξξξη++=,所以 )3,0(~1N η 6542ξξξη++=,所以 )3,0(~2N η 所以 )1,0(~3 1 N η , )1,0(~3 2 N η )2(~)(3 1332 22212 22 1χηηηη+=??? ??+??? ?? 由于 2 22 1ηηη+= 因此 当 3 1=c 时,)2(~2 χηc 。 2-8. 设 ),,,(1021ξξξΛ为)3.0,0(2 N 的一个样本,求 ? ?? ???>∑=101244.1i i P ξ 。(参考数据:) 2-8解:因为 )3.0,0(~),,,(2 1021N ξξξξΛ=, 所以 )1,0(~3 .0N ξ , 即有)10(~3.0210 12 χξ∑=?? ? ??i i 所以 ??? ???>∑=101244.1i i P ξ??????>=∑=1012223.044.13.0i i P ξ??????>=∑=10122163.0i i P ξ ? ?? ???≤-=∑=10122163.01i i P ξ1.09.01=-= 2-14. 设总体)4,1(~N ξ,求{}20≤≤ξP 与{} 20≤≤ξP ,其中ξ是样本容量为16的样 本均值。(参考数据:)

2-14解: {}20≤≤ξP )0()2(F F -=)210()212( -Φ--Φ=)2 1 ()21(-Φ-Φ= 1)2 1 (2-Φ=3830.016915.02=-?= 由于 )4,1(~N ξ , 所以 )1,0(~21 1 16 21N -=-ξξ {} 20≤≤ξP ????? ?-≤-≤-=21122112110ξP ? ?? ???≤-≤-=22112ξP )2()2(-Φ-Φ=9545.019725.021)2(2=-?=-Φ= 2-17. 在总体)20,80(2 N 中随机抽取一容量为100的样本,问样本平均值与总体均值的差的 绝对值大于3的概率是多少?(参考数据:) 2-17解:因为 )20,80(~2 N ξ, 所以 )1,0(~2 80 100 20 80 N -= -ξξ 所以 {}380>-ξP {} 3801≤--=ξP ?? ? ?????? ?≤--=232801ξP ? ?? ???≤ -≤--=23280 231ξP )]5.1()5.1([1-Φ-Φ-= ]1)5.1(2[1-Φ-=1336.0)93319.01(2)5.1(22=-=Φ-= 2-25. 设总体ξ的密度函数为 ?? ?<<=其它 102)(x x x p 取出容量为4的样本),,,(4321ξξξξ,求: (1) 顺序统计量)3(ξ的密度函数)(3x p ;(2))3(ξ的分布函数)(3x F ;(3)??? ? ??>21)3(ξP 。 2-25解:(1)由 ()()[][])()(1)(! !1! )(1)(x p x F x F k n k n x p k n k k -----= ξ 所以 当 10<

概率论与数理统计考研真题

考研真题一 ( ). ,4,"",,,.,41.)4()3()2()1(0E T T T T E t ≤≤≤等于则事件个温控器显示的按递增顺序为设电炉断电事件以电炉就断电只要有两个温控器显示的温度不低于临界温度在使用过程其显示温度的误差是随机的个温控器在电炉上安装了中排列的温度值表示}. {(D)}; {(C)};{(B)};{(A)0)4(0)3(0)2(0)1(t T t T t T t T ≥≥≥≥数三、四考研题 00. (D); (C);(B);(A)( ). ,,,,,2.独立与独立与独立与独立与相互独立的充分必要条件是则三个事件两两独立设C A B A AC AB C A AB BC A C B A C B A 数四考研题00( ).,3.=B B A B A 不等价的是与和对于任意二事件 数四考研题 01. (D); (C); (B); (A)?=?=??B A B A A B B A . ) |()|(1,0,,独立的充分必要条件与是事件证明 和的概率不等于其中是任意二事件设B A A B P A B P A B A =4.数四考研题 02;,,;,,( ). }, {},{}, {}, {: ,5.4323214321相互独立相互独立则事件正面出现两次正、反面各出现一次掷第二次出现正面掷第一次出现正面引进事件将一枚硬币独立地掷两次A A A A A A A A A A ====数三考研题 03(B)(A). ,,;,,432321两两独立两两独立A A A A A A . ,,; ,,;,,;,,( ).6.一定不独立则若一定独立则若有可能独立则若一定独立则若和对于任意两个事件B A AB B A AB B A AB B A AB B A ?=?=?≠?≠数四考研题03(D)(C)(D)(C)(B)(A)7.从数1,中任取一个数, 记为X , 再从X ,,1 中任取一个数, 为Y , 则. __________}2{==Y P 2,3,4三、四考研题 05记1. .

研究生数理统计第三章习题答案

习 题 三 1.正常情况下,某炼铁炉的铁水含碳量() 24.55,0.108X N :.现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37.如果方差没有改变,问总体的均值有无显著变化?如果均值没有改变,问总体方差是否有显著变化()0.05α=? 解 由题意知,( ) 2 4.55,0.108X N :,5n =,5 1 1 4.3645i i x x ===∑,0.05α=, ()52 2 01 10.095265i i s x μ==-=∑. 1)当00.108σ=已知时, ①设统计假设0010: 4.55,: 4.55H H μμμμ==≠=. ②当0.05α=时,0.97512 1.96u u α- == ,临界值12 1.960.0947c α- = = =, 拒绝域为000{}{0.0947}K x c x μμ=->=->. ③004.364 4.550.186x K μ-=-=∈,所以拒绝0H ,接受1H ,即认为当方差没有改变时,总体的均值有显著变化. 2)当0 4.55μ=已知时, ①设统计假设222222 0010:0.108,:0.108H H σσσσ==≠=. ②当0.05α=时,临界值 ()()()()222210.02520.975122 111150.1662,5 2.566655c n c n n n ααχχχχ-= =====, 拒绝域为2 2 2 2 0212 2 2 2 0000{ }{ 2.56660.1662}s s s s K c c σσσσ=><=><或 或 . ③ 2 02 2 00.09526 8.16700.108 s K σ= =∈,所以拒绝0H ,接受1H ,即均值没有改变时,总体方差有显著变化. 2.一种电子元件,要求其寿命不得低于1000h .现抽取25件,得其均值950x h =.已知该种元件寿命()2 ,100X N μ:,问这批元件是否合格()0.05α=?

《医药数理统计方法》中药专业

7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95 (1)计算其样本均值、方差、标准差、标准误和变异系数。 (2)求出该组数据对应的标准化值; (3)计算其偏度。 解 75.6795.55.61.710 1 =+++=∑= i i x ,n =10 =+++=∑=222101295.55.61.7 i i x 462.35 样本均值 775.61075.6711===∑=n i i x n x 方差 )(111 2 22∑ =--=n i i x n x n S 371.0)775.61035.462(9 1 2=?-= 标准差2 S S ==371.0≈0.609 标准误193.040609.0===n S S x 变异系数CV =%100||?x S = %100775.6609.0?=8.99%; (2)对应的标准化值公式为 609 .0775 .6-=-=i i i x S x x u 对应的标准化值为 0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355; (3)3 3 )2)(1()(S n n x x n S i k ---=∑=0.204 2.用事件A 、B 、C 表示下列各事件: (1)A 出现,但B 、C 不出现; (2)A 、B 出现,但C 不出现; (3)三个都出现; (4)三个中至少有一个出现; (5)三个中至少有两个出现; (6)三个都不出现; (7)只有一个出现; (8)不多于一个出现; (9)不多于两个出现。 解:(1)ABC (2)ABC (3)ABC (4)ABC BC A C B A C AB C B A C B A C B A ++++++ 或A +B +C 或C B A -Ω (5)ABC BC A C B A C AB +++ (6)ABC 或Ω-(A +B +C )或C B A ++ (7)ABC ABC ABC ++ (8)ABC ABC ABC ABC +++ (9)BC A C B A C AB C B A C B A C B A C B A ++++++ 或Ω-ABC 或ABC

相关文档
相关文档 最新文档