文档视界 最新最全的文档下载
当前位置:文档视界 › Minitab非参数统计分析试卷及答案

Minitab非参数统计分析试卷及答案

Minitab非参数统计分析试卷及答案
Minitab非参数统计分析试卷及答案

桂林电子科技大学试卷2012—2013学年第 2 学期课号

课程名称非参数统计分析(机试)适用班级(或年级、专业)统计学

考试时间95 分钟班级学号姓名

一、(25分) 桂林市12年3月和13年6月出售的部分精品楼盘均价(单位:千元/平方米)数据分别如下所示:

12年3月:7.0,4.3,8.0,4.2,8.5,4.2,8.2,4.2,4.15,4.6,

3.5,3.8,

4.5,8.7,4.3,

5.5

13年6月:4.2,4.6,6.5,9.0,7.0,6.8,6.2,7.0,8.9,5.5,7.2

4.6

试问:桂林市一年来楼盘价格是否有变化?

解:

用统计软件Minitab进行Mood中位数检验的步骤如下:

1)输入数据:将3月的16指数点值数据输入到C1列的第1到第16个单元格,将6

月的12个指数点值数据输入到C1列的第17到28个单元格中:

2)输入数据的类别:在C2列中与C1列的数据相对应的第1到第16个单元格都输入

“1”,在C2列中与C1列的数据相对应的的第17到28个单元格对输入“2”;结果如下图。

3)选择Stat下拉菜单中选择Nonparametrics选项;

4)在Nonparametrics的下拉菜单中选Mood’s Median Test择子选项;

5)在对话框的Response方框内键入C1,Factor方框内键入C2.

单击OK即可。

主要运行结果及分析:

图 1 Mood 中位数检验的输出结果

从上图的输出结果可知,整体的中位数为5.5,此时在四格表中5.511 N 的个数是11,检验的p 值为0.063.

所以认为桂林市一年来楼盘价格没有变化。

二、(25分) 某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:

牌1: 38.5 32.3 31.6 31.5 牌2: 35.3 31.6 34.3 37.2 牌3: 39.0 39.9 44.4 45.9 牌4: 35.8 43.5 42.7 41.2 牌5: 40.3 31.9 36.5 35.8

这些数据是否说明这5种牌子的汽油每加仑平均行驶的里程数全相等?

解:

用统计软件Minitab 进行Kruskal-Wallis 秩和检验的步骤如下:

a.输入数据(如将来自牌1、牌2和牌3,牌4,牌5的数据输入到C1列的第1到第4个单元格、第5到第8个单元格和第9到第12个单元格,第13到第16单元格,第17到第20单元格);

b.输入数据的类别(如与C1列的数据相对应,在C2列的第1个到第4个单元格都输入“1”,第5到第8个单元格输入“2”,第9到第12个单元格输入“3”,第13到第16个单元格输入“4”,第,17到第20个单元格输入“5”);

c.选择Stat下拉菜单;

d.选择Nonparametrics选项中的Kruskal-Wallis子选项;

e.在Kruskal-Wallis对话框的Response方框中选择C1,Factor方框中选择C2,

如下图。

图1 Kruskal-Wallis对话框

输出结果如下:

Kruskal-Wallis 检验结果显示,检验统计量46

H,对应的P值为,0.022,由

=

.

11

样本数据知,合样本中有1

g个结,为长度为2的结有1个,检验统计量修正为

=

48

=

H,其对应的P值为0.022,大于0.05即不能拒绝原假设,认为这5种牌子的汽11

.

油每加仑平均行驶的里程数不全相等。

三、(25分) 有五架测量纺织纤维弹性的测量仪器,为检验这些测量仪器之间有没有差异,找了九位质量检验员,要求每一位检验员使用每一架测量仪器对同一批原料进行测量,试验数据如下。试判断这四架测量仪器是否有差异?

表1:测量数据

、解:

用统计软件Minitab可以进行Friedman检验:

运行结果为

Friedman 检验结果显示,检验统计量S=8.18,对应的P值为0.085,由样本数据知,第2、4、8、9个区组中分别含有一个结,结的长度都为2,检验统计量修正为S=8.41,其对应的P值为0.078,大于0.05即接受原假设,即认为这四架测量仪器没有差异。

四、(25分) 确定葡萄酒质量时,一般是通过聘请一批有资质的评酒师进行品评。每个评酒师在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。

表2:评酒师打红葡萄酒总分数据

酒样品

1 10 10 9 10 9

2 9 10 8 10 8

3 10 9 9 9 8

4 9 9 9 8 7

5 9 9 8 7 7

6 9 9 9 9 9

7 9 9 9 9 9

8 9 9 10 8 9

9 10 10 9 8 9 试分析评酒师的打分结果是否一致?

结果

Friedman 检验结果显示,检验统计量S=15.82 2.进行一致性检验

所以一致性检验问题的检验统计量为15.82Q =。由于样本容量比较大,在Friedman 检验临界值表中,不能查到相应的临界值,Friedman 检验统计量Q 渐进服从)1(2

-k χ.本例的

K=9,所以Q 渐进服从)8(2

χ分布,从而算得检验的P 值为,001.0)82.315)8((2

=≥χP P 值

非常小,所以我们认为分析评酒师的打分结果是一致。

Minitab软件过程能力概述与分析

过程能力概述 一旦过程处于统计操纵状态,同时是连续生产,那么你可能想明白那个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度能够确定过程能力。在评估过程能力之前,过程必须受控。假如过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够关心你评估数据的分布和检验过程是否受控。你也能够可能包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数差不多上评估过程能力的一种方法,因为它们都没有单位,因此,能够用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你能够依照数据的性质和分布从中选择命令,你能够对以下情况进行能力分析:——正态或Weibull概率模式(关于测量数据) ——不同子组之间可能有专门强变差的正态数据

——二项式或Poisson概率模式(关于计数数据或属性数据)当进行能力分析时,选择正确的公式是差不多要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,然而,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)能够可能预期零件的缺陷PPM数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依靠于假设分布模型的正确性。 假如数据是歪斜特不严峻,那么用正态分布分析将得出与实际的缺陷率相差专门大的结果。在这种情况下,把那个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你能够使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法.

非参数统计题目及答案

1.人们在研究肺病患者的生理性质时发现,患者的肺活量与他早在儿童时期是否接受过某种治疗有关,观察3组病人,第一组早在儿童时期接受过肺部辐射,第二组接受过胸外科手术,第三组没有治疗过,现观察到其肺活量占其正常值的百分比如下: 这一经验是否可靠。 解: H 0:θ2≤θ1≤θ 3 H 1 :至少有一个不等式成立 可得到 N=15 由统计量H= ) 112 +N N (∑=K i i N R 1i 2 -3(N+1)=)(1151512+(32×6.4+29×5.8+59×11.8)-3×(15+1)=5.46 查表(5,5,5)在P(H ≥4.56)=0.100 P(H ≥5.66)=0.0509 即P (H ≥5.46)﹥0.05 故取α=0.05, P ﹥α ,故接受零假设即这一检验可靠。

2.关于生产计算机公司在一年中的生产力的改进(度量为从0到100)与它们在过去三年中在智力投资(度量为:低,中等,高)之间的关系的研究结果列在下表中: 值等等及你的结果。(利用Jonkheere-Terpstra 检验) 解: H 0:M 低=M 中=M 高 H 1:M 低﹤M 中﹤M 高 U 12=0+9+2+8+10+9+10+2+10+10+8+0.5+3=82.5 U 13=10×8=80 U 23=12+9+12+12+12+11+12+11=89 J= ∑≤j ij U i =82.5+80+89=251.5 大样本近似 Z= []72 )32()324 1 2 1i 22 2∑ ∑==+-+--k i i i k i n n N N n N J ()(~N (0,1) 求得 Z=3.956 Ф(3.956)=0.9451 取α=0.05 , P >α, 故接受原假设,认为智力投资对改进生产力有帮助。

统计学原理

统计学原理 自评报告 所在院系:经济与管理学院管理学系基层组织:工商管理专业建设组

统计学原理自评报告 一、课程介绍 (一)课程主要内容与教学目的 统计学原理是研究客观事物数量方面的方法论科学,其方法广泛适用于自然,社会,经济,科学技术等各个领域,因此统计学原理是经济管理类专业的主干课程。该课程系统阐述现代统计科学的基础理论和方法。内容包括:统计调查的组织技术,统计整理的方法原则,社会经济统计指标的理论与应用,概率论基础,参数估计和假设检验,非参数统计方法,相关与回归分析,时间序列分析,统计指数和统计决策等。 通过本课程的学习,首先,使学生对统计学的学科体系有一个全面的认识,为学生进一步学习其它专业知识奠定学科基础,并使之具有较完备,合理的知识结构和实践能力。其次,使学生能明确理解统计这个认识工具的特点,作用;弄懂各种概念,范畴等基本知识;掌握运用各种基本方法。再次,培养学生理论联系实际的能力,在今后的实际工作和生活中,能将统计学的知识贯穿其中。最后,还要教会学生理论分析,使他们能够分析社会经济现象的具体事例并能以报告的形式给出分析结果和合理化建议。 (二)课程建设过程与现状 《统计学原理》课程在工商管理、经济学专业开设已10多年,现在已扩展到国际经济与贸易、市场营销、信息系统与信息管理等专业。10多年来,课程专任教师致力于加强优秀课程建设,从教学大纲、教学计划、教案、教学手段、教学辅导、教学实践、教学研究与改革等多方面,进行了积极有效的改革探索。特别是在本科生教育教学中,按照其规律和特点,以就业为导向、以应用能力为标准,加大课程改革力度,完善课程体系建设,强化方法和手段的应用。课程建设取得了阶段性成果。 1、教学内容

非参数统计分析NonparametricTests菜单详解

非参数统计分析――Nonparametric Tests菜单详解 非参数统计分析――Nonparametric Tests菜单详解 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符

合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法 1、Two Independent Samples Test与 K Independent Samples Test 用于检验两独立样本/多独立样本所在总体是否相同。 Two-lndependent-Samples Test对话框: (1) Test Variable框,指定检验变量。 (2) Grouping Variable框,指定分组变量。Define Groups对话框,Groupl和Groupl后的栏中,可指定分组变量的值。 (3) TestType框,确定用来进行检验的方法。Mann-Whitney U:默认值,相当于两样本秩和检验。Kolmogorov-Smimov Z:K-S检验的一种。Moses extreme reactions:如果施加的处理使得某些个体出现 正向效应,而另一些个体出现负向效应,就应当采用该检验方法。

Minitab非参数统计分析试卷及答案

桂林电子科技大学试卷2012—2013学年第 2 学期课号 课程名称非参数统计分析(机试)适用班级(或年级、专业)统计学 考试时间95 分钟班级学号姓名 一、(25分) 桂林市12年3月和13年6月出售的部分精品楼盘均价(单位:千元/平方米)数据分别如下所示: 12年3月:7.0,4.3,8.0,4.2,8.5,4.2,8.2,4.2,4.15,4.6, 3.5,3.8, 4.5,8.7,4.3, 5.5 13年6月:4.2,4.6,6.5,9.0,7.0,6.8,6.2,7.0,8.9,5.5,7.2 4.6 试问:桂林市一年来楼盘价格是否有变化? 解: 用统计软件Minitab进行Mood中位数检验的步骤如下: 1)输入数据:将3月的16指数点值数据输入到C1列的第1到第16个单元格,将6 月的12个指数点值数据输入到C1列的第17到28个单元格中: 2)输入数据的类别:在C2列中与C1列的数据相对应的第1到第16个单元格都输入 “1”,在C2列中与C1列的数据相对应的的第17到28个单元格对输入“2”;结果如下图。

3)选择Stat下拉菜单中选择Nonparametrics选项; 4)在Nonparametrics的下拉菜单中选Mood’s Median Test择子选项; 5)在对话框的Response方框内键入C1,Factor方框内键入C2. 单击OK即可。 主要运行结果及分析:

图 1 Mood 中位数检验的输出结果 从上图的输出结果可知,整体的中位数为5.5,此时在四格表中5.511 N 的个数是11,检验的p 值为0.063. 所以认为桂林市一年来楼盘价格没有变化。 二、(25分) 某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下: 牌1: 38.5 32.3 31.6 31.5 牌2: 35.3 31.6 34.3 37.2 牌3: 39.0 39.9 44.4 45.9 牌4: 35.8 43.5 42.7 41.2 牌5: 40.3 31.9 36.5 35.8 这些数据是否说明这5种牌子的汽油每加仑平均行驶的里程数全相等? 解: 用统计软件Minitab 进行Kruskal-Wallis 秩和检验的步骤如下:

学年第一学期期末试卷检查工作总结

教学督导组2010-2011学年第一学期 期末试卷检查情况通报 根据教务处《关于做好2010-2011学年第一学期期末考试试卷检查工作的通知》的要求,教学督导组于4月1日至4月15日对全校21个院(系、部)上学期期末考试试卷进行了检查。本次检查按各院(系、部)试卷装订数量10%的比例进行抽查,最低基数为3本,全校共抽查试卷123本。各院系抽查试卷检查情况如下:2010-2011学年第一学期各院(系、部)期末试卷抽查情况一览表

(说明:①A、B、C、D、F五个等级所对应的分数为5、4、3、2、1,总分为各等级的平均分。②公共课试卷命题错误、答案错误,责任在院(系、部),从总分中扣0.1分。) 从抽查结果看,全校总平均分为3.8分,比上学期的3.61分高出0.19分,各等级所占抽查总数比重与上学期相比情况见下表: 2009-2010学年第二学期与2010-2011学年第一学期 试卷抽查结果各等级比重对比表

从上表中可以看出,本学期与上学期相比,A级比重虽稍有下降,但B级比重增长较大,同时,C级、D级和F级的比重均有所减少,总体趋势表明试卷工作整体质量有所提高。 虽然试卷工作整体质量有所提高,但问题仍然较多,为了便于各院(系、部)教学管理人员和全体教师,对试卷命题、批改、成绩录入、考试与试卷相关材料的填写、整理装订等环节中存在的问题有比较全面的了解,我们将本次试卷检查中存在的问题,分类整理如下: 一、封面 1.封面填写的课程名称与试卷印制的课程名称不一致,如:中文系的2本试卷,封面上都是《现代汉语》,但试卷印制的课程名称,一门是《现代汉语(上)》,一门是《现代汉语(下)》,这是2门不同课程的试卷;《大学英语》有(一)、(二)、(三)、 (四)四级,因此,必须在课程名称中标明是几级大学英语。 2.课程代码填写不正确,如政治学系《社会主义市场经济理论与实践》试卷,封面填写的课程代码为“(2010-2011-1)ZJ61010-97074-1”,正确的课程代码是“ZJ61010”。 3.属于集体阅卷,应当在封面上填写“集体阅卷”,或填写每一位阅卷老师的姓名,并在第一张试卷卷首的登分栏中签写全名,以后各试卷上只要签姓即可。化学化工学院《聚合物流变学》试卷中,出现两个阅卷人,但在封面上只填写了一位阅卷教师的姓名,里面的试卷上只签了“杜”,有姓无名。

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

2018年度医学统计学试卷及其规范标准答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

实用卫生统计学复习题与答案2

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图 二、单项选择题 1.观察单位为研究中的( )。 A.样本B.全部对象C.影响因素D.个体2.总体是由()。

A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指()。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差 C.极差D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数B.几何均数 C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中位数 C.几何均数D.平均数 10.两样本均数的比较,可用()。 A.方差分析B.t检验 C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中,ν配伍等于()。 A.ν总-ν误差B.ν总-ν处理

重点医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数

C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数

如何用MINITAB进行过程能力分析

过程能力概述 一旦过程处于统计控制状态,并且是连续生产,那么你可能想知道这个过程是否有能力满足规范的限制,生产出好的零件(产品),通过比较过程变差的宽度和规范界限的宽度可以确定过程能力。在评估过程能力之前,过程必须受控。如果过程不受控,你将得到不正确的过程能力值。 .你能通过画能力柱状图和能力图来评估过程能力。这些图形能够帮助你评估数据的分布和检验过程是否受控。你也可以估计包括规范公差与正常过程变差之间比率的能力指数。能力指数或统计指数都是评估过程能力的一种方法,因为它们都没有单位,所以,可以用能力统计表来比较不同过程的能力。 选择能力命令 MINITAB提供了一组不同的能力分析命令,你可以根据数据的性质和分布从中选择命令,你可以对以下情况进行能力分析: ——正态或Weibull概率模式(对于测量数据) ——不同子组之间可能有很强变差的正态数据 ——二项式或Poisson概率模式(对于计数数据或属性数据) 当进行能力分析时,选择正确的公式是基本要求,例如,MINITAB提供基于正态或Weibull分布模型上的能力分析工具,使用正态概率模型的命令提供了更完全的统计设置,但是,适用的数据必须近似于正态分布. 例如,利用正态概率模型,能力分析(正态)可以估计预期零件的缺陷PPM 数。这些统计分析建立在两个假设的基础上,1、数据来自于一个稳定的过程,2、数据服从近似的正态分布,类似地,能力分析(Weibull)计算零件的缺陷的PPM值利用的是Weibull分布。在这两个例子中,统计分析正确性依赖于假设分布模型的正确性。 如果数据是歪斜非常严重,那么用正态分布分析将得出与实际的缺陷率相差很大的结果。在这种情况下,把这个数据转化比正态分布更适当的模型,或为数据选择不同的概率模式.用MINITAB,你可以使用Box-Cox能力转化或Weibull概率模型,非正态数据比较了这两种方法. 如果怀疑过程中子组之间有很强的变差来源,可以使用能力分析(组间/组内)或SIXpack能力分析(组间/组内)。除组内数据具有随机误差外,组间还可能有随机变差。明白了子组变差的来源,可以为你提供过程更真实的潜在能力评估。能力分析(组间/组内)或SIXpack能力分析(组间/组内)既计算组内标准偏差也计算组间标准偏差,然后,集中它们来计算总的标准偏差。

非参数统计A

湖北科技学院数学与统计学院 2013年秋季学期 2011级统计本科 《非参数统计》期末考查试卷(A 卷、开卷) 一.某批发商从厂家购置一批灯泡,根据合同的规定,灯泡的使用寿命平均不低于1000h, 已知灯泡的使用寿命服从正态分布,标准差是20h. 从总体中随机抽取了100只灯泡,得知样本均值为996h. 问题是:批发商是否应该购买该批灯泡? (1) 零假设和备择假设应该如何设置?为什么? (2) 在零假设1000<μ下,给出检验的过程并做出决策。(15分) 二.下表中的数据是两个篮球联赛中三分球的进球次数,该数据的目的是考察两个联赛中三分球的得分次数是否存在显著性差异。 (1)符号检验; (2)配对Wilcoxon 符号秩检验; (3)该问题中哪个检验更好?( 25分) 三分球的进球次数 队伍序号 联赛1 联赛2 1 91 81 2 46 51 3 108 63 4 99 51 5 110 46 6 105 45 7 191 66 8 57 64 9 34 90 10 81 28 三.在一项研究毒品对增强人体攻击性影响的实验中,组A 使用毒品,组B 使用安慰剂。 试验后进行攻击性测试,测量得分如下表(得分越高表示攻击性越强)。 组A 组B 10 12 8 15 12 20 16 18 5 13 9 14 7 9 11 16 6 (1) 给出这个实验的零假设;

(2)对数据进行统计分析。(20分) 四.下表是美国三大汽车公司(A, B, C三种处理)的五种不同的车型某年产品的油耗,试分析不同公司的油耗是否存在差异。(20分) 1 2 3 4 5 A 20.3 21.2 18.2 18.6 18.5 B 25.6 24.7 19.3 19.3 20.7 C 24.0 23.1 20.6 19.8 21.4 五.美国某年总统选举前,由社会调查总部抽查黑白种族与支持不同政党是否有关,数据如下表 种族民主党共和党无党 白人黑人341 103 405 11 105 15 问:不同种族与所支持的政党之间是否存在独立性?(20分)

王静龙《非参数统计分析》课后计算题参考答案

王静龙《非参数统计分析》课后习题计算题参考答案习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1) =0.026625957 S n H me H me P S + ==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

统计学试卷及答案3

一、简答题(10小题,每题6分,共60分) 1.反映集中趋势的统计指标主要有哪几个?简述它们各自的适用范围。 均数:用于单峰对称分布,特别是正态分布或近似正态分布的资料;几何均数:用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料;中位数:用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。 2.已知某地调查200名正常成年女性的空腹血糖值,均数为 4.95mmol/L,标准差为1.03mmol/L,故该研究者得出该地正常成年女性的空腹血糖值的95%可信区间为(4.95±1.96×1.03) mmol/L,请问该结论是否正确,并说明理由。 不正确,应用标准误对可信区间进行估计 3.“某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,因此认为A药的疗效高于B药。”该说法正确吗?请说明理由。 不正确,这次实验造成的A药疗效高于B药的结果可能是由于实验误差造成的,所以应该进行假设检验。由样本得到的结果应该进行假设检验,以明确差异是由实验误差造成还是由于总体本质上存在差异。 4.若两样本均数比较的t检验结果为拒绝H0,则 值越小,说明两总体均数差别越大。这种说法对吗?为什么? 不正确。P值越小,越能拒绝H0,接受H1,说明根据样本数据越有理由认为量总体均数存在差别。假设检验只做出是否拒绝H0的定性结论,不能说明差别的大小。 5.有肺功能检查及支气管激发实验,各组间肺功能及支气管激发实验阳性率的比较结果如表1,三组间比较均有统计学意义。 表1 各组间肺功能及支气管激发实验阳性率的比较

非参数统计分析方法总结

非参数统计分析方法 一单样本问题 1,二项式检验:检验样本参数是否与整体参数有什么关系。 样本量为n给定一个实数MO(代表题目给出的分位点数),和分位 点口(0.25,0.5,0.75)。用S-记做样本中比M0小的数的个数,S+记做样本中比M0大的数的个数。如果原假设H0成立那么S-与n的比之应为n。 H0:M=M0 HI: M k MO或者M>M(或者M

H1 :不是随机的(混合倾向,游程多,长度短)(成群倾向,游程少,长度长) Spss步骤:分析一非参数检验一游程 得出统计量R 和p 值 当p值小于0.05时拒绝原假设,没有充足理由证明该数据出现是随机的二,两个样本位置问题 1,Brown —Mood 中位数检验 给出两个样本比较两个样本的中位数或者四分位数等是否相等或者有一定关系,设一个中值为M1,—个为M2 H0:M1=M2. HI: M1H M2或者M1>M或者M1

医学统计2002年研究生试卷(汕头大学医学院)

汕头大学医学院2002年硕士研究生 医学统计学试题(闭卷部分) 专业:….……学号:………..姓名:……………成绩:…………. 1.均数、M及G三者的关系,那种适用于显著偏态资料? S与标准误 的异同点? (5分)。 2.两个大样本均数比较时,可以采用那些检验方法? 两个小样本均数比较时,t-test的适用条件? 多个样本均数比较时,应该采用那些分析方法? (5分)。 3.实验拟用乙法代替甲法测定水中溶解氧含量。为此,同时用两种方法测定13个水样得到两组数据(略)(已知资料呈正态分布、方差齐)。现要了解: (1)两组数据各自的平均水平及变异程度? (2)两种测定结果是否有差别? (3)两种结果间是否有联系? 请你将所用的统计指标及方法用网络图表示出来。(5分)。 4.某医师研究纤维食物摄入量与某种疾病的关系, 随机调查所获数据如表1。请详述统计分析设想(不做具体计算)?(5分)。

表1 某疾病的发生与纤维食物摄取量研究数据 --------------------------------------------------------------------------------------- 摄入量(g/d)1- 5- 10- 20- 30- 50- 合计--------------------------------------------------------------------------------------- 病例人数35 59 60 70 80 60 364 对照人数 5 14 43 79 94 65 300 ---------------------------------------------------------------------------------------- 5. 简述正交试验、析因试验、完全随机设计、随机区组设计与协方差分析的特点?(5分)。 6. 某医生提出:单指标百分位数法可用于任何医学资料的参考值范围的确定。请问你同意吗?同意或不同意均须详尽地阐述理由?(5分)。 7. 某医师研究甲、乙两药治疗某病疗效(甲组观察18例,乙组观察22例),其结论为:“甲、乙药治愈率均是有效的,且乙药可以代替甲药用于临床实践。”请评价,若需进一步研究可提出建议?还请阐明应使用的假设检验方法,以及各种统计方法的检验假设。 (5分)。 8. 分析流行病学常用方法有那些,请简述其优缺点以及适用情况。(5分)。

统计学试卷2008a

中国科学院武汉教育基地 2007—2008学年第一学期期末考试试卷 课程名称:生物统计学 考试时间:2008年1月21日下午2:30-5:00 一、选择题(每题选择一个最佳答案。每小题1分,共17分) 1、为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地 2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是()。 A、该地所有20-29的健康女性 B、该地所有20-29的健康女性的血红蛋白测量值 C、抽取的这2000名20-29岁女性 D、抽取的这2000名20-29岁女性的血红蛋白测量值 2、下列说法正确的是()。 A.系统误差可以完全消除B.随机误差可以完全消除 C.两种误差都可以完全消除D.两种误差都不可以完全消除 3、算术均数与中位数相比,()。 A、抽样误差更大 B、不易受极端值的影响 C、更充分利用数据信息 D、更适用于分布不明及偏态分布资料 4、在一个右偏(峰在左边,右边有较长的尾巴)的分布中,反映集中趋势的数值 最大的是()。 A.中位数B.算数平均数C.众数D.几何平均数 5、对于标准正态分布变量,()范围内有90%变量值。 A、0~1.96 B、-1.96~1.96 C、-1.645~∞ D、-1.645~1.645 6、在抽样方式和样本容量不变的条件下,置信区间愈大,则()。 A.可靠性愈大B.可靠性愈小 C.估计的效率愈高D.估计的效率愈低 7、利用t分布构造置信区间的条件是()。 A.总体服从正态分布,且方差已知 B.总体服从正态分布,且方差未知 C.总体不一定服从正态分布,但要求是大样本 D.总体不一定服从正态分布,但要求方差已知 8、比较两药的疗效时,哪种情况应做单侧检验()。

王静龙非参数统计分析课后计算题参考答案Word版

王静龙《非参数统计分析》课后习题计算题参考答案 习题一 1.One Sample t-test for a Mean Sample Statistics for x N Mean Std. Dev. Std. Error ------------------------------------------------- 26 1.38 8.20 1.61 Hypothesis Test Null hypothesis: Mean of x = 0 Alternative: Mean of x ^= 0 t Statistic Df Prob > t --------------------------------- 0.861 25 0.3976 95 % Confidence Interval for the Mean Lower Limit: -1.93 Upper Limit: 4.70 则接受原假设认为一样 习题二 1.描述性统计

习题三 1.1 {}+01=1339 :6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957 S n H me H me P S +==<≤ 另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数 * **0*0+1inf :2BINOM.INV(39,0.5,0.05)=14 1sup :113 2S 1313 n m i n d i n m m i n d d m i d αα==?????? ??=≥?? ? ????????? ?????? ??≤=-=?? ? ????????? =≤=∑∑= 以上两种都拒绝原假设,即中位数低于6500 1.2

运用Minitab进行过程能力(Process+Capability)_1

过程能力概述(Process Capability Overview) 在过程处于统计控制状态之后,即生产比较稳定时,你很可能希望知道过程能力,也即满足规格界限和生产良品的能力。你可以将过程变差的宽度与规格界限的差距进行对比来片段过程能力。在评价其能力之前,过程应该处于控制状态,否则,你得出的过程能力的估计是不正确的。 你可以画能力条形图和能力点图来评价过程能力,这些图形可以帮助你评价数据的分布并验证过程是否受控。你还可以计算过程指数,即规范公差与自然过程变差的比值。过程指数是评价过程能力的一个简单方法。因为它们无单位,你可以用能力统计量来比较不同的过程。 一、选择能力命令(Choosing a capability command) Minitab提供了许多不同的能力分析命令,你可以根据数据的属性及其分布来选择适当的命令。你可以为以下几个方面进行能力分析: ?正态或Weibull概率模型(适合于测量数据) ?很可能来源于具有明显组间变差的总体的正态数据 ?二项分布或泊松概率分布模型(适合于属性数据或计数数据) 注:如果你的数据倾斜严重,你可以利用Box-Cox转换或使用Weibull 概率模型。 在进行能力分析时,选择正确的分布是必要的。例如:Minitab提供基于正态和Weibull概率模型的能力分析。使用正态概率模型的命令提供更完整的一系列的统计量,但是你的数据必须近似服从正态分布以保证统计量适合于这些数据。举例来说,Analysis (Normal) 利用正态概率模型来估计期望的PPM。这些统计量的结实依赖于两个假设:数据来自于稳定的过程,且近似服从的正态分布。类似地,Capability Analysis (Weibull) 利用Weibull 分布模型计算PPM。在两种情况下,统计的有效性依赖于假设的分布的有效性。 如果数据倾斜严重,基于正态分布的概率会提供对实际的超出规格的概率做比较差的统计。这种情况下,转化数据使其更近似于正态分布,或为数据选择不同的概率模型。在Minitab中,你可以用“Box-Cox power transformation”或Weibull 概率模型。Non-normal data对这两个模型进行了比较。 如果你怀疑过程具有较明显的组间变差,使用Capability Analysis (Between/Within)或Capability Sixpack (Between/Within)。子组内部的随机误差之上,子组数据可能还有子组之间的随机变差。对子组变差的两个来源的理解可以为过程潜在能力提供更实际的估计。Capability Analysis (Between/Within)和Capability Sixpack (Between/Within) 计算了组间和组内标准差,然后再估计长期的标准差。 Minitab还为属性数据和计数数据进行能力分析,基于二项分布和泊松概率模型。例如:产品可以根据标准判定为合格和不合格(使用Capability Analysis (Binomial)).。你还可以根据缺陷的数量进行分类(使用Capability Analysis

天津医科大学统计学试题

1.总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本(sample):从总体中随机抽取部分观察单位,其测量结果的集合称为样本。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异(variation):在自然状态下,个体间测量结果的差异称为变异。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料(measurement data):对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料(count data):将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 6.随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。10.统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

相关文档