文档视界 最新最全的文档下载
当前位置:文档视界 › 【孙振球第三版】医学统计学复习题

【孙振球第三版】医学统计学复习题

【孙振球第三版】医学统计学复习题
【孙振球第三版】医学统计学复习题

一、名词解释:

1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。

14、率:强度相对数,说明某现象发生的频率或强度。

15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。

16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。

17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。

18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。

20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。

21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。

22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。

23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。

26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。

27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。

28、样本含量:样本中包含观察单位数称为该样本的样本含量。

29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。

30、变量值:对变量的观测值称为变量值或观察值。

31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。

33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。

34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

35、概率:概率是描述随机事件发生可能性大小的一个度量。

36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。

37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。

38、偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2)负偏态分布:集中位置偏向数值大的一侧。

39抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则。

二、填空题

1、医学统计工作的基本步骤:设计、搜集资料、整理资料、分析资料。

2、医学统计资料的主要来源的四个方面:统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。

3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。

4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。

5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。

6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。

7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数μ的理论概率大小,可信度愈接近1愈好。(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。

8、变量变换的方法有:对数变换、平方跟变换、倒数变换、平方根反正弦变换。

9、常用的相对数:率、构成比、相对比。

10、动态数列常用指标有:绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。

11、二项式分布的参数是n和π。n,n次独立重复实验数目;π,每次实验的“阳性”概率。

12、二项式分布在n很大,而π很小,且nπ=λ为常数时,二项式分布近似Poisson分布。

13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。

14、Poisson分布具备可加性。

15、当λ(总体率)增大时,Poisson分布渐近正态分布。16、四格表中四格子基本数值为两对实测的实际频数和理论频数。

17、R*C表的卡方检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用Χ2检验,如检验各处理组各等级下的程度上有无差别时采用非参数检验。

18、配对比较秩和检验,以正秩或负秩的和(T)为检验统计量,其中T越小则P的值小于相应的检验水平。

19、正态分布的两个参数μ和σ2,前者决定分布的位置,后者决定分布的形态(形状、变异度)。

20、四格表Χ2的校正条件为n≥40而且1<T<5。

21、R*C表资料Χ2检验,如果有T<1,应该采取的措施有:(1)增加样本含量,使理论频数增大;(2)根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。(3)改用双向无序R*C表资料的Fisher确切概率法。

22、Poisson分布中,总体的方差与均数的关系是λ=σ2,当均数较大时,Poisson分布趋近于正态分布。

23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的Χ2检验。

24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。

25、变异系数的应用条件是均数相差较大、观察指标单位不同。

26、Χ2表示理论频数与实际频数的符合程度。

27、常用相对数的指标有强度相对数字(率)、结构相对数(构成比)、相对比(比)。

28、常用的描述构成比的统计图有圆图和百分比条图。

29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。

30、实验设计的基本原则随即机原则、对照原则、重复原则。

31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。

32、写出四种变量变换的方法:倒数变换、平方根变换、平方反正弦变换、对数变换。

33、在F检验中如有各比较组方差不齐时应用变量变换、近似t 检验、Wilcoxon秩和检验的方法。

34、四格表资料Χ2适用条件:(1)n≥40且T≥5时用Χ2检验的基本公式,当P≈α时,改用四格资料表的Fisher的确切概率法;(2)n≥40且1<T<5时用,用四格资料表Χ2检验的校正公式,或改用四格资料表的Fisher的确切概率法;(3)n<40,或T<1时,改用四格资料表的Fisher的确切概率法。

35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。

36、率的标准化的计算方法有直接标准化方法和间接标准化方法。

37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无

关联性;(4)多个样本间的多重比较;(5)频数分布拟合优度的Χ2检验。

38、拟合优度检验常用判定实际分布是否符合正态分布、二项分布、Poisson分布和负二项分布。

39、实验设计的三个基本要素为:实验单位、处理因素、实验效应。

40、变异系数常用于观察单位指标不同和均数相差较大的多组资料变异度的比较。

41、所有检验统计量是在H0的条件下计算出来的。

42、标准化的目的是为了消除构成比不同对合计率的影响,使比较组间具有可比性。

43、统计推断包括:参数估计(区间估计、点值估计)、假设检验。

44、医学参考值的制定方法包括:正态分布法、百分位数法。

45、Poisson分布的性质:(1)可加性、(2)总体均数λ与总体方差α2相等、(3)当n很大而π很小且nπ=λ时二项分布近似Poisson分布、(4)当λ增大时,Poisson分布渐近正态分布。

46、集中趋势的描述指标:算术均数、集几何均数、中位数和百分位数。

47、离散趋势的描述指标;极差、四分位数间距、方差与标准差、变异系数。

第二章计量资料的统计描述

1、集中趋势、离散趋势的统计描述指标以及区别。

答:一、集中趋势的描述指标:统计学用平均数这一指标来描述一组变量值的集中位置或平均水平。(1)算术均数:简称均数字,可用于反映一组呈对称分布的位置在数量上的平均水平。(2)几何均数:可用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平,在医学研究中常适用于免疫学的指标。(3)中位数:是将n个变量值从小到大排列,位置居中间的那个数。<分为奇偶两种情况。(4)百分位数:是一种位置指标,用P X来表示。

二、描述数据变异大小的常用指标有极差、四分位数间距、方差、标准差和变异系数。(1)级差:级差即是一组变量最大的值与最小值之差。(2)四分位数间距:四分位数间距是把全部变量值分为四部分的分位数,即第1四分位数、第2四分位数、第3四分。四分位数间距,是由第三四分位数,和第1四分位数向减而得。(3)方差:也叫均方差,反映一组数据的平均离散水平。(4)标准差:是方差的正平方根,其量纲与原变量值相同(5)变异系数:记为CV,多用于观察指标单位不同时,或均数相差较大时的比较。它实质上是一个相对变异指标,无单位。

三、两者的区别。A、集中趋势的描述:(1)算数均数:适用于对称分布资料;(2)几何均数:适合于作对数变换后对称分布资料;(3)中位数和百分位数:①适用于任何分布的资料;②中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;③中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。B、离散趋势的描述:(1)极差不稳定,不灵敏。(2)标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。(3)变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。

2、中位数和标准差的作用。

答:(1)标准差:是方差的正平方根,其量纲与原变量值相同。标准差是统计分析中最常用的变异指标,适用于近似正态分布的资料,大样本、小样本均可用。四份位数间距适用于偏态分布资料,四分位半间距相当于偏态分布资料的“标准差”。(2)中位数:是将n个变量值从小到大排列,位置居中间的那个数。分为奇偶两种情况。中位数适用于任何分布资料,有不确定值的资料。常用于描述偏态分布资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和算术平均数在理论上是相同的。适用于当一组变量值呈偏态分布,或资料的分布情况不清楚,或变量值一端(或两端)无确定数值(开口型资料),均可用中位数表示其集中趋势。

3、正态分布、标准正态分布及对数正态分布的联系和区别。

答:(1)正态分布:原始值不需转换;属于对称分布类型;用μ表示集中趋势的指标;均数与中位数的关系是μ=M(中位数)。(2)标准正态分布:作u转换;属于对称分布类型;集中趋势μ=0;均数与中位数的关系是μ=M。(3)对数正态分布:作对数转换;属于正偏太分布;集中趋势用G(几何均数表示);均数与中位数的关系是μ>M。

第三章总体均数的估计与检验假设

1、举例说明标准差与标准误的区别与联系。

答:标准差是描述个体值变异程度的指标,为方差算术平方根,该变变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。具体举例略。

2、u分布和t分布有何不同。

答:t分布为抽样分布;u分布为标准正态分布,为理论分布。t 分布比标准正态分布的峰值低,且尾部翘得更高。随自由度的增大,t分布逐渐趋近标准正态分布。

3、均数的可心信区间与参考值范围有何不同。

答:(1)均数的可信区间按预先给定的概率所确定的未知参数的可能范围。用于估计总体的均数。(2)参考值范围是“正常人”的解剖、生理、生化某项指标的波动范围。用于判断观察对象的某项指标正常于否。

4、t检验的应用条件。

答:(1)单样本的t检验要求资料服从正态分布。(2)配对t检验要求差值服从正态分布。(3)两样本的t检验要求两组数据服均从正态分布,切两样本的方差相等,尤其对小样本。5、假设检验的结论不能绝对化。答:通过假设检验作出的检验推断具有概率性,有可能发生两类错误。拒绝H O时犯I型错误,接受H O时间犯II型错误。6、假设检验和区间估计的区别。答:假设检验用于推断质的不同的两个总体或多个总体参数是否不等。可信区间估计是用于说明量的大小,推断总体参数的范围。可信区间可以回答假设检验的问题。在判断两个或多个总体参数是否不相等时,假设检验与区间估计是完全等价的。

第四章多个样本均数比较的方差分析

1、方差分析的基本思想和应用条件。

答:基本思想:是根据实验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过比较不同变异的来源的均方,借助F分布作出统计推断从而推论各种研究因素对实验结果的影响。

应用条件:①各样本是相互独立的随机样本,均服从正态分布。

②相互比较的各样本的总体方差相等。具有方差齐性。

2、随机区组设计与完全随机设计在设计和变异分解上有何不同。答:随机区组设计:随机分配的次数越多,每次随机分配都对同一区组内的受试对象进行,且歌处理组受试对象数量相同,区组内均衡。四种变异处理组间变异、区组间变异、误差变异、总变异。完全随机设计:采用完全随机化分组方法,将全部试验对象分配到g个处理组(水平组),各组接受不同的处理。三种变异组间变异、组内变异、总变异。

第五章计数资料的统计描述

1、举例说明为什么不能以构成比代替率。

答:(1)率=某时期内发生某现象的观察单位数字/同时期可能发生某现象的观察单位总数。用来说明某现象发生的频率或强度。(2)构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数。用来说明各构成部分在总体中所占的比重或分布。举例略。

2、应用标准化率进行比较时的注意问题。

答:(1)只适用于两组内部构成不同,并有可能影响两组分组的情况。(2)比较几个标准化率时采用统一标准口。(3)标准化后的标准化率,已不再反映当时当地的实际水平,它只表示相互比较的资料的相对水平。(4)两样本标准化率是样本值,存在抽样误差。3、相对数的动态指标及作用。答:即动态数列的分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(1)绝对增长量:某相对数在一定时期的增长的绝对值;(2)发展速度与增长速度:某相对数在一定时期的速度变化;(3)平均发展速度:各环节比发展速度的几何均数。说明某相对数在一个较长时期中平均发展变化的程度。

第六章几种离散型变量的分布及其应用

1、二项分布的应用。

答:(1)每次试验之发生两种互斥可能结果,互斥结果的概率和等于1;(2)每次产生某种结果的概率固定不变;(3)重复试验是独立的。

2、Poisson分布的性质。

答:(1)总体均数λ与总体方差σ2相等;(2)当n很大时候,而π很小时候,πn=λ为常数,Poisson分布是二项分布的极限分布;(3)当λ增大,Poisson分布渐近正态分布。当λ≥20时,做正态分布资料处理。(4)具可加性质。

3、二项分布、Poisson分布和正态分布的联系。

答:(1)当n很大时,而π很小的时,且πn=λ为常数,Poisson 分布是二项分布的极限分布;(2)当n较大,而π不接近0也不接近1时候,二项分布近似正态分布。(3)当λ增大时,Poisson 分布渐进正态分布,一般λ≥20时,做正态分布资料处理。

第七章Χ2检验

1、Χ2检验的用途。

答(1)用于推断个总体率或构成比之间有无差别;(2)推断多个总体或构成比之间有无差别;(3)多个样本率比较的Χ2分割;(4)两个分类变量间有无关联性;(5)频数分布的拟合优度检验。2、两样本率的u检验和Χ2检验有何区别。

答:两样本率进行比较时,若对同一样本资料同时进行u检验和Χ2检验,在不教正的情况下,Χ2=u2;u检验通常用于大样本,Χ2检验用于小样本。3、R*C列联表资料的Χ2检验应注意的事项。答:(1)R*C列联表中的理论频数不能小于1,或1<T<5的格子数不宜超过格子总数的1/5;(2)多个样本率比较,若所的到的统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说任两个总体率有差别,需进一步做多个样本率的比较,做多个样本率的多重比较。(3)对有序的R*C列联表资料不宜用Χ2检验。

4、R*C列联表资料的分类及其检验方法的选择。

答:(1)分类:双向无序、单向无序、双向有序属性相同、双向有序属性不同。(2)检验方法的选择:①双向无序R*C列联表资料。研究多个样本率或构成比的比较,用行*列表的Χ2检验;研究两分类变量间有无关联性以及关系密切程度,可用行*列表的Χ2检验以及Pearson列联表系数进行分析。②单向无序R*C列联表资料。若R*C表中的分组变量是有序的,而指标变量是无序的,用行*列表的Χ2检验分析其构成情况。若R*C表的分组变量是无序的,指标变量是有序的,用秩转换的非参数检验分析。③双向有序属性相同R*C列联表资料。用一致性检验分析两种检测两方法的一致性。④双向有序属性不同R*C列联表资料。若研究目的

为分析两有序分类变量间是否存在相关关系,用宜等级相关分析或Pearson积矩相关分析;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验;若研究目的为分析不同年龄组患者疗效间有无差别时,可视其为单向有序R*C列联表资料,选用秩转换的非参数检验分析。

第八章秩转换的非参数检验

1、非参数检验,与参数检验的区别。

答:非参数检验对总体分布不作严格的假定,不受总体分布的限制,又称任意分布检验。它直接对总体分布(或分布位置)作假设检验。总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

2、秩转换的非参数检验,适用情况。

答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。其特点是假设检验的结果对总体的分布形状差别不敏感,只对总体的分布位置差别敏感。适用于:①不满足正态或(和)方差齐性的小样本资料;②分布不知是否正态的小样本资料;③一端或两端是不确切数值的资料;

④等级资料。

3、两组或多组等级资料的比较,为何不用Χ2检验而用秩转换的非参数检验。

答:Χ2检验只能推断两个或多个总体的等级构成比的差别。选用秩转换的非参数检验,可推断两个或多个总体的等级强度差别。

第九章双变量回归与相关

1、何为“最小二乘”原则。

答:在直线回归方程中,将实际测量值与假定回归线上估计值的纵向距离称之为残差,通常情况下取各点残差的平方和的最小直线为所求得的回归直线。即所谓的“最小二乘原则”。

2直线回归分析中的注意问题(即直线回归的应用条件)。

答:(1)两变量的选择一定要有专业背景,直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以能精确测量和严格控制的非随机变量。(2)分析前应绘制散点图,检查数据是否满基本假设。(3)对结果应有正确的解释。

3、直线回一归与直线相关的区别与联系。

答:联系:(1)对于既可以做回归分析又可做相关的同一组数据,计算出的b与r的正负号一致;(2)相关系数与回归系数的假设检验等价。对同一样本t b=t r。(3)同一组数据的相关系数和回归系数可以相互换算。(4)用回归解释相关:由于决定系数r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。

区别:(1)资料上:相关要求X、Y服从双变量正态分布,这种资料进行回归称II型回归;回归要求Y在给定某个X值服从正态分布,X是可以精确测量和严格控制的变量,称I型回归。(2)应用上:双变量间相互关系用用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。

(3)意义上:说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致的Y的平均变化量(4)单位:r没单位,b有单位。

(5)取值范围不同

(6)计算公式不同

第十章统计图和统计表

1、统计表的制表原则与要求。

答:原则:(1)重点突出,一张表只表达一个中心内容;(2)统计表描述要完整,有起描述的对象(主语)和内容(宾语),通常主语放在表的左边作横标目,宾语放在右边作纵标目。(3)统计表应简单明了,文字数字、线条尽量从简。要求:(1)标题:概括表的主要内容,包括研究时间、地点、内容等放在在表的正上方。(2)标目:分别用横标目和纵标目说明表的每行和每列数字的意义。注单位。(3)线条:至少要用三线条,表格的顶线和底线将表格与文章的其它部分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。(4)数字:………..

医学统计学复习题65915

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩 ____________ 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有 意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均 数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。()

11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。() 12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学复习题

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学模拟试题

医学统计学模拟试题(A) 一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题1 分) 1. 卫生统计工作的基本步骤包括_____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯I型错误的概率越小 C. 检验效能1- 定得越小, 犯II型错误的概率越小 D. P 值越小, 越有理由拒绝H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对

医学统计学复习习题2018

医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 =0 B. P=1 C. P= D. 0

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

(完整word版)医学统计学上机考试复习题及答案

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

【孙振球第三版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

医学统计学模拟试卷与答案

医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,

自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t rχ20.05,ν可认为() A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数 4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为() A.pearson卡方检验 B.校正卡方检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;

医学统计学模拟试卷及答案

(注:红色字体表示已经改正,多余表示删除的内容) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A) A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义?(15分) 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白65 75 50 76 65 72 68 治疗后血红蛋白82 112 125 85 80 105 128 2、活动型结核患者的平均心率一般为86次/分,标准差为6.5次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为7.8次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别? 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为75.78分,标准差为3分,乙组患者均数为89.45分,标准差为4分,问心理治疗有无效果?

4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录如下表,问左右肾重量有无不同? 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 1 170 150 11 155 150 2 155 145 12 110 125 3 140 105 13 140 150 4 11 5 100 14 145 140 5 235 222 15 120 90 6 125 115 16 130 120 7 130 120 17 105 100 8 145 105 18 95 100 9 105 125 19 100 90 10 145 135 20 105 125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 5.68 0.87 健康人46 4.91 0.86 6、为研究黄芪对细胞中RNA代谢的影响,在人肌皮肤二倍体细胞培养上进

医学统计学模拟试题B

医学统计学模拟试题(B) 一、单选题:在A,B,C,D,E 中选一个最佳答案, 将答案字母填在下划线里(每题1 分) 1. 在医学统计学中样本与总体的关系是__________。 A样本是总体中有代表性的一部分 B 样本是总体中最有特点的一部分 C 样本是总体中典型的一部分 D 样本是总体中有意义的一部分 E 样本是总体中精心挑选出来的一部分 2. 以下关于概率的定义中,__________是错误的。 A. 当概率小于0.05, 则为不可能事件 B. 当概率等于1, 则为必然事件 C. 当概率在0 至1 之间时, 为随机事件 D. 当重复实验次数足够大时, 事件发生频率接近概率 E. 当概率等于零, 则为非随机事件 3. 频数表不能__________。 A. 反映频数分布的特征 B. 方便进一步统计分析计算 C. 便于发现异常值 D. 精确估计算术均数的值 E. 用于分类资料 4. 在描述定量资料的集中趋势时, 以下论述中错误的是__________。 A. 均数适宜于对称分布资料 B. 几何均数和中位数都适宜于正偏倚分布 C. 同一正偏倚分布资料, 估计的均数值小于中位数值 D. 对称分布资料的均数值等于中位数值 E. 几何均数特别适宜于细菌学和免疫学检测指标的描述 5. 用大量来自同一总体的独立样本对总体参数作估计时,关于95%可信区间(CI),正确的说法是__________。 A. 大约有95%样本的95%CI覆盖了总体参数 B. 对于每一个95%CI而言,总体参数约有95%的可能落在其内 C. 各个样本的95%CI是相同的 D. 对于每一个95%CI而言,有95%的可能性覆盖总体参数 E. 以上说法都不对 6. 在假设检验中,关于P值与 值,下列说法不正确的是__________。 A. α值是决策者事先确定的一个可以忽略的、小的概率值 B. P值是在H0 成立的条件下,出现当前值以及更极端状况的概率 C. α值并不一定要取0.05, 根据实际需要甚至可以取到0.15 D. 在同一次假设检验中,作单侧检验时所得P值比作双侧检验时所得P值小 E. α值越小,所得结论越可靠 7. 当组数等于2 时,对于同一资料,方差分析与t 检验的关系是____ 。 A.完全等价且F=t B.方差分析结果更准确C.t 检验结果更准确 D.完全等价且t=FE.以上都不对 8. 下列关于方差分析的陈述中正确的是____。 A. 方差分析用于比较各组的总体方差是否相等

医学统计学复习题

中国医科大学网络教育学院 医学统计学复习题 一、最佳选择题 1. 下列资料何为定性资料? A 体重(kg) B 血型(A、B、O、AB) C 血红蛋白(g/L) D 坐高指数(%,坐高/身高) E 白细胞计数(个/L) 2. 下列资料属于等级资料的是_______ A 白细胞计数(个/L) B 血型(A、B、O、AB) C 体重(kg) D 病人的病情分级(轻、中、重) E 坐高指数(%,坐高/身高) 3.医学科学研究中的随机样本是指_______ A 总体中的一部分 B 研究对象的全体 C 总体中特殊的一部分 D 总体中有代表性的一部分 E 研究对象中一部分有特殊代表性的样本 4.统计工作的基本步骤是_______ A 设计、搜集资料、整理资料和分析资料 B 设计、统计分析、统计描述和统计推断 C 选择对象、计算统计指标、参数估计和假设检验 D 搜集资料、计算均数、标准差、标准误 E 搜集资料、整理资料和分析资料 5.统计学的小概率事件是指随机事件发生的概率_______ A 等于0.05 B 小于等于0.05 C 大于0.05 D 小于0.05 E 大于等于0.05 6.医学统计学的主要研究对象是_____。 A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件 7.编制组段数为10的频数表,在确定组距时______ A 常取最大值的1/10取整作为组距 B 常取最小值的1/10取整作为组距 C 常取极差的1/10取整作为组距 D 组距等于极差 E 常取极差的一半取整作为组距 8.频数分布的两个重要特征是______ A 集中趋势和分布类型 B 集中趋势和离散趋势 C 标准差和离均差

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

相关文档