文档视界 最新最全的文档下载
当前位置:文档视界 › 医学统计学

医学统计学

医学统计学
医学统计学

1、正态分布有什么基本特征?有哪几个参数?如何判断一组数据是否服从正态分布?

基本特征:①正态分布只有一个高峰,高峰位置在X=μ;

②正态分布以均数为中心,左右对称的钟型曲线,中间高,两头低

③正态分布的2个参数μ和σ决定了分布的位置和形状

④正态分布的标准化变换

参数:均数、标准差(μ是随机变量X的总体均数,σ为标准差)

①X轴与正态曲线所夹面积恒等于1或100%

②区间μ±σ的面积为68.27%

③区间μ±1.96σ的面积为95.00%

④区间μ±2.58σ的面积为99.00%

判断:频数分布图,前人经验,偏度系数和峰度系数的检验。

2、如何把正态分布数据转换成标准正态分布数据?

对任何服从正态分布N(μ,σ2)的随机变量X作线性变换都变换成均数为0,方差为1的正态分布,称为标准正态分布,简记为μ~N(0,1)

3、什么叫标准正态分布?正态分布、标准正态分布和t分布有什么联系和区别?

均数为0,方差为1的正态分布都称为标准正态分布,简记为μ~N(0,1)

联系:都是对称的连续型分布;正态分布可以通过线性转换转化成标准正态分布;t分布在自由度较大时趋向标准正态分布。

区别:曲线图形不同;功能不同(正态分布和标准正态分布可用于u检验、参考值范围制定,质量控制等,而t分布主要用于t检验或总体均数的可信区间。)

4、什么是正常值范围?制定正常范围的基本步骤是什么?正态分布法与百分位数法制定正常值范围各有什么特点?

正常值范围:又称参考值范围,指绝大多数正常人的某指标范围

基本步骤:①抽取足够例数的正常人样本

②对选定的正常人进行准确而统一的测定

③决定取单侧范围值还是双侧范围值

④选定适当的百分范围

⑤估计界值

特点:①正态分布法:应用本法的条件是资料服从正态分布,样本均数和标准差趋于稳定,样本含量不少于50例为宜,亦可用于经变量变换后服从正态分布的资料,如对数正态分布

②百分位数法:应用本法的条件是样本含量较多,分布趋于稳定,样本含量不少于150例,适用于偏态分布资料

4、总体均数的可信区间中的可信度和区间的宽度各说明什么?

总体均数的可信区间中的可信度说明可信区间的准确度,可信区间的宽度则说明了精密度。

可信度越高,准确度越高;区间越短,精密度越高。

5、两样本均数比较时为什么要作统计检验?

样本均数之间的差异是客观存在的,这种表面的差异不能直接判断总体均数间一定有差别,为了判断总体间均数是否有差别,我们必须对现有的样本均数作统计上的假设检验。

我们班级全体男女同学的平均血压作比较,要不要作统计检验?

班级全体男女同学的平均血压已经是两个总体均数(这两个总体不是太大所以全面调查可行),总体均数已经知道的话,比较就不用分别抽样作假设检验了。

6、两样本均数的差别作统计检验,P>0.05,你对此结果如何解释?若P<0.05,又有哪些具体解释?

P>0.05,P>α(α=0.05),不拒绝H0(检验假设),总体均数相同

P<0.05,P<α(α=0.05),拒接H0,接受H1(备择假设),总体均数不全相同

7、两样本均数差别的t检验中,什么情况下作单侧检验?什么情况下作双侧检验?

单侧检验时(专业角度能排除另外一侧可能性) H1:μ>μ0或μ<μ0

双侧检验时 H1:μ≠μ0

8、对样本均数与总体均数或对两样本均数的差别作统计检验,怎样使用可信区间做判断?

对样本均数与总体均数μ0比较(单样本t检验)对未知的总体均数μ求出可信区间,这个可信区间若包含μ0,者可以认为μ=μ0;未知的总体均数μ求出的可信区间若不包含μ0,则认为μ≠μ0。

两样本均数比较的统计检验分成配对样本和独立样本

配对样本的话,可以求出配对数据的一组差值d,然后求出这组差值的总体均数μd的可以信区间,这个可信区间若包含0,则认为总体均数相等;反之,不等。

两独立样本的话,可以通过两个样本分别求出两总体均数的可信区间,如果两个可信区间有交叉重叠部分,则可认为两总体均数相等,反之,不等。

9、t检验要求什么条件?

①正态性:即样本来自正态总体,特别是n较小时

②方差齐性:即样本代表的总体方差相等,特别是对于两样本均数比较的t检验(一般情况下,满足方差齐性,会认为同时满足正态性的要求)

③样本例数较小(n<50)

10、t检验基本步骤是什么?

①建立检验假设

②确定检验水准和单、双侧

③选定检验方法和计算统计量

④确定P值

⑤推断结论

11、实验设计的要素与原则?

要素:处理因素、受试对象、实验效应

原则:①对照原则:设立对照组,除给予处理因素不同外,其他非处理因素尽量均衡一致

②随机化原则:指总体中每个个体都有相等的机会被研究者抽取为样本

③重复原则:要求有一定的样本含量

12、线性回归和线性相关分析的目的是什么?

线性回归的目的是要建立回归方程,了解自变量X与应变量Y之间的数量关系,以便于通过X去推算或预测Y.

线性相关是通过相关系数刻画两个变量之间的相互紧密程度和变化方向。

13、线性回归和线性相关分析对数据有什么要求?

线性回归(又叫直线回归):要求自变量可精确测量和严格控制误差。

线性相关(直线相关):要求两个变量服从双变量正态分布。

14、建立回归方程用的是什么原则?

最小二乘法:各散点距离回归直线纵向距离平方和为最小而得到直线

15、为什么要对样本回归系数及样本相关系数作统计检验?

样本统计量都存在抽样误差,样本回归系数及样本相关系数都是用数学公式计算的,但是如果他们的对应总体参数本身为0的话,那么总体就没有线性相关或没有线性回归关系,所以必须对他们的总体参数作假设检验。如果假设检验结果总体系数不为0, 样本回归系数及样本相关系数就有统计学意义,可以证明他们的回归或相关关系;如果总体系数为0,那么样本回归系数及样本相关系数就没有统计学意义。

16、同一批样品用两种方法测定结果的相关系数是0.95,能否说两方法测定结果相同?

不能,相关系数本身还需要假设检验,另外就算两个变量高度相关,也不能说明测量结果一致。测定一致的两种结果一定高度相关,但是高度相关的两个结果未必相同。

17、行×列表资料作χ2检验的目的是什么?

推断两个或多个总体率或构成比是否相同

18、四格表的χ2检验对数据有什么要求?哪些情况下要用四格表确切概率法检验?

⑴要求:

①T>5,而且N>40:直接用X2检验

②1 £ T<5,而且N>40:校正X2检验

③T<1或N < 40:不能用X2检验,可用四格表概率法

⑵四格表确切概率法:当T< 1 或N < 40时

20、表达中心位置(集中趋势)的指标有几个,各适用于什么情况,有什么优缺点?

①均数(μ):又称算术均数,反映一组观察值在数量上的平均水平

应用:单峰对称分布的资料,特别是正态分布或者近似正态分布

优点:直观,容易理解,计算简单

缺点:对等比级数资料、近似倍数关系的资料等集中趋势的代表性较差

②几何均数(G):变量对数值的算术均数的反对值

应用:等比级数资料、近似倍数关系的资料或者对数正态分布资料

优点:回避了极大极小值的影响

缺点:对呈明显偏态的资料,分布的一端或者两端无确定数值的资料(开口资料),分布不清的资料不能很好地反映平均水平

③中位数(M):将一组观察值从小到大顺序排列,居于中间位置的数值

应用:呈明显偏态的资料;分布的一端或者两端无确定数值的资料(开口资料);分布不清的资料

优点:对极值不敏感

缺点:并非考虑了每个观察值

④百分位数(PX):一种位置指标(其余同中位数)

⑤众数:是一群数据中出现次数(频数)最多的值

应用:适用于大样本

优点:无

缺点:较粗糙,对于进一步的统计学计算与分析不具备应用价值

21、表示离散度的指标有哪几个,各适用于什么情况,有什么优缺点?

①极差(R):又称全距、极距,是一组定量资料中最大值与最小值之差

应用:疾病潜伏期等

优点:应用简便

缺点:只能反映最大值和最小值;样本含量越大,极差可能越大;抽样误差较大

②四分位数间距:一组定量资料中,某两个百分位数之差(P75-P25)

应用:偏态分布

优点:比极差的稳定性好

缺点:未考虑全部观察值的变异程度

③方差与标准差:反映一组数据的平均离散水平

应用:对称分布、正态分布

优点:反映了全部观察值的离散情况;反映了均数的代表性

缺点:无

④变异系数(标准差与均数之比)

应用:常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度

优点:可用于不同单位资料间的比较

缺点:无

23、在作假设检验中,P值含义是什么?α的意义是什么?怎么利用P与α下统计结论。

⑴P值:在无效假设成立的条件下,获得现有统计量以及更不利于H0的数值的概率

⑵α:检验水准,由检验统计量的分布曲线与横轴中处于拒绝域的这些值上面的那部分面积

⑶下结论:

①P>0.05,P>α(α=0.05),不拒绝H0(检验假设),多个比较相同

②P<0.05,P<α(α=0.05),拒绝H0接受H1(备择假设),多个比较不全相同

24、常用的相对数指标有哪些?使用时要注意哪些问题?

⑴相对数:指两个有联系的指标之比,常用指标有

①率:又称频率指标,它说明某现象发生的频率或强度

②构成比:说明一事物内部各组成部分所占的比重或分布

③比(相对比):是两个有关指标之比

⑵使用相对数时的注意事项:

①计算相对数的分母不宜过小

②分析时不能以构成比代率

③不能直接相加求其平均率

④资料的对比应注意可比性

25、可信区间的含义是什么?可信区间的准确度和精密度指的是什么?医学正常值范围与可信区间有何区别?

①可信度1-α(准确度)愈接近1愈好,如99%的可信度比95%的可信度要好

②区间的宽度(精密度),区间愈窄愈好。

当样本含量为定值时,上述两者互相矛盾,在可信度确定的情况下,增加样本含量可减小区间宽度。

②对相关分析的作用要正确理解

③绘制散点图

④结果的解释 5)不能外推

1、医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。

2、变量:是指观察个体的某个指标或特征,表现了观察单位的变异性,统计上习惯用大写拉丁字母表示。

3、数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。

4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。

5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。

6、同质:是指事物的性质、影响条件或背景相同或相近。

7、变异:是指同质的个体之间的差异。

8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。

9、样本:是从总体中随机抽取的一部分观察单位所组成的集合。

10、随机变量:是指取值不能事先确定的观察结果。

11、统计量:是样本的统计指标,采用拉丁字母表示,是参数附近波动的随机变量。

12、参数:是总体的统计指标,采用小写的希腊字母,为固定的常数。

13、随机抽样:为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。

14、抽样误差:是由于个体差异导致在抽样研究中产生的样本统计量与相应的总体参数之间的差异以及统计量间的差异。

15、确定性现象:在一定条件下,一定会发生或一定不会发生的现象。

16、随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。

17、频率:样本的实际发生率称为~,0≦f≦1。

18、概率:随机事件发生的可能性大小,0≦P≦1。

19、小概率事件:概率小于等于0.05或0.01的事件称为小概率事件,习惯上以0.05为标准,统计学上认为小概率事件在一次实验中是不大可能发生的。

20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。

21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。

22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。

23、标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。

24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。

25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。

26、构成比:是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布。

27、率:是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,用以说明某种现象发生的频率大小或强度。

28、率的标准化/标化率:即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率/标化率/调整率。

29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。便于阅读、比较、计算

30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。

31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。

32、参考值范围:是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。

33、标准误:是指样本统计量的标准差,反映来自同一总体的样本统计量的离散程度以及样本统计量与总体参数的差异程度,即抽样误差的大小。

34、均数标准误:是指样本均数的标准差,反映来自同一总体的样本均数的离散程度以及样本均数与总体均数的差异程度,即抽样误差的大小。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数。

35、区间估计:以一定概率估计总体参数在哪个范围内的估计方法。

36、95%可信区间:是指从理论而言,在100次随机抽样所得的100个可信区间中,平均有95个可信区间包括总体均数。

37、P值:是指在H0成立的前提下,获得现有检验统计量值以及比该统计量值更极端情况下的概率。

38、第一类错误α:检验假设H0实际上成立的,但拒绝了H0,误判为有差别,也就是犯了假阳性错误,称为~。其发生的概率用 a 表示。在假设检验中作为检验水准。一般取0.05或0.01。按实验要求,重点要控制第一类错误,应采用Duncan 法。

39、第二类错误β:假设检验H0实际上不成立,但却不拒绝H0,误判为无差别,也就是犯了假阴性错误,称~。其发生的概率用 b 表示。由于其取值取决于H1,因此在假设检验中无法确定。按实验要求,重点要求控制第二类错误,应采用LSD-t法。

40、检验效能/把握度:统计学上将1-β称为~,即当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。

41、相关分析:研究变量间相互关系的密切程度、变化趋势,并用适当的统计指标显示出来的分析方法。

42、回归分析:将变量间数量上的依存关系用函数形式表示出来,用一个或多个变量来推测另一个变量的估计值及波动范围的分析方法。

43、相关系数:用以说明在两个变量之间存在线性相关关系以及相关关系的密切程度与方向的统计指标。

44、回归系数:即直线的斜率,在直线回归方程中用b 表示,b 的统计意义为X 每增(减)一个单位时,Y平均改变b 个单位。

45、决定系数:相关系数r的平方称为~,表示Y的变异中可由X解释的部分占总变异的比例。

46、参数检验:假设样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。这类方法称为参数统计,所用的检验称为

47、非参数检验:不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法称为非参数统计,所用的检验方法称为~。其目的是检验所比较的分布或分布位置是否相同。

医学统计学课件:2统计描述

1、这150名正常成年男子红细胞数的平均水 平是多少,变异度有多大? 2、这150名正常成年男子红细胞数与当地成 年男子红细胞数总体相比是否有差别? 一、频数分布表 表4-3 某地150名正常成年男子红细胞数(10 3.98 5.39 4.54 4.74 5.13 4.43 4.81 4.98 3.79 5.49 4.66 5.26 4.90 4.90 4.17 4.28 4.63 4.94 4.33 4.84 4.75 4.01 4.49 4.57 5.16 5.69 4.84 5.03 5.32 4.54 4.68 4.60 4.39 4.80 4.97 4.80 4.85 5.21 4.45 4.62 5.05 4.13 5.07 4.40 5.08 4.73 5.10 4.73 4.42 4.81 4.98 3.89 5.46 4.53 4.74 4.10 4.90 4.91 4.27 4.29 4.66 5.23 5.31 4.86 4.67 4.43 4.57 5.00 5.16 5.69 4.83 5.04 4.46 4.61 5.00 4.36 4.75 4.96 5.04 5.37 4.95 4.70 4.83 4.42 4.13 4.78 4.86 4.78 5.23 4.78 5.20 4.80 4.55 4.82 4.98 3.94 4.54 4.74 5.10 4.43 4.58 4.99 4.31 4.64 4.66 5.26 5.28 4.83 4.15 4.35 4.93 5.17 5.61 4.87 5.04 3.98 4.48 4.57 4.77 4.11 4.95 5.00 5.36 5.06 4.68 4.63 4.40 5.30 4.97 5.29 4.85 5.88 4.49 4.62 4.53 4.10 4.53 4.70 4.80 5.23 5.67 4.67 4.67 5.40 5.29 4.77 5.38 5.15 4.64 5.19

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

医学统计学分析计算题_与解析

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社) 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

2医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t 检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可 用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。 下面是本人简单总结的常用方法的选择,可供读者参考。如有引用本图者,请注明引自《医学案例统计分析与SAS应用》一书,谢谢。

医学统计学完整

对于均数为,标准差为的正态分布,95%的变量值分布范围为 A. - ~ + B. -1.96 ~ +1.96 C. -2.58 ~ +2.58 D. 0 ~ +1.96

10.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A.总体中的个体值存在差别B.样本中的个体值存在差别 C.总体均数不等于0 D.样本均数不等于0 11从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布。 A. 仍为偏态分布 B. 近似对称分布 C. 近似正态分布 D. 近似对数正态分布 12某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大约为 A.2.0kg B.2.3kg C.3.1kg D.6.0kg 13.单因素方差分析中,造成各组均数不等的原因是 A.个体差异B.测量误差C.各处理组可能存在的差异D.以上都有 14.医学中确定参考值范围是应注意 A.正态分布资料不能用均数标准差法B.正态分布资料不能用百分位数法 C.偏态分布资料不能用均数标准差法D.偏态分布资料不能用百分位数法 15.方差分析中,当P<0.05时,则 A.可认为各总体均数都不相等B.可认为各样本均数都不相等 C.可认为各总体均数不等或不全相等D.以上都不对 16.两样本中的每个数据减同一常数后,再作其t检验,则 A.t值不变B.t值变小C.t值变大D.无法判断t值变大还是变小 17.在抽样研究中,当样本例数逐渐增多时 A.标准误逐渐加大B.标准误逐渐减小C.标准差逐渐加大D.标准差逐渐减小18.计算样本资料的标准差这个指标 A.不会比均数大B.不会比均数小C.决定于均数D.不决定于均数 19.各观察值均加(或减)同一个不等于0的数后 A.均数不变,标准差改变 B. 均数改变,标准差不变 C.两者均不变 D. 两者均改变 20.描述一组偏态分布资料的变异度,以下哪个指标为好 A.全距B.四分位数间距C.标准差D.变异系数 21.正态曲线的横轴上从均数到+1.96的面积为 A.95% B.45% C.47.5%D.97.5% 22.设同一组7岁男童的身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准 差是3kg,则比较两者变异程度的结论为 A.身高的变异程度小于体重的变异程度B.身高的变异程度等于体重的变异程度

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学

第一单元概述 1.研究设计应包括那几方面内容? 答:包括:专业设计和统计设计。 专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何? 答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。 描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系? 答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。 3.频数表的用途有哪些? 答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别? 答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件? 答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理? 答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系? 答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能

医学统计学案例分析

医学统计学案例分析 案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞de疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检2验,得连续性校正χP,0.05,差异无统计学意义,故认为中西药治=3.134,疗急性心肌梗塞de疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 2(3) 患者总例数n=27,40,该医师用χ检验是不正确de。当n,40或T,1时, 2不宜计算χ值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结检验(有效=1,无效=0)进行进行果t,2.848,P,0.005,差异有统计学意义 假设检验,结果t,2.848,P,0.005,差异有统计学意义,故认为中西药治疗胃炎de疗效有差别,中药疗效高于西药。 【问题1-1】 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料,即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布de计量资料,不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别,应用四格表资料de 检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率de比较 药物有效无效合计有效率(,) 中药 (11.2) (16.8) 28 50.0 1414 西药 2 (4.8) 10 (7.2) 12 16.7 合计 16 24 40 40.0 某医师认为这是完全随机设计de2组二分类资料,可用四格表de检验。其步骤如下: 1(建立检验假设,确定检验水准

医学统计学案例分析

医学统计学案例分析评述 医学期刊论着:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的 【统计方法】 (1)本论着未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选 用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。

(2)文献尽管在“统计学处理”中提及了“使用软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确采用了那种统计方法,即是卡方检验还是秩和检验等。 (3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算值和相对应的P值,只有P<,表述不完整。 正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要依据,三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。 (4)统计符号书写不规范: 检验水准表述有误,原文“检验水平取P=”,应改为“检验水准ɑ=”。 【结果表达】 (1)在“不同时间段接种人数比较”中: ①原文:研究将研究对象按照2010 年1 月-2011 年4 月,2011 年5月-2012 年 5 月分为两个时间段进行研究,第一个时间段接种人数为460 6 人,第 二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显 减少,且具有显着差异性(P<)。 ②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少,且具有 显着差异性”。2个时间段研究对象数量不同,通过统计分析不能得出 “人数明显较少”的结论,应表述为:按ɑ=水准,差别有统计学意 义,可以认为2个时间段接种人数不同。 (2)在“结果和”的结论中: ①错误:均未明确具体的统计值及相对应的P值,“具有显着性差异”应改为“差 别有统计学意义”。 (3)统计表表示不正确: ①统计表为三线表,在有“合计”一项时,应加一条分隔线。

相关文档