文档视界 最新最全的文档下载
当前位置:文档视界 › 医学统计学复习要点

医学统计学复习要点

医学统计学复习要点
医学统计学复习要点

第一章绪论

1、数据/资料的分类:

①、计量资料,又称定量资料或者数值变量;为观测每个观察单位某项治疗的大小而获得的资料。

②、计数资料,又称定性资料或者无序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后而得到的资料。

③、等级资料,又称半定量资料或者有序分类变量。为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

2、统计学常用基本概念:

①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究目的而确定的同质观察单位的全体。

③、医学统计学(medical statistics):用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术,通过一定数量的观察、对比、分析,揭示那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进行测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发生率。

⑦、概率(probability):指的是随机事件发生的可能性大小。用大写的P表示。

3、统计工作的基本步骤:

①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;

②、收集资料:采取措施取得准确可靠的原始数据;

③、整理资料:将原始数据净化、系统化和条理化;

④、分析资料:包括统计描述和统计推断两个方面。

第二章计量资料的统计描述

1. 频数表的编制方法,频数分布的类型及频数表的用途

①、求极差(range):也称全距,即最大值和最小值之差,记作R;

②、确定组段数和组距,组段数通常取10-15组;

③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统一定为L≤X<U,最后一组包括下限。

④、分组划记并统计频数。频数分布的类型包括对称分布和偏态分布;

偏态分布主要分为右偏态分布(也称正偏态分布)和左偏态分布(也称负偏态分布)。频数表的用途包括以下几个方面:

①、描述频数分布的类型;

②、描述频数分布的特征;

③、便于发现一些特大或特小的离群值;

④、便于进一步做统计分析和处理。

2. 集中趋势指标的适用条件、计算方法和意义。

统计学用平均数(average)这一指标体系来描述一组变量值的几种位置或者平均水平。

常用的平均数有算术均数、几何均数和中位数。

①、算数均数,简称均数(mean),可用于反映一组呈对称分布的变量值在数量上的平均水平。计算方法包括直接计算法和频数表法(公式见2-2)。

②、几何均数(geometric mean),可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,在医学研究中常用于免疫学的指标。(计算公式见于2-3)

③、中位数(median),适用于各种分布类型的资料,尤其是偏态分布资料和一端或者两端无确切数值的资料。

④、百分位数(percentile)是一种位置指标,是一个界值,其重要用途是确定医学参考值范围(reference range)。

直接计算法(公式见于2-7、2-8)

频数表法(2-9、2-10)

3、离散趋势指标的适用条件、计算方法和意义。

描述数据变异大小的常用统计指标有极差、四分位数间距、方差、标准差和变异系数。

①、极差,一组变量值的最大值与最小值之差。

②、四分位数间距(quartile range,QR)是把全部变量值分为四部分的分位数后,由第3四分位数和第1四分位数相减而得。它一般和中位数一起描述偏态分布资料的分布特征。QR=P75-P25。

③、方差(variance)也称均方差(mean square deviation)离均差平方和与样本含

量的比值。计算公式为2-11

④、标准差(standard deviation)是方差的正平方根,其单位与原变量值得单位相同。计算公式为2-13、2-14

⑤、变异系数(coefficient of variation)记作CV,多用于观察指标单位不同时,或者均数相差较大时两者变异程度的比较。计算公式为2-16

4. 正态分布的图形,正态分布的特征,正态曲线下面积的分布规律。

正态分布的特征:

①、在直角坐标的横轴上方呈钟形曲线,两端与X轴永不相交,且以X=μ为对称轴,左右完全对称。

②、在X=μ处,f(X)取最大值,远离μ,其值越小。

③、正态分布有两个参数,位置参数μ和形态参数σ,μ决定正态分布的曲线在坐标轴上的左右移动,越大越右移;σ决定曲线的弓背程度,越小峰值越高。

④正态分布曲线下的面积分布有一定的规律。X轴与正态曲线所夹面积恒等于1或者100%;

区间μ±σ的面积为68.27%;

区间μ±1.96σ的面积为95.00%,

区间μ±2.58σ的面积为99.00%。

5. 医学参考值范围的意义和估计方法。

医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。

由于存在个体差异,生物医学数据并非常数,而是在一定范围内波动,故采用医学参考值范围(medical reference range)作为判定正常和异常的参考标准。通常使用的医学参考值范围有90%、95%、99%

①、正态分布法:数据服从或者近似服从正态分布,或者通过适当的变换转换为正态分布,采用此方法之前一般要对资料进行正态性检验且要求样本含量足够大(如n≥100)

计算公式为2-23、2-24:

双侧:单侧:

②、百分位数法:适用于偏态分布资料医学参考值范围的制定,所要求的样本含量比正态分布要多(不低于100)。

计算公式为2-25、2-26:

双侧:

单侧:

第三章总体均数的估计与假设检验

1、基本概念:

①抽样误差(sampling error):指的是由于个体变异产生、随机抽样造成的样本统计量与总体参数的差异。

②标准误(standard error,SE):指的是样本统计量的标准差。

③均数的标准误(standard error of mean,SEM):指的是样本均数的标准差。

※SEM反映样本均数之间的离散程度,也反映样本均数与相应总体均数间的差异。

均数的标准误的计算公式为3-1、3-2

④统计推断(statistical inference):通过抽样研究的方法从总体中随机抽取一个样本,用样本的信息来推断总体的特征的统计学方法,包括参数估计和假设检验。

2、标准差的用途:

①、反映资料的离散趋势。标准差越小,说明变异程度越小,均数的代表性越好;

②用于计算变异系数;

③用于计算标准误;

④结合均数和正态分布规律估计参考值范围。

3、u分布与t分布:

u分布(也称Z分布):指的是总体均数为0,总体标准差为1的标准正态分布N(0,12)。

t分布:随机变量X服从总体均数为μ,总体标准差为σ的正态分布N(μ,σ2),则可以通过u变换将一般的正态分布转化为标准正态分布。

※但是通常获得的资料为样本的均数标准误,因此经过转换后并不是完全意义上的标准正态分布,而是服从t分布。(计算公式为3-3)

t分布主要用于总体均数的区间估计和t检验。

4、可信区间:从固定样本含量的已知总体总进行重复随机抽样试验,根据每个样本可算得一个可信区间,则平均有1-α(如95%)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为1-α。

5、参考值范围和总体均数可信区间的区别

见课本表3-2

6、标准差与标准误的区别和联系:

7、总体均数可信区间的计算:

※根据总体标准差σ是否已知以及样本含量n的大小而异,通常有t分布和u分布两类方法。

A、单一总体均数的可信区间:

a、总体标准差σ已未知:按t分布

双侧和单侧公式见3-5、3-6、3-7

b、σ已知或者未知,但n足够大(如>60)时:按u分布

双侧和单侧公式见3、8、3-9、3-10 B、两总体均数之差的可信区间:

※前提:两总体方差相等,但均数不等

计算公式见于3-12、3-13、3-14

8、t分布图的特征:

①、单峰分布,以0为中心,左右对称;

②、t分布的曲线形态取决于自由度v的大小,自由度越小,则t值越分散,曲线的峰部越矮而尾部翘得越高;

③、当自由度逼近无穷的时候,样本标准误接近总体标准误,t分布逼近标准正态分布。(标准正态分布是t分布的特例)

9、t检验的适用条件

t检验(t test/Student t-test)当σ未知且样本含量较小时(如n<60),理论上要求t 检验的样本随机地取自正态分布的总体,两小样本均数比较式还要求两样本所对应的两总体方差相等,即方差齐性。在实际应用中,如与上述条件略有偏离,对结果影响也不大。

10、假设检验

A、假设检验的基本思想:利用小概率反证法的思想,从问题的对立面(H0)出发简介判断要解决的问题(H1)是否成立。即在假设H0成立的条件下计算检验统计量,然后根据获得的P值来判断。

B、假设检验的基本步骤:①建立检验假设,确定检验水准;

②计算检验统计量;

③确定P值,做出推断结论。

C、假设检验的错误

Ⅰ型错误:拒绝了实际上成立的H0,这类“弃真”的错误;(α)

Ⅱ型错误:“接受”了实际上不成立的H0,这类“取伪”的错误。(β)

注意:①α越小,β越大;反之α越大,β越小;

②若重点是减少Ⅰ型错误,一般取α=0.05;若重点是减少Ⅱ型错误,一般取β=0.10或者0.20甚至更高;

③若要同时减小Ⅰ型和Ⅱ型错误,唯一的方法就是增加样本含量n ;

④拒绝H0,只可能犯I型错误;接受H0,只可能犯Ⅱ型错误。

均数的标准误标准差

意义反映X的抽样误

差大小

反映一组数据的离散情

记法

()

X X

S

σ()

S

σ

计算

X

σ=

X

S=

σ=

S=

控制方法增加n不能通过统计方法来控

※多样本的多重比较LSD-t检验/最小显著差异t检验,适用于一对或者几对在专业上有特殊意义的样本均数间的比较,统计量为t值Dunnett-t检验适用于g-1个实验组与一个对照组均数差别的多重比较,统计量为Dunnett-t值

SNK-q检验适用于多个样本均数两两之间的全面比较,统计量为q值

※多样本的方差比较Bartlett检验,要求资料具有正态性,统计量为卡方;

Levene检验,比Bartlett检验要求低,不需要资料具有正态性,统计量为F值。

第四章多样本均数比较的方差分析

1、概念:

①离均差平方和(sum of squares of deviation from mean,SS)指的是各个观测值与总均数差值的平方。

②均方差,简称均方(mean square,MS)指的是离均差平方和与自由度之间的比值。

2、方差分析的基本思想:

设处理因素有g(g≥2)个不同的水平,实验对象随机分为g组,分别接受不同水平的干预。方差分析的目的就是在H0:μ1=μ2=……=μg 成立的条件下,通过分析各处理均数之间的差别大小,推断g 各总体均数间有无差别。

3、方差分析的应用条件为:各个样本是相互独立的随机样本,均来自于正态分布总体;相互比较的各个样本的总体方差相等,即具有方差齐性。

4、方差分析的变异分析:

总变异的大小——SS总:各个观测值与总均数差值的平方和;

组间变异的大小——SS组间:各组均数与总均数的离均差平方和;

组内变异的大小——SS组内:组内个观测值与其所在组的均数的差值的平方和。

并有SS总=SS组间+SS组内

由于组间与组内的离均差平方和的自由度不同,因此单纯的比较并无实际意义。MS组间=SS组间/v组间;MS组内=SS组内/v组内

完全随机设计资料:

正态分布且方差齐:单因素方差分析

成组t 检验(意义相同t2 =F)

非正态分布或/和方差不齐:变量转换→单因素方差分析

秩和检验

随机区组设计资料:

正态分布且方差齐:双向分类的方差分析

配对t 检验(意义相同t2 =F)

非正态分布或/和方差不齐:变量转换→双向分类的方差分析

Friedman M检验

初衷:考虑环境因素对实验结果的影响。

7、拉丁方设计资料的方差分析:

可多安排一个已知的对实验结果有影响的非处理因素,增加了均衡性,减少了误差,提高了效率。

完全随机设计只涉及一个处理因素;

随机区组设计涉及一个处理因素、一个区组因素;

如果实验研究涉及一个处理因素和两个控制因素,每个因素的类别数或水平数相等,此时可采用拉丁方设计。

该设计不仅平衡了处理顺序的影响,而且能把处理方法间的差别、时间先后之间的差别和实验对象之间的差别分开来分析。

9、多样本均数间的多重比较方法:LSD-t检验、Dunnett-t检验、SNK-q检验三种。

10、多样本方差比较:Bartlett检验、Levene检验

第五章计数资料的统计描述

1、基本概念:

①、相对数(Relative number):是两个有关联的数据之比,用以说明事物的相对关系,便于对比分析。

常用的相对数指标很多,按联系的性质和说明的问题不同,主要分为:率、构成、相对比三类。

②、强度相对数--频率(frequency):是最常见的一种相对数,频率在实践中又称为比率(proportion)。它表示事物内部某个组成部分所占的相对多少。

③、结构相对数—构成比(constituent ratio):说明某事物内部各组成部分所占的比重或分布,又称构成比。构成比可相加,和等于100%。

④、优势相对数----比(ratio):是指两个有关联的指标A和B之比,简称比。A 和B可以是性质相同,也可以是性质不相同。通常以倍数或百分数(%)表示。⑤、率的标准化法:指的是消除内部构成差别,使总体率能够直接进行比较的方法。采用统一标准调整后的率为标准化率,简称为标化率(standardized rate)。

标准化的基本思想:采用统一的“标准人口构成”,以消除人口构成不同对各组总率的影响,使算得的标准化率具有可比性。

⑥、动态数列(dynamic series):是按时间顺序排列的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。

分析动态数列常用的指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

⑦、发展速度:表示报告期指标的水平相当于基线期(或前一期)指标的百分之多少或若干倍。

⑧、增长速度:表示的是净增加速度,增长速度=发展速度–1(100%)。

2、率的标准化的注意事项:

①.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

②.两样本标准化率是样本值,存在抽样误差。当样本含量较小时,比较两样本的标准化率,需要作假设检验。(但如果比较的两者是总体的参数,则可进行直接比较,无需进行t 、F检验)

第六章几种离散型变量的分布及其应用

连续型分布举例:u 分布、t 分布和F分布;

常用离散型分布:二项分布、Poisson分布、负二项分布。

1、基本概念

①、二项分布(binomial distribution):是指在只会产生两种可能结果之一的n次独立重复试验中,当每次实验的“阳性”的概率π保持不变时,出现“阳性”次数X=0,1,2……n的一种概率分布。

②、Poisson分布(Poisson distribution):是二项分布的一种极端形式,指的是每次实验的“阳性”概率比较低的时候,出现阳性次数的相应概率满足以λ为参数的X~P(λ)。

2、二项分布的适用条件:①、每次试验只会发生两种队里的额可能结果之一,即分别发生两种结果的概率之和很等于1;

②、每次试验产生某种结果的概率固定不变;

③、重复试验是相互独立的,不相互影响。

3、二项分布的性质

①、样本率的标准差也称为率的标准误,可以用来描述样本率的抽样误差,率的标准误越小,则率的抽样误差就越小。

②、当π=0.5时,二项分布图形是对称的,当π≠0.5时,图形是偏态的,随着n 增大,图形趋于对称。当n→无穷时,只要π不太靠近0或1,二项分布则近似正态分布。

③、利用二项分布的性质,可进行总体率的区间估计和差异推断。(当n≤50时可查表得到可信区间,>50是可采用近似正态分布法)

4、Poisson分布的适用条件:

普通性:才充分小的观测单位上X的取值最多为1;

独立增量性:重复实验室相互独立的,不相互影响;

平稳性:每次试验阳性时间发生的概率都应相同。

5、Poisson分布的性质:

①、总体均数λ与总体方差σ2相等时Poisson分布的重要特征;

②、当n很大,而π很小时,且nπ=λ为常数时,二项分布近似Poisson分布;

③、当λ增大时,Poisson分布逐渐近似正态分布。一般而言,λ≥20时,Poisson 分布资料可作为正态分布处理。

④、Poisson分布具备可加性。

6、Poisson分布的图形特点:

当λ越小,分布就越偏态;当λ越大时,Poisson分布则越渐近正态分布。当λ≤1时,随X取值的变大,P(X)值反而会变小;当λ>1时,随X取值的变大,P (X)值先增大后变小。

第七章卡方检验χ2

1、χ2分布曲线的特点:χ2分布曲线的形状依赖于自由度的大小①当自由度≤2时,曲线呈L形;随着自由度的增加,曲线逐渐趋于对称;当自由度→无穷时,χ2分布趋近正态分布。

2、χ2分布的基本性质:可加性;

3、χ2检验的原理:通过实际频数和理论频数满足f(χ2),来推断实际频数与理论

频数的差异大小及有无统计学意义。

4、几种常见的资料类型:

①、普通四格表:自由度=(行数-1)(列数-1)

χ2可使用四格表专用公式;

×:n≥40且所有的T≥5 →使用基本公式;

P≈α时,改用Fisher确切概率法;

n≥40但有1≤T≤5 →四格表校正公式或者Fisher确切概率法

n<40或T<1 Fisher确切概率法

②配对四格表资料:b+c<40且1≤T≤5要校正;

5、Fisher确切概率法思想:

四格表资料周边合计数不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按照假设检验用单侧或双侧的累计概率依据所取得检验水准α做出推断。

6、行×列表资料使用范围:

多个样本率的比较;样本构成比的比较;双向无序分类资料的关联性检验;

7、多个样本率的多重比较:

多个实验组间的两两比较与实验组与同一对照组的比较均应对α进行校准,且方法相同。

8、拟合优度检验:

适用范围:推断某一现象的频数分布是否符合某一理论分布;比较实际频数与理论频数的差异大小。

第八章非参数检验

1、非参数检验的适用范围:

①不满足正态分布和方差齐性条件的计量资料;

②对于分布不知道是否正态的小样本资料;

③对于一端或两端是不确定值得资料;

④推断等级资料的等级强度差别。

2、主要数据资料类型:

①配对样本比较:(样本量>50时可以采用近似正态法作u检验)

H0:样本总体中位数=人群总体中位数;

H1:样本总体中位数≠人群总体中位数。

②两独立样本的比较:(n1>10或n2-n1>10时,令n1+n2=N,作近似正态分布检验)H0:两样本总体分布位置相同;

H1:两样本总体分布位置不同。

③完全随机多个样本:

H0:多个样本总体分布位置相同;

H1:多个样本总体分布位置不全相同。

注意:当完全随机的多个样本为两个样本时,使用完全随机多个样本的检验方法求得的统计值H(或H C)与使用两独立样本的u检验求得的u值等价。H=u2。

第九章:双变量回归与相关

1、直线回归(linear regression):因变量Y随着自变量X的变化而变化呈直线趋势,但并非所有的对应点恰好全都在一条直线上,称为直线回归或者简单回归。注:a 为常数项,是回归直线在Y轴上的截距;

b为回归系数(coefficient of regression),为直线的斜率;其统计意义是当X 变化一个单位时Y的平均改变的估计值。

直线回归方程的求法

基本原则:最小二乘(least sum of squares)

将实测值与假定回归线上的估计值的纵向距离称为残差(residual)或剩余值。为了使各点残差尽可能的小,考虑到所有点之残差有正有负,所以通常取各点残差平方和最小的直线即为所求,如此得到的回归系数最理想。

统计推断的检验:方差分析F检验或者t检验

两者等价:t=F2

b离0越远,Y受X的影响越大,SS回就越大,回归效果越好;

SS残越小,估计误差越小,回归作用越明显。

2、直线相关(linear correlation):两个数值变量进行比较时,一个变量在增加或者减少时,另一个变量也表现为增加或者减少,这两个变量之间的关系即为直线相关。

相关系数(correlation coefficient)又称为pearson积差相关系数,以符号r表示样本相关系数,符号ρ表示其总体相关系数。用来说明具有直线关系的两变量间相关的密切程度与相关方向。

相关系数的统计推断:t检验

决定系数(coefficient of determination):为回归平方和与总平方和之比。其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。

3、残差图考察数据是否符合模型假设的基本要求:

①、应变量与自变量关系为线性;

②、误差服从均数为0的正态分布;

③、方差相等;

④、各观测对象独立。

4、直线回归与直线相关的区别和共同点

区别:①相关系数无单位,回归系数有单位;

②相关表示相互关系,没有依存关系,回归有依存关系;

③两者对资料的要求不同:当X和Y都是随机的,可以进行相关和回归分析;当Y是随机变量,X是控制变量时,理论上只能做回归分析。

联系:①均表示线性关系;

②符号相同,共变方向一致;

③假设检验结果相同;(tr=tb)

④可以互相换算(数值的相同不代表意义的相同)

第十二章重复测量设计资料的方差分析

1、重复测量设计资料的数据特征:

①、未设立平行对照的前后测量设计:(重复测量资料最常见的情况是前后测量设计)

前后测量设计与配对设计t 检验的区别:

a、配对设计中同一对子的两个实验单位可以随机分配处理,两个实验单位同期观察实验结果,可以比较处理组间差别;前后测量设计不能同期观察实验结果,虽然可以在前后测量之间安排处理,但本质上比较的是前后差别,推论处理是否有效是有条件的,即假定测量时间对观察结果没有影响。

b、配对t检验要求同一对子的两个实验单位的观察结果分别是差值相互独立,差值服从正态分布。而前后测量设计前后两次观察结果通常与差值不独立,大多数情况第一次观察结果与差值存在负相关的关系。

c、配对设计用平均差值推论处理的作用,前后测量设计出了分析平均差值外,还可进行相关分析。

②、设立平行对照的前后测量设计:

虽然分为处理组和对照组,但是不能进行差值均数t检验,因为通常两组差值的方差不会相等。

③、重复测量设计:重复测量数据与随机区组设计数据相似,两者的差别是:

a、重复测量设计中处理是在区组间随机分配,区组内的各时间点是固定的,不能随机分配;随机区组设计则要求每个区组内实验单位彼此独立,处理只能在区组内随机分配,每个实验单位接受的处理是不相同的。

b、重复测量设计区组内实验单位彼此不独立,而随机区组内实验单位彼此独立,如果按照随机区组进行t检验则要求进行统计值的校正。

第十五章多元线性回归资料的分析

适用范围:分析一个应变量与多个自变量之间的线性关系;

1、多元线性回归模型的一般形式:Y=β0+β1X1+β2X2+……+βmXm+e

a、偏回归系数βj的意义:表示在其他自变量保持不变的时候,Xj增加或减少一个单位时Y的平均变化量。

b、偏回归分布的应用条件:

①、Y与各个变量之间有线性关系;

②、各例观测值Yi相互独立;

③、残差e服从均数为0,方差为δ2的正态分布。(等价于对任意一组自变量X1、X2……Xm值,应变量Y具有相同方差,并且服从正态分布)

c、参数的计算方法:最小二乘法

2、多元线性回归方程的假设检验及其评价:(对整体的假设检验)

A、可以将回归方程中所有的自变量作为一个整体来检验它们与应变量Y之间是否具有线性关系。

假设检验方法:方差分析法:H0:β1=β2=……=βm=0;H1:各βj不全为0. 若拒绝H0,接受H1,即可确定所拟合的回归方程有统计学意义。

1)决定系数R2:即为偏回归平方和与残差平方和的比值,其值越接近1,说明拟合程度越好。

2)复相关系数:决定系数开根号,可用来度量应变量与多个自变量之间的线性相关程度。

B、各自变量的假设检验:

①、使用方法为偏回归平方和(SS回(Xj)):表示在m-1个自变量的基础上新增加Xj所引起的回归平方和的增加量。其值越大,说明Xj越重要。

偏回归平方和检验:H0:βj=0;H1:βj≠0

注意:单独分析各个变量的偏回归平方和,所有值的和小于总的回归平方和,其原因是忽略了各个变量之间的相互作用成分。

②、t检验法:对于同一资料,不同自变量的t值间可以相互比较,t的绝对值越大,说明该自变量对Y 的回归所起的作用越大。

③标准化回归系数:减少自变量观测单位不同对结果的影响。

在有统计学意义的前提下,标准化回归系数的绝对值越大说明相应自变量对Y的作用越大。

3、自变量选择方法:

A、全局择优法:

①、校正决定系数Rc选择法(当R2相同时,自变量个数越多,Rc越小,最优为Rc最大)

②、Cp选择法:应选择Cp最接近p+1的回归方程为最优方程。

B、逐步选择法:

①、前进法:(只选不剔)在有统计学意义的前提下,选取偏回归平方和最大的一个自变量做F检验以决定是否选入。

②、后退法:(只剔不选)选取回归平方和最小的一个自变量做F检验以决定是否剔除。

③、逐步回归法:先选后剔,双向筛选。本质上是前进法,但每引入一个自变量进入方程后,要对方程中的每一个自变量做基于偏回归平方和的F检验,看是否需要剔除一些退化为不显著的自变量。

注意:为了避免已经剔除的自变量再次入选,选入自变量的检验水准要小于或等于剔除自变量的检验水准。

第十六章logistic回归分析

logistic回归(logistic regression)属于概率型非线性回归。

适用对象:二分类或多分类影响因素之间的关系。

1、表示方法:阳性概率P=1/1+exp(-Z) Z=β0+β1X1+β2X2+……+βmXm

P的logit转换:logit P=ln(p/1-p)= β0+β1X1+β2X2+……+βmXm 回归系数βj表示自变量Xj改变一个单位时logit P的该变量。

2、模型参数的意义:

①、确定优势比(odds ratio,OR)——衡量危险因素作用大小的比数比例

OR适用于分类指标而不适用于计量指标;

多变量调整后的优势比(adjust odds ratio)ORj:表示扣除了其他自变量影响后危险因素的作用。

用来对比某一危险因素两个不同暴露水平Xj=c1和Xj=c0之间的发病情况。

1)βj=0时,ORj=1,说明因素Xj对疾病的发生不起作用;

2)βj>0时,ORj>1,说明因素Xj对疾病发生起危险作用;

3)βj<0时,ORj<1,说明因素Xj时一个保护因子。

②、确定相对危险度(relative risk,RR)

对于发病率很低的疾病存在优势比即等于两种暴露水平之间的相对危险度。

2、logistic 回归方程的参数估计:

主要方法有最大似然估计法(maximum likelihood estimate,MLE)和优势比估计法。

3、logistic回归的适用对象:

①、比较各暴露因素的致病风险的大小;

②、多因素的共同作用的评价;

③、危险因素的筛选:多经文献报道选取,但统计学资料不能代替专业依据

4、logistic回归模型的假设检验:

常用的检验方法有似然比检验(likelihood ratio test)、Wald检验和计分检验(score test)——统计量为卡方值

logistic回归模型变量的筛选与多元线性回归相同。

第十七章生存分析

1、生存分析资料与一般资料比较的不同:

①、同时考虑生存时间和生存结局;

②、通常含有删失数据;

③、生存时间的分布通常不服从正态分布。

2、概念:

生存时间(survival time),从起始事件到终点事之间所经历的时间跨度。

完全数据(complete data),在追踪观察中,当观察到了某观察对象的明确结局时,该观察对象所提供的关于生存时间的信息是完整的,这种生存时间数据称为完全数据。

不完全数据(incomplete data),在实际追踪观察中,由于某种原因无法知道观察对象的确切生存时间,这种生存时间数据也称为截尾数据。

生存率(survival rate)是指病人经历给定的时间之后仍存活的概率,若有截尾数据,应用乘积极限法。

生存概率(probability of survival)表示某段时段开始时存活的个体,到该时段结束时仍存活的可能性。

死亡概率(probability of death)表示某段时段开始时存活的个体,到该时段结束

时死亡的可能性。

死亡率(death rate)指的是某单位时间内的平均死亡强度。

四分位数间距:记为Q,表示中间半数病人生存期的分布范围,它反映生存期的离散程度,其定义为:Q=T25-T75,式中,T25和T75分别是25百分位数和75百分位数.

3、生存率的估计与生存曲线:

小样本的生存率估计:kaplan-Meier法(又称乘积极限法)

大样本的生存率估计也可使用上述乘积极限法。。

4、生存率的比较:

最常见的方法是使用log-rank检验(也称为Mantel-Cox检验)

其基本思想为实际死亡数与理论死亡数之间的比较。统计量为卡方值

假设检验:H0:St(1)=St(2),即两种方式的患者生存率相同;

H1:两种方式的患者生存率不同

5、多因素生存分析方法:Cox比例风险模型(为半参数法)

其参数的估计采用的方法为最大似然估计法

因素的筛选与多元线性回归模型相同。

注意:Cox比例风险回归模型的主要前提条件是假定风险比值h(t)/h0(t)为固定值,即协变量对生存率的影响不随时间的改变而改变。

第二十七章——第二十九章

1、医学科学研究的分类:

按照目的:验证性研究和探索性研究

按照形式:观察性研究与实验性研究

按照指标:单因素研究和多因素研究

按照时限:前瞻性研究、回顾性研究和横断面研究

按照对象:临床试验、社区研究和实验研究

2、医学科学研究的基本步骤:

①、选题;

②、制定研究方案;

③、收集资料;

④、数据整理与分析;

⑤、撰写研究报告。

3、调查研究(survey research)是指在没有任何干预措施的条件下,客观地观察和记录研究对象的现状及其相关特征。

调查研究的特点是:研究的对象及其相关因素是客观存在的,不能用随机化分组来平衡混杂因素对调查结果的影响。

4、常用的抽样方法包括:

单纯随机抽样(简单随机抽样)、系统抽样(机械抽样)、分层抽样(分类抽样)、整群抽样和多阶段抽样。

5、观察性研究中估计总体参数所需样本含量的条件:

(1)、可信度1-α:其值越大,可信区间估计的可靠性越好,但相应所需样本含量就越大。

(2)、总体的标准差σ:其值越大,相应所需的样本含量也越大。

(3)、容许误差δ:即预计样本统计量与相应总体参数的最大相差控制所在的范围。用上面的三个条件求得的样本含量的意义是:当样本含量为n时,用统计量来估计总体参数,两者之差不超过δ的可能性是1-α。

6、实验设计的三个基本组成部分:实验单位、处理因素和实验效应

注意:特异性:反映该指标鉴别真阴性的能力,特异度高的指标能较好的揭示处理因素的作用

灵敏性:反映该指标检出真阳性的能力,灵敏度高的指标对外界的反应灵敏,能将处理因素的效应更好的显示出来。

7、实验设计的基本原则:对照(control)、随机化(randomization)、重复(replication)

8、实验性研究中估计总体参数所需样本含量的条件:

(1)、假设检验的Ⅰ型错误概率α的大小:α越小,所需样本含量越大。对于相同α,双侧检验比单侧检验所需样本含量多。

(2)、假设检验的Ⅱ型错误概率β或检验效能(1-β)的大小:β越小,所需样本含量越多。

(3)、容许误差δ的大小:其值越大,所需样本含量越小。

(4)、总体的相关信息:总体标准差越大,所需样本含量越多;总体率越接近于0.5,所需样本含量越多;总体相关系数越小,所需样本含量越多。总体的参数可通过样本来估计。

医学统计学复习资料

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题1.统计资料的类型分: 2.统计工作的步骤分为资料。 3.统计表的结构为:标 4.可信区间的两个要素 5.方差分析的应用条件来自正态总体③各组总 6.描述正态分布曲线形标是ν。 7.从集中趋势、离散趋 三、单项选择题(请把共20分) 1.将90名高血压病人 治疗,以服药前后血

限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。样 本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling )是指按照随机化的原则(总体中每一个 观 察单位都有同等的机会被选入到样本中),从总 是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s x μ- B σ μ-x C x s x μ- D x x σμ- 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D 中位数 5.配对设计的目的 D A 提高测量精度 B 操作方便 C 为了可以使用t 检验 D 提 高组间可比性 6.测定尿铅含量有甲乙 品,要比较两法测得的 A 配对设计t 检验 方差分析 7.应变量Y 的离均差平 A SS 剩=SS 回 B 上均可 8.相关系数r 与决定系数 确的是 C A r 值的大小反映了两 B r 值接近于零,表明 C 2 r 值接近于零,表明

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学复习资料讲解学习

一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分:计量资料、计数资料、等级资料。 2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。 3.统计表的结构为:标题、标目、线条、数字。 4.可信区间的两个要素是:准确度、精密度。 5.方差分析的应用条件为:①各组样本是相互独立的随机样本 ②来自正态总体③各组总体方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。 7.从集中趋势、离散趋势两个方面来描述计量资料的分布特 征。 三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分) 1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方 法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s xμ - B σ μ - x C x s xμ - D x x σ μ - 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数 5.配对设计的目的 D A 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性 6.测定尿铅含量有甲乙两种方法。现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 A A 配对设计t检验 B 成组设计的t检验 C均数的u检验 D 方差分析 7.应变量Y的离均差平方和划分,可出现 A A SS剩=SS回 B SS总=SS剩 C SS总=SS回 D 以上均可 8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 C A r值的大小反映了两个变量之间是否有密切的关系 B r值接近于零,表明两变量之间没有任何关系

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

医学统计学教学大纲

医学统计学教学大纲 一、课程的性质、任务 《医学统计学》是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。科技的迅速发展,大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理,医学统计分析是医学生教育培训必修课程,特别是中、高级医学人才的培养,应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法,能正确处理医学信息和数据,在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。 (本大纲规定教学时数为62学时,理论讲授38学时,实习或讨论24学时) 二、课程教学目标 本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后,再通过本课程的学习使学生理解和知道随着现代医学的发展,正确地运用统计学方法和理念,进行实验设计和实验数据处理,系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平,具有十分重要的实际意义。 大纲中应当体现理论联系实际的原则,教学过程中完全采用医学中的实例,讲述基本概念及基本原理,注意贯彻启发式教学原则,把统计思维方法的训练作为课堂教学的内容,对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项,不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论,使学生熟悉统计的基本理论、掌握统计方法的应用,通过课后复习、完成作业,加深对基本理论和基本概念的理解,进一步掌握基本方法。理论讲授38学时,实习或讨论24学时 【教学内容分作三级要求】 第一级是学生必须掌握的内容,教师应于理论课详细讲授,亦为实习课与考试的重点。 第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。 第三级为一般了解内容,供学有余力的学生自学,教师亦可选择性讲授,但不在考试范围内。 三、教学内容和要求

医学统计学复习重点

统计设计:调查设计、实验设计 第一章绪论 1.基本概念: 总体——根据研究目的确定,所有同质观察单位某种观察值的全体。 样本——总体中抽取的一部分具有代表性的个体组成的集合。 参数——刻画总体特征的统计指标。一般用希腊字母表示、、π 统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p 抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。 小概率事件 P≤ 2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释) 第二章调查研究设计 第三章实验研究设计 1.调查研究 (观察性研究): 特点:无人为施加处理因素 调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查 注意:收集的资料要有可比性 *随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样 非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等 2.实验研究 特点:与调查研究最本质的区别:根据研究目的主动施加干预措施 实验设计的三个基本要素:受试对象、处理因素、实验效应 实验设计的基本原则:对照原则、随机化原则、重复原则 第四章定量资料的统计描述 第五章定性资料的统计描述 1.定量资料 (1)定量资料——*频数分布表、直方图、箱式图——判断分布类型—— 集中位置离散趋势(变异程度)*对称分布 (正态分布) X±S均数X标准差S *偏态分布M(P 25~P 75 )中位数M=P 50 四分位数间距Q=P 25 ~P 75 对数正态分布几何均数G对数标准差S lgX (2)描述离散趋势的统计指标: 极差R=最大值-最小值、 四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 方差(总体、样本S2)&标准差(、S):*正态或近似正态分布

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学复习资料_5

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学复习资料 一、名词解释 1.概率: 在重复试验中,事件 A 的频率,随着试验次数的不断增加将愈来愈接近一个常数 p,这个常数 p 就称为事件 A 出现的概率(probability) ,记作 P(A) 或 P。 2.抽样误差: 由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围: 是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是 95%4.总体: 是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量 X 可能取的值得全体。 4.总体: 根据研究目的所确定的同质观察单位的全体。 5.线性回归系数: 直线回归方程 y=a+bX 的系数 b 称为回归系数,也就是回归直线的斜率(slope) ,表示 X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分: 计量资料、计数资料、等级资料。 1 / 8

2.统计工作的步骤分为: 统计设计、收集资料、整理资料、分析资料。 3.统计表的结构为: 标题、标目、线条、数字。 4.可信区间的两个要素是: 准确度、精密度。 5.方差分析的应用条件为: ①各组样本是相互独立的随机样本②来自正态总体③各组总体 方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是,描述 t 分布曲线形态的 指标是。 7.从集中趋势、离散趋势两个方面来描述计量资料的分布特征。 三、单项选择题(请把正确答案写在下面的表格里,每题 2分,共 20 分) 1. 将 90 名高血压病人随机等分成三组后分别用A、B 和 C 方法治疗,以服药前后血压的差值为疗效,欲比较三种 方法的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的 方差分析 D 作两两比较的 t 检验 2. 某地 1952 和 1998 年三 种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3. 下列哪个变量为标准正态变量 B A s C xsx B xx D xx 4. 某医院对 30 名麻疹易感儿童经气溶

医学统计学复习提纲

《医学统计学》复习提纲 第二章 统计描述 公式:几何均数 (1)直接法: n n X X X G ...21= 或 )lg (lg )lg ...lg lg ( lg 1211 n X n X X X G n ∑--=+++= (2)加权法: )lg (lg ....lg ...lg lg (lg 12122111 ∑ ∑--=++++++=f X f f f f X f X f X f G k k k 中位数(median ) (1) 直接法: n 为奇数 , 2 ) 1(+=n X M n 为偶数,)(21 12 2 ++= n n X X M (2)频数表法:用于频数表资料。 ∑-+ =)2 (L M f n f i L M 标准差(standard deviation ): n X ∑-= 2 ) (μσ 1 ) (2 --= ∑n X X S 离均差平方和 2 ) (∑-X X 常用SS 或l XX 表示。∑∑∑- =-= =N X X X X l SS XX 2 22 )() ( 直接法: 1 )(2 2 --= ∑∑n n X X S 加权法: 1 )(2 2 -- =∑∑ ∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。 率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 3. 应用相对数时应注意哪些问题? 4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。 制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学重点复习试题集

医学统计学重点复习试题集 1、样本是总体中:DA 、按照研究者要求抽取总体中有意义的部分B 、随意抽 取总A 、任意一部分B 、典型部分C 、有愆义的部分D 、有代表性的体中任意部分 部分E 、有价值的部分C 、有童识的抽取总体中有典型部分D 、按照随机原则 抽取总体中2、参数是指:C 有代表性部分E 、总体中的每一个个体A 、参与个体 数B 、研究个体数C19、总体的统计指标D 、样本的、以舒张压?12. 7KPa 为高血 圧,测量1000人,结果有990名总和E 、样本的统计指标 非高血压患者,有10 名高血压患者,该资料属()资料。B 3、抽样的U 的是:E A 、计算B 、计数C 、 计量D 、等级E 、都对A 、研究样本统计量B 、研究总体统计量C 、研究典型案例 20、红细胞数(1012L-1)是:B E 、样本推断总体参数A 、观察单位B 、数值变量C 、名义变量 D 、等级变量 B 、数值变量 C 、名义变量 D ?等级变量E.21、某次研究进行随 机抽样,测量得到该市120名健康成年男子的研究个体血红蛋口数,则本次研究 总体为:C 5、疗效是:D A.所有成年男子B (该市所有成年男子C (该市A 、观察单 位B 、数值变量C 、名义变量D 、等级变量 E 、研所有健康成年男子 究个体D (120名该市成年男子E (120名该市健康成年男子6、抽签的方法属 于D 22、某地区抽样调査1000名成年人的血压值,此资料属于:A 分层抽样B 系 统抽样C 整群抽样D 单纯随机抽A 、集中型资料B 、数值变量资料C 、无序分类 资样E 二级抽样料 1、统计工作的步骤正确的是C D 、有序分类资料E 、离散型资料A 收集资 料、设计.整理资料、分析资料B 收集资料、整理资料、23、抽样调査的U 的是: 设计、统计推断A 、研究样本统计量B 、研究总体统i|?量C 、研究典型案C 设 计、收集资料、整理资料、分析资料D 收集资料、整理资料、例 核对、分析资料D 、研究误差E 、样本推断总体参数E 搜集资料、整理资料、 D 、研究误差 次/分)是:B 、研究个体4、脉搏数(E A 、观察单位

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

医学统计学复习题

抽样研究的目的是( B ) A 研究样本统计量 B 由样本统计量推断总体参数 C 研究总体统计量 D 研究典型案例 医学统计学所说的样本是( A ) A 按照随机抽样原则抽取总体中有代表性的一部分 B 有意识的选择总体典型部分 C 依照研究者要求选取总体中有意义的一部分 D 随意抽取的总体中任意部分 在成组资料均数t 检验中:α=0.05, ν,05.0t t >, 则认为( D )。 A 两样本均数相同 B 两样本均数不同 C 两总体均数相同 D 两总体均数不同 完全随机设计方差分析中的组间变异表示( D ) A 处理因素效应大小 B 抽样误差大小 C 全部数据离散程度大小 D 处理因素效应和抽样误差综合作用大小 描述一组偏态分布资料的分布特征,以下哪个较好( D )。? A 几何均数结合全距 B 均数结合标准差 C 均数结合变异系数 D 中位数结合四分位数间距 配对设计的目的( C ) A 为了可以使用t 检验 B 为了可以使用F 检验 C 提高组间均衡可比性 D 提高测量精度 统计分析的主要内容是( C ) A 统计图表和假设检验 B 统计描述和计算统计指标 C 统计描述和统计推断 D 统计推断和参数估计 下面的变量中,属于计数资料的是( A ) A 性别 B 体重指数 C 收缩压和舒张压 D 肺活量 在成对资料均数t检验中,无效假设为( D ) A 两总体均数相等 B 两样本均数相等 C 两总体均数均为0 D 差数的总体均数为0 在下面哪种情况下四格表2χ检验需计算校正2χ值( B )。 A 1< E < 5或n > 40 B 1 ≤ E < 5且n ≥ 40 C E >5且n ≤ 40 D E < 1且n < 40 统计描述的主要内容是( B ) a 统计图表和假设检验 b 统计图表和统计指标 c 统计描述和统计推断 d 统计推断和参数估计 描述一组正态分布资料的分布特征,以下哪个较好( B )。? a 几何均数结合全距 b 均数结合标准差 c 均数结合变异系数 d 中位数结合四分位数间距 血清学滴度资料最常用计算( C )以表示其平均水平。 a 、算术均数 b、中位数 c 、几何均数 d 、全距

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用 锦州医学院教务处 2003年5月

《流行病学》教学大纲 适用专业: 临床医学 总学时:24,其中理论学时:18、实验学时:6 一、课程的性质和任务 流行病学(Epidemiology)是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来,随着危害人类生命和健康疾病谱的变化,随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变,流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止,比较一致认可的流行病学定义为:流行病学是研究人群中疾病与健康状态的分布及其影响因素,制定和评价预防、控制和消灭疾病的对策和措施,并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病,又从疾病扩大、引伸到健康和与健康有关的事件;研究内容既包括了描述“分布”,分析“决定因素”,又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学,又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。 通过本课程的教学使学生掌握流行病学的基本原理、方法和技能,拓宽学生的思路,开阔学生的视野,提高学生能够应用流行病学方法,在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力,为今后从事疾病预防和控制工作打下基础。 二、相关课程的衔接 本门课程的前继课程是:基础医学相关课程、计算机基础和医学统计学。 三、教学的基本要求 教学目的 培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为学习预防医学各类卫生专业课程奠定流行病学理论基础,也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。 教学要求 1、基本理论理论课教学要根据教学大纲的要求,重点突出教授基本理论和基本知识,详细讲授和解释,同时注意教授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。内容精练,条理清楚,合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学期末重点总结

误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

相关文档
相关文档 最新文档