文档视界 最新最全的文档下载
当前位置:文档视界 › 卫生统计学考试重点总结复习

卫生统计学考试重点总结复习

卫生统计学考试重点总结复习
卫生统计学考试重点总结复习

一、绪论

1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。

2.样本:从总体中随机抽取部分观察单位所组成的集合。

3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。

4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。

5.变量的类型及其转换:

①定性变量:a.分类变量(计数资料)i.二分类变量

ii.多项无序分类

b.有序变量(等级资料)

②定量变量:a.连续型变量

b.离散型变量

变量只能由“高级”向“低级”转化:定量→有序→分类→二值。

6.概率:是描述随机事件发生的可能性大些的数值。

7.卫生统计学的容包括:统计学是一门处理数据中变异性的科学与艺术,容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。

9.卫生统计学的研究对象:有变异的事物。

10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。

11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。

12.变异:同一总体的个体间存在差异又是绝对的,这种现象称为变异。

13.误差可分为:系统误差、随机测量误差、抽样误差。

14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。

二、定量资料的统计描述

1.频率分布表的编制步骤:

①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。

2.频率分布表的用途:

①揭示频数分布的分布特点和分布类型,文献中常将频数表作为述资料的形式。

②便于进一步计算统计指标和进行统计分布处理。

③便于发现某些特大和特小的可疑值。

④当样本含量比较大时,可用各组段的频率作为概率的估计值。

3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。

4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。

5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。

6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。

三、定性资料的统计描述

1.构成比:说明一事物部各组成部分在总体中所占的比重或分布,常用百分数表示。

=某一组成部分的观察单位数/同一事物部各组成部分的观察单位总数×100%

2.相对数的类型:

①频率型指标:近似的反映某一事件出现的机会大小,如发病率、死亡率。

=某事件发生的个体数/可能发生某事件的个体数×K

②强度型指标:反映单位时间段某现象发生的频率,多用于大人群长时间随访的资料,如人时发病率、人时感染率。

=某事件发生的个体数/∑(可能发生某事件的个体数×时间)×K

③相对比型指标:是AB两个有联系的指标之比,对比的两个指标可以性质相同,也可以不同。

=A指标/B指标(常见男女性别比)

3.应用相对数时的注意事项:

①防制概念混淆。

②计算相对数时,分母应有足够的数量。

③正确的合并估计频率型指标。

④相对数的对比应注意可比性。

⑤对样本相对数的统计推断,应进行参数估计和假设检验。

⑥注意率和构成比之间的差别。

4.标准化法的基本思想:

标准化法是指当比较两个或多个总率时,若比较的两组或多组部构成明显不同,需按统一指标进行调整,使之具有可比性的方法。

基本思想:采用统一标准构成以消除某因素的部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。

四、统计表和统计图

1.统计表的种类:简单表、复合表。

2.统计图的分类:

①条图:用等宽直条的长度来表示参与比较的指标的大小,分为单式和复式两种。表示指标数值的坐标尺度必须从0点开始。

②百分条图:用于表示事物中各部分的比重或构成。

③圆图:同上。

④线图:用线段的升降来表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续型变量资料。纵横的尺度可以不从0开始,一般纵横比例5:7。

⑤对半数线图:用于表示事物的发展速度(相对比)。

⑥散点图:用点的密集程度、趋势表示两变量间的相对关系,

⑦直方图:常用于表示连续型变量资料的频数或频率分布。纵轴的刻度必须从0点开始。

⑧统计地图:主要用于表示某种现象在地域空间上的分布,根据不同地方某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特征,为进一步研究提供线索。

⑨箱式图:用于描述连续型变量资料的分布特征,它表现连续型变量资料的5个百分位数,即P2.5、P25、P50、P75、P97.5。

3.统计表的构成:标题、标目、线条、数字和备注。

五、常用的概率分布:

1.二项分布的图形特征:

①高峰在μ=nπ处或附近。

②π为0.5时,图形是对称的。π离0.5愈远,对称性愈差。

③对同一π,随着n的增大,分布趋于对称。当n→∞时,只要π不太靠近0或者1,二项分布趋于对称。

2.Poisson分布的特性:

①Poisson分布的总体均数与总体方差相等,均为λ。

②Poisson分布的观察结果有可加性。

3.正态分布的图形特点:

①关于x=μ对称。

②在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点。

③曲线下面积为1。

④μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ越小,曲线沿横轴向左移。

⑤σ决定曲线的形状,当μ均衡定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

4.正态分布的应用:

①概率估计②确定医学参考值围③实验误差的质量控制④统计处理方法的理论基础

5.95%医学参考值围:指特定的“正常”人群的解剖、生理、生化指标及组织代产物含量等数据中95%个体的取值所在的围。

6.二项分布的应用:概率估计、累积概率计算。

7.Poisson的应用:概率估计、累积概率计算。

8.二项分布、Poisson分布、正态分布的区别与联系:

二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1-π都不是很小的时候二项分布渐近正态分布,但λ≥20的时候Poisson分布渐近正态分布。

六、参数估计基础

1.抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差。

2.标准误:用于表示均数抽样误差的指标叫样本均数的标准差,也称样本均数的标准误。

3.参数估计:统计学过抽样来估计总体参数,称为参数估计。

4.样本均数的标准误与原变量的标准差的区别:

样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。样本均数的标准误与原变量的标准差的区别在于:前者是表示均数变异的指标,后者是表示观察值变异的指标。两者的联系是,当样本量n一定时,标准误随标准差的大小而变化。

5.t分布是总体均数的区间估计和假设检验的基础。

6.t分布图形的特征:①单峰分布,以0为中心,左右对称。

②ν越小,t值越分散,曲线的峰部越矮,尾部越高。

③随着ν逐渐增大,t分布逐渐接近标准正态分布。

④t分布不是一条曲线,而是一簇曲线,当n确定时,t分布为一条曲线。

7.置信区间:按预先给定的概率1-α,估计总体参数的可能围,该围就称为总体参数的1-α置信区间。

8.区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的围,该围称为总体参数的置信区间。

9.CI的两个要素:①准确度:反映置信度1-α的大小,即区间包含总体均数的概率大小。

②精度:反映区间的长度,在置信区间确定的情况下,提高样本例数可以提高精度。

七、假设检验基础

1.假设检验:由样本信息对相应总体进行推断时,对所估计的总体首先提出假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验,即检验样本指标与总体指标或样本指标与样本指标之间有无差别。

2.假设检验的原理:

①反证法思想:首先提出假设,用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它,如果可能性大,还不能认为它不成立。

②小概率原理:是指小概率事件在一次随机试验中基本不会发生。

3.假设检验的步骤:

①建立检验假设,确定检验水准

②选择检验方法,计算统计量

③确定P值

④做出推断

4.假设检验应注意的问题:

①要有严密的研究设计。

②应用检验方法必须符合其适用条件。

③适当选择检验水准α。

④正确理解P值的意义。

⑤做结论不能绝对化。

⑥统计结论与专业结论相结合。

5.Ⅰ类错误:如果实际情况与H。一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝了原本正确的H。,导致推断结论错误,这样的错误称为Ⅰ类错误。

6.Ⅱ类错误:如果实际情况与H。不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,接受了原本错误的H。,导致推断结论错误,这类错误称为Ⅱ类错误。

7.t检验的应用条件:

①来自正态分布总体。

②两独立样本。

③均数比较时要求两总体方差相等。

④定量资料。

8.配对设计的种类:异体配对、自身配对。

9.小概率事件:在一次观察或实验中某事件发生的可能性很小,可以看作很可能不发生,通常取P≤0.05。

10.P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。

11.假设检验功效:1-β称为假设检验的功效,其意义是,当所研究的总体与H。确有差别时,按检验水平α能够发现它(拒绝H。)的概率。

12.检验水准的确定:

需要根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

八、方差分析

1.方差分析的基本思想:

根据资料的设计类型及研究目的,即按变异的不同来源将全部观察值间的总变异分为两部分或多个部分,其自由度也分解为相应的部分,除随机误差外,其余每个部分的变异也可由某个因素的作用加以解释,通过比较可能由某因素所致变异的均方与随机误差的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。

2.方差分析的应用条件:

①各样本是相互独立的随机样本。

②各样本来自正态总体。

③个处理组总体方差相等。

3.方差分析是用于研究定量变量数据的统计方法。

九、卡方检验

1.卡方检验的主要应用:

常用于分类变量资料的统计推断。推断两个或对个样本率及构成比之间有无差别,检验分类变量配对设计下的卡方检验,以及频数分布的拟合优度。

2.卡方检验的注意事项:

拟合优度:a.一般要求分组时每组中的理论频数不小于5;b.需要有足够的样本含量,不够时须经连续性校正。

2×2列联表:a.校正公式仅用于ν=1的四格表资料,对于ν≥2时的多组样本分布,一般不作校正;b.当n<40或T<1时,校正公式也不适用,可以用Fisher确切检验。

R×C列联表:a.一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1。解决方法:①增加样本含量;②结合专业知识合并该格所在行或列;③改用Fisher确切概率法。

3.卡方检验理论频数太小的解决方法:

①增大样本例数

②删除理论数太小的行或列

③将理论数太小的行或列进行合理的合并

④直接用Fisher确切概率法计算

十、基于秩次的非参数检验

1.参数检验:以特定的总体分布为前提,对未知的总体参数作推断的假设检验方法统称为参数检验,也叫参数统计。

2.非参数检验:不依赖于总体的分布类型,也不对总体参数进行推断时的假设检验。

4.非参数检验的适用围:

①分布类型未知。

②能以严重程度优劣等级效果大小和名次先后等表示的等级资料。

③分布极度偏态。

④个别变量值偏离过大远离本组其他变量值(极大值、极小值)或开口资料。

⑤方差不齐时。

⑥筛选或只需获得初步结果时。

5.配对设计资料编秩次的步骤:

依差值的绝对值由小到大编秩,并按差值的正负标上正负号,遇差值为0,舍去不计,n 随之减少,遇绝对值相等差值,取平均秩次。

6.秩和检验的优缺点:

优点:①适用围广。②方法简便、易于理解和掌握。

缺点:损失信息量,适用于参数检验条件的非参数检验,检验效能降低。

十一、两变量关联性分析

1.线性相关:如果两个随机变量中,一个变量由小到大变化时,另一个变量也相应地由小到大(或由大到小)地变化,并且直线趋势,就称这两个变量存在直线相关关系。

2.线性(积距)相关系数及其特点:定量描述两个变量间线性关系密切程度和相关方向的统一指标。ρ≠0两变量线性相关,ρ=0两变量不相关。

3.线性相关应注意的问题:

①样本的相关系数接受零时并不意味着两变量间一定无相关性。

②一变量的数值人为选定时莫作相关。

③出现异常点时慎用相关。

④相关未必真有在联系。

⑤分层资料盲目合并易出现假象。

4.秩相关的条件:

①不服从双变量正态分布不宜作积差相关。

②总体分布类型未知。

③用等级表示的原始资料。

5.秩相关和线性相关有何异同:

联系:①两者都可用于两变量间线性相关的方向与密切程度,其取值围与数值大小的统计学意义解释也相同。

②两者都要求个体间满足独立性。

③Spearman 秩相关系数的计算可采用对秩次的Pearon 积距相关系数的计算来实现。相关系数的含义、单位、取值围一致,且计算公式相同,不同一个直接用原始的定量数据,另一个则要用等级数据。

区别:①Pearon 积距相关要求数据服从二元正态分布,属于参数统计量;而Spearman 秩相关不要求正态分布,属于非参数统计量。

②两者总体参数的假设检验方法不完全相同(主要是ρ和ρs 的分布不同)。

6.线性相关和线性回归的区别与联系:

区别:①资料要求:线性相关要求X 、Y 服从双变量正态分布,对这种资料进行回归分析称为Ⅱ型回归,即可以把X 当自变量,也可以当因变量,反之亦然。线性回归要求Y 在给定X 值时服从正态分布,X 可以是精确测量和严格控制的变量,这时的回归称为Ⅰ型回归,即不可以把X 当因变量,Y 当自变量进行回归分析。

②应用:线性相关用来表达两个变量间的互依关系,两个变量的研究地位是相等的,谁做X ,谁做Y 都可以;线性回归用来表达两个变量间的依存关系,即一个变量如何依存于另一个变量而变化,两个变量的研究地位是不相等的。

③意义:相关系数r 说明具有线性关系的两个变量之间的密切程度和相关方向;回归系数b 表示X 每变化一个单位所导致Y 的变化量。

④取值围:-1≤r ≤1,-∞

联系:①符号:对于既可做相关又可作回归的同一组资料,计算出的r 和b 正负号相同。 ②假设检验:对于同一组资料,相关系数和回归系数的假设检验等价。即tr=tb 。 ③相互换算:对于同一组资料,相关系数和回归系数可通过下式换算:b=r x

S Sy ,式中的Sx 、Sy 分别为X 、Y 数据的标准差。

④用回归解释相关:有决定系数R 2=总

回SS SS 可知,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则R 2越接近1,相关的效果

越好。说明回归效果越好,相关的密切程度也越高。

十二、简单回归分析

1.回归系数:b 为回归直线的斜率,也是通过X 推算Y 的回归系数,表示当X 变动一个单位时,Y 平均变动b 个单位。

2.直线相关与回归的区别与联系:

区别:⑴资料:回归:①Y 为正态随机变量,X 为选定变量②X 、Y 服从双变量正态分布 相关:X 、Y 服从双变量正态分布

⑵应用:回归:由一个变量值推算另一个变量值

相关:只反应两变量间互依关系

⑶回归系数与原变量单位有关,而相关系数无关

联系:⑴方向一致,r 与b 的正负号一致

⑵假设检验等价tr=tb

⑶r=b

⑷相关回归可以相互解释

3.线性回归模型的适用条件:线性;正态性;方差相等;独立。

4.最小二乘原则:但ab 取不同值获取不同获选直线时,使所有实测值到这条直线的纵向距离平方和最小时的ab 值即为最小二乘估计。

5.残差:是P 点与回归直线的纵向距离,即实测值Y 与其估计值?之差

6.决定系数:回归平方和总离均差平方和之比称为决定系数。取值在0到1之间,且无单位,它反映了回归贡献的相对程度,即在因变量Y 的总变异中回归关系所能解释的比例。 线性回归的应用:①研究因素间的依存关系②估计与预测③统计控制

十三、实验设计

1.实验设计的三要素:受试对象、处理因素、实验效应。

①受试对象时处理因素作用的客体,受试对象选择的合适与否,也是一项实验是否成功的关键,因此应保证受试对象的同质性和代表性。

②处理因素是研究者根据研究目的而施加的特定措施,又称受试因素,实验过程中同一处理因素应始终保持不变,即处理因素应当标准化,同时控制和削弱非处理因素的影响。 ③实验效应是处理因素作用于受试对象产生的反应或结局。其通过观察指标表达出来,在指标的选择上,考虑客观性、精确性、灵敏性和特异性。

2.实验设计的基本原则:对照原则;随机化原则;重复原则。

①对照原则:安慰剂对照、空白对照、实验对照(标准对照和自身对照)

②随机化原则:体现在三个方面:随机抽样、分组的随机、实验顺序随机

③重复原则:作用:估计实验误差、减小实验误差

3.随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。是对资料进行统计推断的前提,各种统计分析方法都是建立在随机化的基础上。

4.样本含量估计的四要素:

①容许误差δ

②有关总体变异性(总体标准差σ与总体概率π)

③第Ⅰ类错误概率α的大小

④第Ⅱ类错误概率β或检验功效1-β的大小

5.常用的实验设计方案:

①完全随机设计:是最为常见的一种考察单因素两水平或多水平效应的实验设计方法。它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。

②交叉设计:是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。

③配对设计:将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。(主要有以下情形:a.将两个条件相同或相近的受试对象配成对子,通过随机化,是对子个体分别接受两种不同的处理。b.同一受试对象的两个部分配成对子,分别随机地接受两种不同的处理。c.自身前后配对,即同一受试对象,接受某种处理之前和接受该处理之后视为配对)。

④随机区组设计:是配对设计的扩展,通常是将受试对象按性质相同或相近分为b个区组,再将每个区组中的k个受试对象随机分配到k个处理组。设计时应遵循“区组间差别越大越好,区组差别越小越好”的原则。

6.双盲法:受试对象和实验执行者均不知道受试对象分在哪一组。

十四、调查设计

1.常用的抽样方法及其优缺点:

①非概率抽样:立意抽样、偶遇抽样、雪球抽样。

2.调查表的构成:标题、说明、被访者基本情况、主要容、编码、作业证明的记载。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学考研总结

1、试述正态分布、标准正态分布以及对数正态分布的联系和区别? 2、说明频数分布表的用途? 描述频数分布的特征、描述频数分布的类型、 便于发现一些特大或特小的可疑值、便于进一步做统计分析和处理 3、变异系数的用途? 常用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童与成人身高变异程度的比较。 4、试举例说明均数的标准差与标准误的区别与联系? 例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/l ,标准差S 为5.20g/L,标准误x S 为1.04g/L ,。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算述平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差, 均数的标准误实质要均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误X S 此式 将标准差和标准误从数学上有机地联系起来了,同是可以看出通过增加样本含量方法可以减少标准 误。 5、标准正态分布与t 分布有何不同? T 分布为抽样分布,标准正态分布为理论分布。T 分布比标准正态分布的峰值低,且尾部翘起得要高。随着自由度的增大,t 分布逐渐趋近于标准正态分布,即当v →∞时,t 分布→标准正态分布。 6、假设检验时,一般当P<0.5时,则拒绝0H ,理论根据是什么? P 值是指从0H 规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t 值 或u 值 )的概率。当P<0.5时,说明在0H 成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现在的确发生了,说明现有样本信息不支持0H ,所以怀疑原假设0H 不成立,故拒绝0H 。在下“有差别”的结论的同时,我们能够知道可犯I 型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试试题及答案

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

10级-卫生统计学-整理资料

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别):

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示: A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学试题

卫生统计学习题 定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 (1)试编制以上数据的频数表,绘制直方图,概括其分布特征。(2)用合适的统计量描述其集中趋势和离散趋势。 (3)对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比; (2)计算育龄妇女(15~49岁)占总人口的百分比; (3)计算总负担系数; (4)计算老年人口系数 某地人口构成情况 年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少? 3.某人群中12岁男童身高的分布近似正态分布,均数为 144.00cm,标准差为 5.77cm,试估计

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一 《实用卫生统计学》期末复习题一 一、名词解释 1、卫生统计学: 2、随机抽样: 3、构成比: 4、频率: 5、非参数检验: 6、概率 7、变异系数 名词解释答案 1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。7.变异系数常记为CV,它被定义为标准差与算术均数之比。 《实用卫生统计学》期末复习题二 单选题 1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2.医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时,表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。  A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

(完整word版)统计学学习总结

统计学学习总结 统计学学习感想 通过半个多学期的学习,我对统计学这门课程有了一定的了解,对学习这门课程也有了一定的感想。 首先,我谈谈我对这门课程的理解。 一)对统计学新的认识 在学习统计学之前,谈起统计我脑袋中就浮现出计数,一大堆枯燥的数字,还有一长串的数学计算式。在我眼中,统计学是一门非常枯燥非常单调的学科,它不像数学那样强调严密的推理和逻辑,而是仅仅需要搜集原始资料,套用数学公式而已,我甚至不是很喜欢这门课程。 但是经过半个学期的学习,我对统计学有了全新的认识。统计学是研究总体在一定天脚下的数量特征及其规律性的方法论学科。我开始意识到统计学在学术研究中,在公司决策中,在国家制定方针政策时??在社会生活的各个方面都发挥着重要作用,我开始了解到统计学是一个理论联系实际的学科,非常具有实践性,统计的原始资料全部来源于实际生活。统计学也是一种成熟的学科,它有它独立而完备的理论体系,它是相当科学的,它是以数学作为它的基本工具,但它有比数学更有实际用途,它可以对生活中大量的无序的数据进行分析,找出它们的规律,从而为研究、决策提供基本的依据,它是其他学科的一切理论的基础和来源。

二)统计学和经济学的关系 统计学并不是一门浅显的学科,人们从事统计工作已经有几千年的历史了,但是统计作为一门学科而存在仅有300多年的历史。统计学这个名称起始于国家管理,起始于社会经济的数量考察。于是统计学就和经济学就有了密不可分的联系。 经济学来源于统计学。我们知道经济现象是现实世界的一个重要组成部分,和自然界的现象有很大的不同。自然界的现象基本上都按其本身的机制机理形成和发展的,容易通过实验解剖等方法来被人们掌握。但是人类社会的经济现象就大不一样,它们是由人的活动而形成的,复杂多样,变化多端,没有任何实验的方法可以来准确的研究。因此我们就只有借助于统计学,通过统计分析社会经济的各种数据,我们就可以发现社会的经济问题,为经济学的研究提供了素材。这就是所谓的理论源于实践。 同时,统计学也是检验经济学的理论是否符合客观事物的发展规律的重要工具。实践是检验真理的唯一标准。运用各种经济理论所制定的方针政策、计划方案的是否正确,是否符合实际,能否达到预期的目的,只有依靠实践来检验,然而对实践要取得了解,又只能依靠统计。统计是沟通经济学与实际的一个重要桥梁。没有统计学,就没有经济学今天的发展。

16秋实用卫生统计学终考综合练习题

16秋实用卫生统计学期末终考综合练习题说明: 1.本套综合练习题仅针对16秋期末终考而编制,每个题的解题方法在学习网实用卫生统计学课程主页的“每章重难点辅导”中,或在教材后面的习题答案中,找到相应题目或类似题目的详细解答过程和答案。 2.16秋期末终考试题与本综合练习题的题型完全相同。有些数据可能稍有变化,但解题方基本一致。 本次期末考试时间为60分钟,开卷考试,时间短,题量大,希望同学们考前一定要做足准备,考试时仔细审阅试题,争取好成绩。 一、填空题 1.经调查某地10岁男童身高均数为135厘米,标准差为4.74厘米,其变异系数是 3.51% (注意:保留两位小数)。 2.正态分布的两个重要参数是均值和方差。 3.某市6岁男童的身高均数为115.0cm,标准差为10.0cm。试计算6岁男童身高大于13 4.6cm的约占百分数是 2.5% 4.常用的相对数有构成比、率、比。 5.增长速度与发展速度关系为增长速度=发展速度-1 。 6.环比发展速度的算式为以前一个时间(年)数据为作基数,以相邻的后一时间(年)数据与之相比,或当前一年数据与前一年数据之比。 7.动态数列是一列按时间顺序排列起来的统计指标,它包括:绝对数,相对数或平均数,这些指标用以说明事物在时间上的变化和发展趋势。 8.统计表是由标题、标目、线条、数字四部分构成。 9.统计学中常见的统计图形有:普通线图、半对数线图、直条图、直方图、圆图、百分条图和散点图 10.置信区间的两个要素:一是准确度,二是;精确度。 s 11.均数标准误的计算公式为 12.均数的抽样误差是对于抽样过程中产生的同一总体中均数之间的差异。 13.根据总体标准差σ是否已知及样本含量n的大小,总体均数置信区间的计算公式不同。

卫生统计学试卷B

卫生统计学试卷 1. 某研究属于观察性研究抑或试验性研究是根据确定的。A A. 是否给予研究对象干预措施 B. 是否遵循随机化原则 C. 研究者的工作属性 D. 研究对象所提供的信息 E. 在现场工作,还是在实验室工作 2. 为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用( C A. 普通线图 B. 直方图 C. 复式直条图 D. 直条图 E. 半对数线图 3. 统计中所说的总体是指:( ) B A. 根据地区划分的研究对象的全体。 B. 据研究目的确定的同质的研究对象的全体。 C. 根据时间划分的研究对象的全体。 D. 随意想象的研究对象的全体。 E. 根据人群划分的研究对象的全体。 4. 对两样本均数作t检验,n1=20,n2=20,其自由度等于:( ) E A. 39 B. 40 C. 20 D. 19 E. 38 5. 标化后的总死亡率:( ) C A. 它反映了事物实际发生的强度 B. 以上都不对 C. 仅仅作为比较的基础,它反映了一种相对水平 D. 它反映了实际水平 E. 它不随标准选择的变化而变化 6. 计量资料编制频数表时,一般分组数目为:( ) A A. 8~15组 B. 15~20组 C. 5~10组 D. 10~15组 E. 随便分几组 7. 均数与标准差适用于:( ) E A. 偏态分布 B. 不对称分布 C. 正偏态分布 D. 负偏态分布 E. 正态分布的资料 8.某地区抽样调查1000名成年人的血压值,此资料属于:( ) D

A. 有序分类资料 B. 离散型资料 C. 无序分类资料 D. 数值变量资料 E. 集中型资料 9. 120名10岁男孩身高资料是:() D A. 定量不连续资料 B. 定性连续资料 C. 定性二分类资料 D. 定量连续性资料 10. 偏态分布资料宜用下面那一项描述其分布的集中趋势:( )D A. 标准差 B. 算术均数 C. 四分位数间距 D. 中位数 E. 方差 11. 两样本均数比较时,分别取以下检验水准,以所犯第二类错误最小:( ) C A. α=0.02 B. α=0.01 C. α=0.05 D. α=0.15 E. α=0.10 12. 抽样调查的目的是:( E A. 研究误差 B. 研究总体统计量 C. 研究典型案例 D. 研究样本统计量 E. 样本推断总体参数 13. 以下抽样方法中,属于系统抽样的是( )。A A. 52名学生编号1-52,凡编号末位数为1,4,7的同学被抽取 B. 全班有四个学习小组,随机抽取其中1组 C. 分别从20名男生和32名女生中抽出5名和8名女生 D. 每名学生抽一张扑克牌,凡抽到黑桃的被选取 E. 查52个随机数,顺序给予52名同学,凡随机数可被4整除的被抽取 14. 抽样调查小学生身体形态指标,应调查足够的人数,是因( )。B A. 对学生不宜采用配对调查 B. 学生身体处于发育阶段,变异程度大 C. 现在学生的生活条件优越 D. 现在学生人数增多 E. 学生难于配合检查 15. 在统计工作中,整理资料的首要工作是:( ) C A. 拟整理表 B. 归组

相关文档
相关文档 最新文档