文档视界 最新最全的文档下载
当前位置:文档视界 › 医学统计学重点笔记复习资料

医学统计学重点笔记复习资料

医学统计学重点笔记复习资料
医学统计学重点笔记复习资料

第一章

2选1

总体:总体(population)就是根据研究目得确定得同质观察单位(研究对象)得全体,实际上就是某一变量值得集合。可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目得而确定得同质观察单位得全体。

样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。

样本sample从总体中随机抽得得部分观察单位,其实测值得集合。

3选1

小概率事件:我们把概率很接近于0(即在大量重复试验中出现得频率非常低)得事件称为小概率事件。

P值:P 值即概率,反映某一事件发生得可能性大小。统计学根据显著性检验方法所得到得P 值反应结果真实程度,一般以P ≤ 0、05 认为有统计学意义, P ≤0、01 认为有高度统计学意义,其含义就是样本间得差异由抽样误差所致得概率等于或小于0、05 或0、01。

P值就是:

1) 一种概率,一种在原假设为真得前提下出现观察样本以及更极端情况得概率。

2) 拒绝原假设得最小显著性水平。

3) 观察到得(实例得) 显著性水平。

4) 表示对原假设得支持程度,就是用于确定就是否应该拒绝原假设得另一种方法。

小概率原理:一个事件如果发生得概率很小得话,那么可认为它在一次实际实验中就是不会发生得,数学上称之小概率原理,也称为小概率得实际不可能性原理。统计学中,一般认为等于或小于0、05或0、01得概率为小概率。

资料得类型(3选1)

(1)计量资料:对每个观察单位用定量得方法测定某项指标量得大小,所得得资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。、其变量值就是定量得,表现为数值大小,一般有度量衡单位。如某一患者得身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable

为观测每个观察单位某项指标得大小,而获得得资料。

(2)计数资料:将观察单位按某种属性或类别分组,所得得观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值就是定性得,表现为互不相容得类别或属性。如调查某地某时得男、女性人口数;治疗一批患者,其治疗效果为有效、无效得人数;调查一批少数民族居民得A、B、AB、O 四种血型得人数等。

计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable

为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到得资料。

(3)等级资料:将观察单位按测量结果得某种属性得不同程度分组,所得各组得观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者得治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既就是分类结果,又有顺序与等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量得测定结果分为 +、++、+++等。

等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料

为将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位后而得到得资料。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

两种误差(2选1)

抽样误差(sampling error )由于抽样而引起得总体指标(参数)与样本指标(统计数)之间得差异。抽样误差就是由个体变异或其它随机因素造成得,就是不可避免得,但误差分布有规律可循,可进行估计与分析。

系统误差(systematic error):由于测量仪器结构本身得问题、刻度不准确或测量环境改变等原因,在多次测量时所产生得,总就是偏大或总就是偏小得误差,称为系统误差。它带有规律性,经过校正与处理,通常可以减少或消除。

统计得步骤(考填空题,四个空)

统计工作得步骤

1.设计:设计内容包括资料收集、整理与分析全过程总得设想与安排。设计就是整个研究中最关键得一环,就是今后工作应遵循得依据。

2.收集资料:应采取措施使能取得准确可靠得原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物得综合特征,阐明事物得内在联系与规律。分析资料包括统计描述与统计推断。

实验设计得基本原则(考填空题,三个空)

随机化原则、对照得原则、重复得原则。

2选1

参数:参数(paramater)就是指总体得统计指标,如总体均数、总体率等。总体参数

就是固定得常数。多数情况下,总体参数就是不易知道得,但可通过随机抽样抽取有代表性得样

本,用算得得样本统计量估计未知得总体参数。

统计量:统计量(statistic)就是指样本得统计指标,如样本均数、样本率等。样本

统计量可用来估计总体参数。总体参数就是固定得常数,统计量就是在总体参数附近波动得随机

变量。

第二章

频数表得制作步骤以及频数分布表得用途(问答题)

频数分布表得编制步骤:

例:某市1982年50名7岁男童得身高(cm)资料如下,试编制频数表。

114、4 117、2 122、7 124、0 114、0 110、8 118、2 116、7 118、9 118、1

123、5 118、3 120、3 116、2 114、7 119、7 114、8 119、6 113、2 120、0

119、8 116、8 119、8 122、5 119、7 120、7 114、3 122、0 117、0 122、5

119、7 124、9 126、1 120、0 124、6 120、0 121、5 114、3 124、1 117、2

120、2 120、8 126、6 121、5 126、1 117、7 124、1 128、3 121、8 118、7

1、找出观察值中得最大值(largest value)、最小值(smallest value),求极差(range)。

极差等于最大值减最小值。本例最大值=128、3,最小值=110、8,则极差=128、3-110、8=17、5(cm )

2、确定分组数与组距(class interval)。

组数得多少就是根据例数得多少来确定得,以能够反映出频数分布得特征为原则,一般分10—15组。组距为相邻两组得间隔,组距=极差/组数。本例拟分10组,则组距=17、

5/10=1、75≈2,为划记方便,可取稍大或稍小得数(当然本例组距也可取1、5)。

3、确定组段。

第一组段包括要最小值,取较最小值稍小且划分方便得数,本例取“110~”。最后组段包括最大值并写出其上限值。

4、划记。

将各观察值以划“正”字得方法,一笔代表一例,划在相应组段中。例如第一个数l14、4应在组段“114~”处划,第二个数117、2应在“116~”处划,以此类推。

5、统计各组段得频数。全部数据划记完后,清点各组段得人数。

根据编制出得频数表即可了解该数值变量资料得频数分布特征。

频数分布表得用途

1、描述资料得分布特征与分布类型。

频数分布有两个重要特征:集中趋势与离散趋势。大部分观察值向某一数值集中得趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,就是个体差异所致,可用一系列得变异指标来反映。

2、便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

3、发现特大、特小得可疑值。

如果频数表得一端或两端出现连续几个组段得频数为零后,又出现少数几个特大值或特小值,使人怀疑其就是否准确,需进一步检查与核对并做相应处理。

4、据此绘制频数分布图。

描述数据分布集中趋势得指标与描述数据分布离散程度得指标(考选择或者填空)2.描述数据分布集中趋势得指标

算术均数、几何均数、中位数。

3.描述数据分布离散程度得指标

极差、四分位数间距、方差、标准差、变异系数。

正态分布得特征(考选择题υ、σ对图形得影响)

服从正态分布得变量得频数分布由υ、σ完全决定。

(1) υ就是正态分布得位置参数,描述正态分布得集中趋势位置。正态分布以 x =υ为对

称轴,左右完全对称。正态分布得均数、中位数、众数相同,均等于υ。

(2) σ描述正态分布资料数据分布得离散程度,σ越大,数据分布越分散,σ越小,数

据分布越集中。σ也称为就是正态分布得形状参数,σ越大,曲线越扁平,反之,σ越小,曲

线越瘦高。

标准正态分布(填空)

1.标准正态分布就是一种特殊得正态分布,标准正态分布得υ0,σ2 1 ,通常用u(或Z)表示服从标准正态分布得变量,记为υ~N(0,12)。

正态分布得应用(简答)

某些医学现象,如同质群体得身高、红细胞数、血红蛋白量,以及实验中得随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后得新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布得指标,被称为服从对数正态分布。

1、估计频数分布一个服从正态分布得变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2、制定参考值范围

(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布得指标。

(2)百分位数法常用于偏态分布得指标。表3-1中两种方法得单双侧界值都应熟练掌握。

3、质量控制:为了控制实验中得测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。这样做得依据就是:正常情况下测量(或实验)误差服从正态分布。

4、正态分布就是许多统计方法得理论基础。检验、方差分析、相关与回归分析等多种统计方法均要求分析得指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应得统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也就是以正态分布为理论基础得。

医学参考值范围得制定(计算题)

确定参考值范围得单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。

确定百分位点:一般取95%或99%。

例题

某市 20 岁男学生 160 人得脉搏数(次/分钟),经正态性检验服从正态分布。求得= 76、10,S =9、32。试估计脉搏数得95%、99%参考值范围。

解:脉搏数得95%正常值范围为:±1、96 S=76、10 ± 1、96(9、32)=57、83~94、37

脉搏数得99%正常值范围为:±2、58 S =76、10 ± 2、58(9、32)=52、05~100、37

第三章

标准误得概念,计算公式。

标准误:抽样研究中,样本统计量与总体参数间得差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差得大小,即样本均数得标准差,就是描述均数抽样分布得离散程度及衡量均数抽样误差大小得尺度。

t分布得图形特征及其与正态分布得区别(简答)

t分布得图形特征

1.以0为中心,左右对称得单峰分布;

2.t分布就是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。

t分布

对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t得分布规律,计算较复杂。

t 分布与正态分布比较得区别

t 分布与标准正态分布相比有以下特点:①都就是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν趋向∞,t 分布得极限分布就是标准正态分布。

置信区间与参数估计(名解2选1)

置信区间:在统计学中,一个概率样本得置信区间(Confidence interval)就是对这个样本得某个总体参数得区间估计。置信区间展现得就是这个参数得真实值有一定概率落在测量结果得周围得程度。给出得就是被测量参数得测量值得可信程度。

1、对于具有特定得发生概率得随机变量,其特定得价值区间------一个确定得数值范围(“一个区间”)。

2、在一定置信水平时,以测量结果为中心,包括总体均值在内得可信范围。

3、该区间包含了参数θ真值得可信程度。

4、参数得置信区间可以通过点估计量构造,也可以通过假设检验构造。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计与区间估计。

可信区间与参考值范围得不同点(简答)

应注意:可信区间与参考值范围得意义、计算公式与用途均不同。

1、从意义与用途来瞧

95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指按95%可信度估计得总体均数得所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值得分布范围,变量值可能很多甚至无限。

2、从计算公式瞧

若指标服从正态分布,95%参考值范围得公式就是:±1、96s。

总体均数95%可信区间得公式就是:。

前者用标准差,后者用标准误。前者用1、96,后者用α为0、05,自由度为v得t界值。

t检验得应用条件与类型(填空)

t检验得应用条件:要求各样本来自相互独立得正态总体且各总体方差齐。

t检验得类型:单样本t检验,独立t检验,配对t检验

配对设计与完全随机设计(名解2选1)

完全随机设计(completely random design):完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它就是将受试对象按随机化得方法分配到各个处理组中,观察实验效应,临床试验中得随机对照试验也属于此类设计。

配对设计(paired design):就是将受试对象按一定条件匹配成对,再随机分配每对中得两个受试对象到不同处理组。配对得因素就是影响实验效应得主要非处理凶素。

假设检验得基本求解步骤或者注意事项。(简答2选1)

假设检验得基本步骤

1、建立假设,确定检验水准α

假设有零假设(H0)与备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0与H1得关系就是互相对立得,如果拒绝H0,就要接受H1、根据备择假设不同,假设检验有单、双侧检验两种。

检验水准用α表示,通常取0、05或0、10、检验水准说明了该检验犯第一类错误得概率。

2、根据研究目得与设计类型选择适合得检验方法

这里得检验方法,就是指参数检验方法,有u检验、t检验与方差分析三种,对应于不同得检验公式。对双样本资料,要注意区分成组设计与配对设计得资料类型。如果资料里有"配成对子"字样,或者就是对同一对象用两种方法来处理,一般就可以判定就是配对设计资料。

3、确定P值并作出统计结论

u检验得到得就是u统计量或称u值,t检验得到得就是t统计量或称t值。方差分析得到得就是F统计量或称F值。将求得得统计量绝对值与界值相比,可以确定P值。

当α=0、05时,u值要与u界值1、96相比较,确定P值。如果u<1、96,则P>0、05、反之,如u>1、96,则P<0、05、t值要与某自由度得t界值相比较,确定P值。如果t 值<t界值,故P>0、05、反之,如t>t界值,则P<0、05、相同自由度得情况下,单侧检验得t界值要小于双侧检验得t界值,因此有可能出现算得得t值大于单侧t界值,而小于双侧t界值得情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。

当P>0、05时,接受零假设,认为差异无统计学意义,或者说二者不存在质得区别。当P <0、05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质得区别。但即使检验结果就是P<0、01甚至P<0、001,都不说明差异相差很大,只表示更有把握认为二者存在差异。

假设检验时应注意得事项

(一)要有严密得抽样研究设计;样本必须就是从同质总体中随机抽取得;要保证组间得均衡性与资料得可比性。

(二)根据现有得资料得性质、设计类型、样本含量大小正确选用检验方法。

(三)对差别有无统计学意义得判断不能绝对化,因检验水准只就是人为规定得界限,就是相对得。差别有统计学意义时,就是指无效假设h0被接受得可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒h0,但尚不能排除有5%或1%出现得可能,所以可能产生第一类错误;同样,若不拒绝h0,可能产生第二类错误。

(四)统计学上差别显著与否,与实际意义就是有区别得。如应用某药治疗高血压,平均降低舒张压0、5kpa,并得出差别有高度统计学意义得结论。从统计学角度,说明该药有降压作用,但实际上,降低0、5kpa就是无临床意义。因此要结合专业作出恰如其分得结论。

第一类错误与第二类错误(名解 2选1)

Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立得,为“弃真”得错误,其概率通常用表示。可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0、05或=0、01,其意义为:假设检验中如果拒绝时,发生Ⅰ型错误得概率为5%或1%,即100次拒绝得结论中,平均有5次或1次就是错误得。

Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立得,为“存伪”得错误,其概率通常用表示。只取单尾,假设检验时值一般不知道,在一定情况下可以测算出,如已知两总体得差值(如)、样本含量与检验水准。

以下图说明两类错误:

第四章

为什么等级资料不可用方差分析?资料不相互独立

方差分析得基本思想应用条件(简答)

方差分析(analysis of variance,ANOVA )得基本思想就就是根据资料得设计类型,即变异得不同来源将全部观察值总得离均差平方与(sum of squares of deviations from mean,SS)与自由度分解为两个或多个部分,除随机误差外,其余每个部分得变异可由某个因素得作用(或某几个因素得交互作用)加以解释,如各组均数得变异SS 组间可由处理因素得作用加以解释。通过各变异来源得均方与误差均方比值得大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

方差分析得应用条件

(1)各样本就是相互独立得随机样本,且来自正态分布总体。

(2)各样本得总体方差相等,即方差齐性(homoscedasticity)。

第五章

分类资料得统计描述(几个常用相对数指标填空题)

率(强度相对数,频率相对数)、构成比、相对比

应用相对数时应注意得问题(简答题六条)

⑴计算相对数得分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比得动态分析代替率得动态分析。

⑷对观察单位数不等得几个率,不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率(或构成比)得比较应随机抽样,并做假设检验。

率得标准化得基本思想,应注意得问题(分析题)

率得标准化得基本思想:

要比较两个总率时,发现两组资料得内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率得结果,这时就不宜再直接比较总率,而应考虑采用标准化法。

标准化法得基本思想,就就是采用统一得标准(统一得内部构成)计算出消除内部构成不同影响后得标准化率(调整率),然后再进行比较。

二、直接标准化法得计算方法

当已知所比较资料各组率Pi,可选用直接法计算标化率。

三、间接标准化死亡比得计算方法

当所比较得资料已知各自某现象总发生数r及各分组观察单位数时,宜采用间接法计算标化率。

第六章

二项分布,Piosson分布在什么条件下接近正态分布(选择或填空)

第七章(考计算题)

配对与完全随机设计下得四格表得计算

列四格表

公式选择

给个例题把

为研究静脉曲张就是否与肥胖有关,观察 122 对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

[评析]这就是一个配对设计得资料,因此用配对检验公式计算。

第八章

参数统计与非参数统计(名解 2选1)

1.参数统计

样本所来自得总体分布具有某个已知得函数形式,而其中有得参数就是未知得,统计分析得目得就就是对这些未知得参数进行估计或检验。此类方法称为参数统计。

2.非参数统计

样本所来自得总体分布难以用某种函数式来表达,还有一些资料得总体分布得函数式就是未知得,只知道总体分布就是连续型得或离散型得,解决这类问题得一种不依赖总体分布得具体形式得统计方法。由于这类方法不受总体参数得限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)得统计分析方法,又称为无分布型式假定(assumption free statistics)得统计分析方法。它检验得就是分布,而不就是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

非参数统计得特点与适用范围(简答)

1.特点

(1)样本所来自得总体得分布形式为任何形式,甚至就是未知得,都能适用。

(2)收集资料方便,可用“等级”或“符号”来评定观察结果。

(3)多数非参数方法比较简便,易于理解与掌握。

(4)缺点就是损失信息量,适用于参数统计法得资料用非参数统计方法进行检验将降低检验效能。

2.适用范围

(1)等级资料。

(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。

(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。

(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。

(5)分布类型不明。

(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。

(7)对于一些特殊情况,如从几个总体所获得得数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

非参数检验得优缺点:(简答)

非参数统计与传统得参数统计相比,有以下优点:

1、非参数统计方法要求得假定条件比较少,因而它得适用范围比较广泛。

2、多数非参数统计方法要求得运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。

3、大多数非参数统计方法在直观上比较容易理解,不需要太多得数学基础知识与统计学知识。

4、大多数非参数统计方法可用来分析如象由等级构成得数据资料,而对计量水准较低得数据资料,参数统计方法却不适用。

5、当推论多达3个以上时,非参数统计方法尤具优越性。

但非参数统计方法也有以下缺点:

1、由于方法简单,用得计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就就是说,在给定得显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误得概率β要大些。

2、对于大样本,如不采用适当得近似,计算可能变得十分复杂。

注意:

凡符合或经过变换后符合参数检验条件得资料,最好用参数检验。当资料不具备参数检验得条件时,非参数检验就是一种有效得分析方法。

配对设计得符号秩与检验方法(简答)

(1)假设:H0:差值总体中位数Md=0

H1:Md≠0

α =0、05

(2)求差值

(3)编秩次:依差值得绝对值从小到大编秩次。编秩次时遇差数等于 0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。

(4)求秩与并确定检验统计量:分别求出正负秩次之与,正秩与以 T+表示,负秩与得绝对值以T-表示。T+及T-之与应等于 n(n+1)/2,任取T+(或 T-)作检验统计量T 。

(5)确定 P 值与作出推断结论:当 n≤50 时,查 T 界值表,得出 P值。若检验统计量T值在上、下界值范围内,其 P值大于表上方相应概率水平;若 T值在上、下界值上若范围外,其 P值小于表上方相应概率水平。

第九章

线性相关系数(名解)

线性相关系数:表示两个变数线性相关方向及程度得统计数或参数。又叫直线相关系数,简称相关系数。,|R|得极值为1,|R|越大(接近1),则直线关系越好。

线性相关系数取值范围(填空)

-1≤r≤1

样本相关系数 r得假设检验(填空题)

(1)r 界值表法;

(2)t检验法。

线性相关或回归应用应注意得问题(简答)

⑴作回归分析与相关分析时要有实际意义,不能把毫无关联得两种现象作回归、相关分析,必须对两种现象间得内在联系有所认识。

⑵在进行回归分析与相关分析之前,应绘制散点图。但观察点得分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程得应用范围一般以自变量得取值范围为限。若无充分理由证明超过自变量取值范围外还就是直线,应避免外延。

⑷双变量得小样本经 t 检验只能推断两变量间有无直线关系,而不能推断相关得紧密程度,要推断相关得紧密程度,样本含量必须很大。

⑸相关或回归关系不一定就是因果关系,也可能就是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

秩相关得应用适用范围(简答)

秩相关,又称等级相关(rank correlation),就是用双变量等级数据作直线相关分析,适用于下列资料:

⒈不服从双变量正态分布而不宜作积差相关分析;

⒉总体分布型未知;

⒊用等级表示得原始数据。

相关与回归得区别与联系(简答)

区别:

1、意义:相关反映两变量得相互关系,即在两个变量中,任何一个得变化都会引起另一个得变化,就是一种双向变化得关系。回归就是反映两个变量得依存关系,一个变量得改变会引起另一个变量得变化,就是一种单向得关系。

2、应用:研究两个变量得相互关系用相关分析。研究两个变量得依存关系用回归分析。

3、研究性质:相关就是对两个变量之间得关系进行描述,瞧两个变量就是否有关,关系就是否密切,关系得性质就是什么,就是正相关还就是负相关。回归就是对两个变量做定量描述,研究两个变量得数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

4、相关系数r与回归系数b :r与b得绝对值反映得意义不同。r得绝对值越大,散点图中得点越趋向于一条直线,表明两变量得关系越密切,相关程度越高。b得绝对值越大,回归直线越陡,说明当X变化一个单位时,Y得平均变化就越大。反之也就是一样。

联系:

1、 r与b值可相互换算;

2、 r与b正负号一致;

3、 r与b得假设检验等价;

4、回归可解释相关。相关系数得平方r2(又称决定系数)就是回归平方与与总得离均差平方与之比,故回归平方与就是引入相关变量后总平方与减少得部分。

回归系数得估计原则:最小二乘(least squares)原则(填空)

应用直线回归时得注意事项(简答)

应用直线回归时得注意事项:

1、作回归分析要有实际意义,不能把毫无关联得两种现象作回归分析,必须对两种现象间得内在联系有所认识。

2、在进行直线回归分析之前,应绘制散点图,当观察点得分布有直线趋势时,才适宜作直线回归分析,散点图还能提示资料有无异常点。异常点得存在往往对方程中得系数(a、b)得估计产生较大影响。因此,需对异常点进行复查。

3、建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。

4、直线回归方程得适用范围一般以自变量得取值范围为限,避免外延。获得自变量值得手段也应与建立方程时相同。否则会产生较大偏差。

《教育统计学》超详细知识点及重点笔记

华东师大心理统计学大纲 教材:《教育统计学》 第一章绪论 第一节什么是统计学和心理统计学 一、什么是统计学 统计学是研究统计原理和方法的科学。具体地说,它是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。 统计学分为两大类。一类是数理统计学。它主要是以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。它是数学的一个分支。另一类是应用统计学。它是数理统计原理和方法在各个领域中的应用,如数理统计的原理和方法应用到工业领域,称为工业统计学;应用到医学领域,称为医学统计学;应用到心理学领域,称为心理统计学,等等。应用统计学是与研究对象密切结合的各科专门统计学。 二、统计学和心理统计学的内容 统计学和心理统计学的研究内容,从不同角度来分,可以分为不同的类型。从具体应用的角度来分,可以分成描述统计,推断统计和实验设计三部分。 1.描述统计 对已获得的数据进行整理、概括,显示其分布特征的统计方法,称为描述统计。 2.推断统计 根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。推断统计的内容包括总体参数估计和假设检验两部分。 3.实验设计 实验者为了揭示试验中自变量和因变量的关系,在实验之前所制定的实验计划,称为实验设计。其中包括选择怎样的抽样方式;如何计算样本容量;确定怎样的实验对照形式;如何实现实验组和对照组的等组化;如何安排实验因素和如何控制无关因素;用什么统计方法处理及分析实验结果,等等。 以上三部分内容,不是截然分开,而是相互联系的。 第二节统计学中的几个基本概念 一、随机变量 具有以下三个特性的现象,成为随机变量。第一,一次试验有多中可能结果,其所有可能结果是已知的;第二,试验之前不能预料哪一种结果会出现;第三,在相同的条件下可以重复试验。随机现象的每一种结果叫做一个随机事件。我们把能表示随机现象各种结果的变量称为随机变量。统计处理的变量都是随机变量。 二、总体和样本 总体是我们所研究的具有共同特性的个体的总和。总体中的每个单位成为个体。样本是从总体中抽取的作为观察对象的一部分个体。当总体所包含的个数有限时,这一总体称为有限总体。而总体所包含的个数无限时,则称为无限总体。样本中包含的个体数目称为样本的容量,一般用n来表示。一般来说,样本中个体数目大于30称为大样本,等于或小于30称为小样本。在对数据进行处理时,大样本和小样本所用的统计方法不一定相同。 三、统计量和参数

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学教学大纲

医学统计学教学大纲 一、课程的性质、任务 《医学统计学》是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。科技的迅速发展,大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理,医学统计分析是医学生教育培训必修课程,特别是中、高级医学人才的培养,应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法,能正确处理医学信息和数据,在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。 (本大纲规定教学时数为62学时,理论讲授38学时,实习或讨论24学时) 二、课程教学目标 本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后,再通过本课程的学习使学生理解和知道随着现代医学的发展,正确地运用统计学方法和理念,进行实验设计和实验数据处理,系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平,具有十分重要的实际意义。 大纲中应当体现理论联系实际的原则,教学过程中完全采用医学中的实例,讲述基本概念及基本原理,注意贯彻启发式教学原则,把统计思维方法的训练作为课堂教学的内容,对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项,不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论,使学生熟悉统计的基本理论、掌握统计方法的应用,通过课后复习、完成作业,加深对基本理论和基本概念的理解,进一步掌握基本方法。理论讲授38学时,实习或讨论24学时 【教学内容分作三级要求】 第一级是学生必须掌握的内容,教师应于理论课详细讲授,亦为实习课与考试的重点。 第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。 第三级为一般了解内容,供学有余力的学生自学,教师亦可选择性讲授,但不在考试范围内。 三、教学内容和要求

医学统计学学习笔记

医学统计学学习笔记 第一章绪论 冉美岭康复0931班学号0926043120 1、医学统计学:是运用数理统计、概率论的原理和方法于医学科研和实践,研究医学资料和信息的收集、整理和分析的一门应用科学。统计方法的两个特点:用数量反映质量,利用样本推断总体。 2、医学统计学的意义:为了预防疾病,研究病因,促进健康,必须运用医学统计学方法透过偶然现象来探其规律性,得出科学推断。 3、总体:是根据研究目的所确定的同质的研究对象的全体。 4、样本:是根据随机的原则从总体中抽出有代表性的一部分观察单位。 5、描述总体特征的有关指标称为参数:如总体平均数、总体标准差、总体率等。 6、反映样本特征的有关指标称为统计量:如样本均数、样本标准差、样本率等。 7、抽样误差是不可避免的,一般来说,样本越大则抽样误差越小,越和总体的情况相接近,用样本推断总体的精确度越高,反之亦然。 8、随机化:是抽样研究和抽样分配时十分重要的原则。具有代表性、随机性、独立性、可比性。 9、概率:是描述某事件发生的可能性大小的一个量度。 10、医学统计资料的类型:①计量资料:是对每个观察单位用定量方法测定某项指标量的大小,一般有度量衡单位。②计数资料:是将观

察单位按某种属性或类别分组,所得各组的观察单位数,没有度量衡单位。③等级资料:是将观察单位按某种属性的不同程度分组,所得各组的观察单位数。 11、医学统计工作的基本步骤:①统计设计②搜集资料③整理资料④分析资料 第二章计量资料的统计描述 1、计量资料的统计描述分为两个方面:集中趋势、离散趋势 2、频数表:是一种统计表:即同时列出观察值的可能取值及其出现的频数。 3、频数表的编制步骤:①计算全距R=X max—X min ②确定拟分组数(k)和组距(i),根据全 距的大小和组段数来计算组距i= R K ③划分组段:划分组段的基本要求是第一个组段应包括最小值,最后一个组段应包括最大值。各组段只包含下限值但不包含上限值,故在列组段时只列出下限值,不列出上限值,但最后一个组段要依据具体情况进行封口,即要同时列出下限值和上限值。④画记并列出频数表 4、可以根据各组段的频数绘制直方图,即频数分布图。从图中可以看出①对称分布:频数集中位置在正中,左右两侧频数分布大体对称②偏态分布:集中位置偏向一侧,频数分布不对称(又分为正偏态分布、负偏态分布) 5、描述计量资料集中趋势的统计指标常用有平均数,分为三种:算

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

(完整word版)医学统计学 重点 终极笔记

Medical Statistics 【Introduction】 医学统计工作的内容 ⒈实验设计:最关键、最重要 ⒉收集资料:最基础 [原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表 质量控制:精度和偏倚 ⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表) ⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 资料的类型 ⑴计量资料:定量方法测定数值大小所得的资料 ⑵计数资料:按性质或类别分组,然后计数 ⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示) 变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异 总体:同质的个体所构成的全体。 [同质性,大量性,差异性] 样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。 样本包含的个体数目称为样本含量 样本的特征:⑴代表性 ⑵随机性 ⑶可靠性 *抽样的要求:代表性,随机性,可靠性,可比性 完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量 不宜相差太大。 随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个 “配伍组”,包含多个受试对象,要将它们分别随机分到各处理 组中。 误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差 ⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌 握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。 ⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然 因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。 没有固定的倾向,时高时低;应采取措施加以控制。

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

课堂笔记——医学统计学

第一章医学统计中的基本概念 一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data) 二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异 三、总体(population)和样本(sample):总体是同质的个体所构成的全体。从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。 四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 五、误差:①系统误差(system error)②③ 六、概率(probability):是描述某一件事发生的可能性大小的一个量度。习惯将P≤0.05或P≤0.01的事件称为小概率事件 第二章集中趋势的统计描述 一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。 二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。②用途:作为陈述资料的形式,可以代替原始资料,便于进一步分析;便于观察数据的分布类型;便于发现资料中某些远离群体的特大或特小的可疑值;当样本含量比较大时,可用各组段的频数作为概率的估计值。 三、平均数(average):是描述一组观察值集中位置或平均水平的统计指标,它常作为一组数据的代表值用于分析和进行组间的比较。 平均数优点缺点使用数据 算术平均数考虑每个观察值受到极值影响适用于正态或近似对称分布的资料 几何平均数取对数后正态或者 对称资料的描述不能有0或负数观 察值 对数正态分布或者取对数后呈对 称分布的资料 中位数稳定不利于进一步计算偏态分布两端无确定值Measures of Central Tendency:Mean and Median One of the most important numerical measures is a measure of center-a measure along the horizontal axis that location or center of the distribution.

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用 锦州医学院教务处 2003年5月

《流行病学》教学大纲 适用专业: 临床医学 总学时:24,其中理论学时:18、实验学时:6 一、课程的性质和任务 流行病学(Epidemiology)是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来,随着危害人类生命和健康疾病谱的变化,随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变,流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止,比较一致认可的流行病学定义为:流行病学是研究人群中疾病与健康状态的分布及其影响因素,制定和评价预防、控制和消灭疾病的对策和措施,并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病,又从疾病扩大、引伸到健康和与健康有关的事件;研究内容既包括了描述“分布”,分析“决定因素”,又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学,又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。 通过本课程的教学使学生掌握流行病学的基本原理、方法和技能,拓宽学生的思路,开阔学生的视野,提高学生能够应用流行病学方法,在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力,为今后从事疾病预防和控制工作打下基础。 二、相关课程的衔接 本门课程的前继课程是:基础医学相关课程、计算机基础和医学统计学。 三、教学的基本要求 教学目的 培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为学习预防医学各类卫生专业课程奠定流行病学理论基础,也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。 教学要求 1、基本理论理论课教学要根据教学大纲的要求,重点突出教授基本理论和基本知识,详细讲授和解释,同时注意教授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。内容精练,条理清楚,合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学复习笔记

统计 1.统计工作步骤:研究设计、收集资料、整理资料、分析资料。 2.定量资料:以定量值表达每个观察单位的某项观察指标,如血脂、心率等,各观察值间只有量的差别,有连续性。 3.定性资料:以定性方式表达每个观察单位的某项观察指标,如血型、性别等,各观察值间有质的区别,无连续性。 4.等级资料:以等级方式表达每个观察单位的某项观察指标,如疗效等级,各观察值间有质的区别,无数值大小 5.总体:是指按照研究目的所确定的研究对象中所有观察单位某项指标取值的集合。分为有限和无限两种。 6.样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。7.同质性:同一总体或其样本的观察单位在取值方面必须有相同的性质,称为同质性。8.描述某总体特征的指标称为参数;描述样本特征的指标称为统计量。 9.概率:是指随机事件发生的可能性的大小的一个度量,常用P表示,其小于等于0.05时称为小概率事件。 10.变异:是以具有统治性的观察单位为载体,某项观察指标在其观察单位之间现实的差别。包括同质事物间的、不同观察单位间的、同一单位不同阶段的差别。 11.整理数据最有效的形式是频数分布,根据频数分布可以初步判断指标分布的特征是集中趋势还是离散趋势,发现某些特大或特小的可疑值,揭示资料分布类型,便于资料进一步分析。 12.频数分布分为对称分布和非对称分布,非对称分布又称为偏态分布,包括正偏态(大——小)和负偏态(小——大)。 13.集中趋势指标:1)算术均数(Xbar),最适合单峰对称资料;2)几何均数(G),如抗体滴度、细菌计数,应用于等比数列、对数数列;3)中位数(M)和百分位数,适用于偏态分布、开口资料、分布不明资料。 14.离散趋势指标:1)全距(R),又称极差,极差大说明变异度大;2)四分位间距;3)方差和标准差(s),标准差大离散程度大,及波动明显;4)变异系数CV=标准差/均数,可应用于单位不同的两组资料或均数相差悬殊的两组资料。 15.数据集中,变异度小则均数代表性好;否则反之。常用均数和标准差描述正态分布资料;用中位数和四分位间距描述偏态分布资料。 16.相对数作用:1)表示事物出现的频率;2)便于比较。常用的相对数有:率、构成比、相对比。 17.率和构成比的区别和联系: 率构成比 概念发生的强度或频率各组成部分所占的比重 强调点随机发生的事件各部分的构成 资料获得较难容易 特点不一定合计为1 18.正态分布:以均数为中心,成对称钟形分布,均数是位置参数,均数越大向右移; 标准差是形态参数,标准差越大越矮胖。用于定量资料。 19.标准正态分布:N(0,1) 20.二项分布用于定性资料,当给定样本含量n时,形态取决于π,当π=0.5时分布

医学统计学考试重点

医学统计学考试重点Prepared on 21 November 2021

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

徇证医学笔记(王泓午讲)

徇证医学 第一讲: EBM(维基百科) 基于证据的临床医学实践基础医学 临床医学 预防医学 一定义:徇证医学是一种理念,它是指用当前所能获得的最好的证据进行科学决策的医学实践过程。它是一种思维模式,也是一种流程。因此也可称为“徇证医学实践过程”。二发展:第一阶段:如何检索文献,找到你所能用的东西 第二阶段:系统综述 MET分析 第三阶段:应用于公共卫生服务,应用于决策 实践 三EBM临床实践基础:医生、病人、最佳证据、医疗环境 古典现今能拿到 历史 医循证临床实践示意图疗 临床医生 最佳证据病人 临床循证实验 环疗效评价境 四认知误区:1、系统综述 2、MET分析 3、临床随机对照试验 五徇证医学实践类别:

证据分类与分级 一分类 (一)按研究设计方案分:1.按方法学分类观察法:研究者不能控制被研究对象 实验法:实验者、研究者可以控制被研究对象 2.按时间分类原始研究 二次研究 …… (二)按研究问题分 1.病因学研究 2.诊断性试验研究 3.治疗措施 4.预后研究 二分级 第三讲: 一检索(user): 循证资源的5S模型 尖:证据系统 system——Map of Medicine 综合证据 summaries——Clinical Evidence 证据概要 synopsis——EBM Review 系统综述 synthesis——Cochrane Library 底:原始研究 studies——MEDLINE CNKI 二提出临床问题:→检索证据决策 Key PICO:P:population/participants I:intervention/exposure C:comparation/control O:outcome

相关文档
相关文档 最新文档