文档视界 最新最全的文档下载
当前位置:文档视界 › 统计学方法在实验设计中的基本原则与应用

统计学方法在实验设计中的基本原则与应用

统计学方法在实验设计中的基本原则与应用
统计学方法在实验设计中的基本原则与应用

统计学方法在实验设计中的基本原则与应用

摘要:统计学是保证医学研究顺利进行的重要工具,在实验设计、资料收集及数据分析等方面有着广泛地应用。正确应用统计学方法对于有效开展科学研究和提高医学科技论文学术质量有着极其重

要的意义和作用。在实验设计中应遵循统计学的基本原则,即随机、对照、重复、均衡等四个原则。实验设计中如果在这四个基本原则上出问题,其结论很可能就是错误的。本文阐述了在医学实验中运用统计学方法应遵循的原则,并对实际的例子进行分析,并提出注意事项。

关键词:统计学实验设计设计原则

统计学上通过合理的实验设计既能获得实验处理效应与实验误

差的无偏估计,也能控制和降低随机误差,提高实验的精确性。在实验设计时,必须遵循重复、对照、随机及均衡的基本原则。

一、重复原则

重复是指实验中同一处理实施在两个或两个以上的实验单位上。在动物实验中,一只动物可以构成一个实验单位,有时一组动物也可构成一个实验单位。设置重复主要在于估计和降低实验误差。

由于样本标准误与标准偏差的关系是:,实验重复次数增多可以降低实验误差。但在实际应用时,初始条件不易控制一致即使重复数太多,未必能降低误差。重复次数要根据实验要求和条件而定,若供试个体间差异较大,重复数应多些;差异较小,重复数可少些。

二、随机原则

随机是指在选取样本时,确保总体中任何个体都有同等的机会被抽取进入样本;在对受试对象进行分组时,确保样本中任何个体都有同等的机会被分到任何一个组中,避免实验人员主观倾向的影响,是排除非实验因素干扰的重要手段,以获得无偏的误差估计量。随机化方法应使各组受试对象在重要的非实验因素方面具有极

好的均衡性,以及提高实验资料的可比性。如“小剂量干扰素与三氮唑核苷联合治疗流行性乙脑”实验中,在一般治疗基础上加用小剂量干扰素及三氮唑核苷,采用同期接受一般治疗的48例乙脑患者作为对照。两组患者均采用传统方法对症治疗,治疗组在此基础上选择发病在5天以内的患者,加用干扰素和三氮唑核苷静滴。结论是:两组比较疗效差异有显著意义。

三、对照原则

对照就是指在实验中设置与实验组相互比较的对照组,然后给与不同的处理,分析比较结果。对照组有多种形式:自身对照(处理前、后对照)、完全随机对照(空白对照、相互对照、实验对照、标准对照)、历史对照等。实际研究中,往往多种对照形式同时运用。

常出现的错误如对照不全,就是有些实验组有相对应对照组,而另一些实验组却缺乏相对应对照组。如,研究活血化瘀配伍补肾中药978-1对小鼠放射性脑损伤的作用及分子机制时,以20 gy电子

线(10mev)照射小鼠全脑建立动物模型,随机分为“中药+照射组”、“单纯照射组”、“对照组”,采用跳台法测定小鼠第1次受电击的潜伏期。得出的结论为“活血化瘀配伍补肾中药978-1具有防止学习记忆力放射性损伤的作用”。

四、均衡原则

均衡是指某因素各水平组中受试对象所受到的非实验因素影响

是完全平衡的,即这些组之间的差别完全是由于该因素采取了不同水平所致,并非其他因素取值不同所造成的影响。均衡原则可确保实验因素各水平组间不受其他实验因素或重要的非实验因素的不

平衡所干扰,使在考察的实验因素取不同水平条件时,观测结果所受的影响能够真实地显露出来。

在研究“0~7岁健康儿童血清透明质酸(ha)水平与年龄关系”的实验中,测得668名健康儿童血清ha的含量,得出其与年龄之间呈密切负相关的关系,r=-0.8169,p<0.01(表1)。

实验样本总量较大(668名),但各组样本含量差异很大,7岁健康儿童数是新生儿的7倍,违反了均衡性原则,应该使各年龄组的例数达到基本均衡。另外,没有理由保证除“年龄”因素外,其他因素不会对ha有影响,且年龄大的儿童有较多机会接触其他危险因素,可能导致ha数值降低,组间的不均衡性可能增大;在对数据进行统计处理时,还应使用原始数据直接进行统计分析,不应分组后再做分析,因为可能会丢失部分重要信息。

实验设计的统计学基本原则

第十一章实验设计的统计学基本原则 实验(Experiment):指由研究者主动地决定给予部分实验对象某种处理,给予另部分对象某种对照处理的研究设计形式,这种处理的分配常常是随机的。 实验设计(Experimental design):是通过良好地计划对象的选择、处理因素的分配、结果指标的测量和资料分析来保证比较组间对象和实验条件是均衡的,实验结果有较好的可比性,并且较好地控制误差以能用较小的样本获取可靠的结论。 一.实验设计的三要素:受试对象、处理因素和实验效应。 1.处理因素(treatment):根据研究目的,对受试对象施加的某种措施,称为处理因素。 注意:①抓住主要因素。 ②控制混杂因素(“非处理因素”在各组中应尽可能相同)。 ③标准化(处理因素应该标准化,即研究过程中处理应该自始至 终保持一致,不能因任何原因中途改变。)

2.受试对象(subject):动物——种类,品系,窝别 人——诊断,依从性 注意受试对象的同质性 (homogeneity) 3.实验效应(effect): 指标选择:有效,客观,灵敏,精确。(头痛,发烧) 指标观察:对人的观察应注意避免偏性,提倡盲法。 主观指标的量化:如划记评分。 完全不满意完全满意 0 1 2 3 4 5 6 7 8 9 10 二.实验研究的分类:根据实验的对象不同,实验分成三类。 1. 动物实验(animal experiment) 2. 临床试验(Clinical trial) 3. 现场干预试验(Intervention trial)

三.实验中的变异及其来源: 在实验中,由于实验对象自身特点、实验条件的变化和实验结果测量的不确定性造成实验结果与真值的差别称实验误差,根据统计分析上的处理不同,实验误差分成两类: 1. 随机误差:由大量、微小的、偶然的因素的共同作用引起的不易控制的误差称随机误差。如在实验中,温度、湿度、风向、振动、试剂、仪器、操作员等都可能造成结果的偏差。 随机变异是没有倾向性的,在大量观察条件下,随机误差的分布呈标准N。随机误差的规律可以用统计方法分析。 正态分布()1,0 2.系统误差(systematic error):由于在对象选择、处理因素分配的不随机、测量结果的不准确造成实验结果有倾向性地偏离真值称系统误差,或称偏倚(bias)。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

医学统计学习题

第一章绪论习题一、选择题 1.统计工作和统计研究的全过程可分为以下步骤: A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2. 在统计学中,习惯上把()的事件称为小概率事件。 A. P 0.10 D. P 0.05 B. P 0.05或P E. P 0.01 0.01 C.P 0.005 3?8 A. 计数资料 B.等级资料C?计量资料 D. 名义资料 E.角度资料 3. 某偏僻农村144 名妇女生育情况如下:0 胎5 人、1 胎25 人、2 胎70 人、3 胎30 人、4胎14 人。该资料的类型是()。 4. 分别用两种不同成分的培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录 48 小时各实验单元上生长的活菌数如下,A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是()。 5. 空腹血糖测量值,属于()资料。 6. 用某种新疗法治疗某病患者41 人,治疗结果如下:治愈8 人、显效23 人、好转6 人、恶 化 3 人、死亡 1 人。该资料的类型是()。 7. 某血库提供6094 例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是()。 8. 100 名18 岁男生的身高数据属于()。 二、问答题 1.举例说明总体与样本的概念 2.举例说明同质与变异的概念 3.简要阐述统计设计与统计分析的关系 一、选择题 1. D 2.B 3.A 4. C 5.C 6.B 7.D 8.C 二、问答题 1.统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951 年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。

实验设计的统计学基本原则

第十一章实验设计的统计学基本原则 实验(Exper iment):指由研究者主动地决定给予部分实验对象某种处理, 给予另部分对象某种对照处理的研究设计形式,这种处理的分配常常是随机的。 实验设计(Experimental design):是通过良好地计划对象的选择、处 理因素的分配、结果指标的测量和资料分析来保证比较组间对象和实验条件是均衡的,实验结果有较好的可比性,并且较好地控制误差以能用较小的样本获取可靠的结论。 一.实验设计的三要素:受试对象、处理因素和实验效应。 1 -处理因素(treatment):根据研究目的,对受试对象施加的某种措施, 称为处理因 素。 注意:①抓住主要因素。 ②控制混杂因素(“非处理因素”在各组中应尽可能相同)。 ③标准化(处理因素应该标准化,即研究过程中处理应该自始至 终保持一致,不能因任何原因中途改变。)

2.受试对象(subject):动物 ---------- 种类,品系'窝别 人——诊断,依从性 注意受试对象的同质性(homogene i ty) 3.实验效应(effect): 指标选择:有效,客观,灵敏,精确。(头痛,发烧) 指标观察:对人的观察应注意避免偏性,提倡盲法。 主观指标的量化=如划记评分。 实验研究的分类:根据实验的对象不同,实验分成三类。 1.动物实验(animal experiment) 2?临床试验(Clinical trial) 3.现场干预试验(Intervention trial) 三.实验中的变异及其来源: 在实验中,由于实验对象自身特点、实验条件的变化和实验结果测量的 不确定性造成实验结果与真值的差别称实验误差,根据统计分析上的处理不 同,实完全不满意 I I I I I I I I I I I 完全满意 0 1 2 3 4 5 6 7 9 10

卫生统计学试卷(附答案)

2004~2005学年第(1)学期预防医学专业本科 期末考试试卷 (卫生统计学课程) 姓名____________________ 班级____________________ 学号____________________ 考试时间:200 年月日午 —(北京时间)

一、选择题(每题1分,共60分) 1、A1、A2型题 A. 48.0 B. 49.0 C. 52.0 D .53.0 E.55.0 2. 比较7岁男童与17岁青年身高的变异程度,宜用: A. 极 差 B. 四分位数间距 C. 方差 D. 标准差 E. 变异系数 3. 根据观测结果,已建立y 关于x 的回归方程? 2.0 3.0y x =+,该回归方程表示x 每增加1个单位,y 平均增加几个单位? A. 1 B. 2 C. 3 D. 4 E.5 4. 设从 5.11=μ的总体中作五次随机抽样(n =5),问哪一个样本的数据既精确又准确? A. 8,9,10,11,12 B. 6,8,10,12,14 C. 6,10,12,14,18 D. 8,10,12,14,16 E. 10,11,12,13,14 5. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制 A.散点图 B. 直条图 C. 百分条图 D. 普通线图 E. 直方图 6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为 A. 0.913 B. 0.087 C. 0.230 D.0.317 E. 以上都不对 7.二项分布、Poisson 分布、正态分布各有几个参数? A. 1,1,2 B. 2,1,2 C. 1,2,2 D. 2,2,2 E. 1,2,1 8. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为: A. 18 B. 9 C. 3 D. 81 E. 27 9. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的? 相关系数越大,回归系数也越大。 相关系数与与回归系数符号一致。 相关系数的t r 等于回归系数的t b 。 相关系数描述关联关系,回归系数描述因果关系。 A.1句 B.2句 C. 3句 D. 4句 E. 0句 10.下列四句话有几句是正确的? 标准差是用来描述随机变量的离散程度的。 标准误是用来描述统计量的变异程度的。 t 检验只用于检验两样本均数的差别。 χ2可用来比较两个或多个率的差别。 A. 0句 B. 1句 C. 2句 D. 3句 E. 4句

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

医学统计工作的基本步骤

*医学统计工作的基本步骤 1设计主要指统计设计,是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。内容包括对资料搜集,整顿和分析全过程的设想与安排。实验设计的三大原则:随机化,重复,对照。 2搜集资料:目的指应采取措施使能取得准确可靠的原始数据。来源:统计报表,工作记录,专题调查或实验研究,统计年鉴和统计数据专辑。要求:随机性和样本含量足够大 3整顿资料:将原始数据净化,系统化和条理化,为下一步计算和分析打好基础过程。 4分析资料:在表达数据特征的基础上,阐明事物的内在联系和规律性,包括两方面:统计描叙和统计推断 17均数的可信区间与参考值范围的区别?均数的可信区间与参考值范围的区别主要体现在含义,计算公式和用途三个方面的不同。(1)意义:均数的可信区间是按预先给定的概率,确定的未知参数的可能范围。实际上一次抽样算得的可信区间要么包含了总体均数,要么不包含。但可以说:该区间可多大(如当a=0.05时为95%)的可能包含了总体均数。而参考值范围是指‘正常人’的解剖,生理生化某项指标的波动范围。均数的可信区间计算公式(1)σ未知:X±指均数可信区间的用途:估计总体均数,参考值范围是指判断观察对象的某项指标是否正常。 7.假设检验与区间估计的关系:置信区间具有假设检验的主要功能;置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义;假设检验可以报告确切的P值,还可以对检验的功效做出估计。 1.标准差与标准误的区别:标准差是衡量观察值的离散趋势,描述正态分布资料的频数。标准误是样本均数的变异程度,表示抽样误差的大小,用于总体均数区间估计。两者联系:两者都是变异指标。在样本含量一定时,S越大标准误也越大,即在抽取相同例数的前提下,标准差越大,抽到的样本均数的抽样误差也越大。 2.P值和α:P值时从样本求得H0条件下随机抽样得到目前的统计量以及更极端统计量的概率,反映样本信息是否支持H0,也反映做出拒绝或不拒绝H0决定的理由充分程度。α时人为确定的小概率,容许犯第二类错误的概率,用作门槛,称检验水平。在假设检验中,通常时将P与α对比来得到结论,。 3.标准正态分布与t分布有何不同:t分布为抽样分布,标准正态分布为理论分布。t分布比标准正态分布的峰值低,且尾部瞧得更高。随着自由度的增大,t分布逐渐趋于标准正态分布。当自由度趋于无穷大时,t分布趋近于标准正态分布。 4.假设检验中,当P<0.05时,拒绝H0的理论依据。P值是指从H0规定的总体随机抽得等于及大于现有样本获得的检验统计量值的概率。当P<0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小怪绿时间标准的0.05。因小概率事件在一次试验中几乎不可能发生,现的确发生了,说明现在样本信息不支持H0,所以怀疑原假设H0不成立,拒绝H0。 5.t检验应用的条件:对单样本t检验要求资料服从正态分布;配对t检验要求差值服从正态分布;对两样本t检验则要求数据均服从正太分布,且两样本对应的两总体方差相等。 6.I型错误和Ⅱ型错误得区别与联系:I型错误是指拒绝了实际成立的H0所犯的弃真的错误,其概率大小用α表示,Ⅱ型错误是指接受了实际上不成立的H0所犯的取伪错误,其概率用β表示。当样本含量N确定时,α越小β越大,反之,α越大β越小。了解这两类错误的实际意义在于,若在应用中要重点减少α,则取α=0.05;若要在应用中要重点减少β,则取α=0.10或-。20甚至更高。 7.假设检验和区间估计有何联系:假设检验用于推断质的不同即判断两个或多个总体参数是否不等,而可信区间用于说明量的大小即推断总体参数的范围。两者有联系也有区别,假设检验与区间估计的联系在于可信区间也可以回答假设检验的问题,若算得的可信区间若包含了H0,则按α水准,不拒绝H0,若不包含H0,则按照α水准,拒绝H0,接受H1。也就是说在判断两个总体参数不等时,假设检验和可信区间时完全等价的。 1.方差分析的基本思想和应用条件是什么。方差分析的基本思想时根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的编译可由某个因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。应用条件:各样本是互相独立的随机样本,均服从正态分布;相互比较的各样本的具有方差齐性。

医学统计学重点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

实验设计与统计分析

填空题 1.数据资料按其性质不同各分为资料和资料两种。 2.有共同性质的个体所组成的集团称为。从总体中抽取部分个体进行观测,用以估计总 体的一般特性,这部分被观测的个体总称为。 3.由总体中包含的全部个体求得的能够反映总体性质的特征数称为;由样本的全部观察 值求得的用以估计总体参数的特征数叫。 4..试验误差可以分为误差和误差两种类型。 5.从总体中抽取的样本要具有代表性,必须是抽取的样本。 6.样本根据样本容量的多少可以分为和。 8.小麦品种A穗长的平均数和标准差值为12cm和3cm,品种B为18cm和3.5cm,根据__________,判断品种______的 该性状变异大。 9.某海水养殖场进行贻贝单养和贻贝与海带混养的对比试验,收获时各随机抽取抽取50绳测其毛重,结果如下所示: 平均数X(kg)极差R(kg)标准差S(kg)变异系数CV% 贻贝单养42.70307.0816.58贻贝与海带混养52.1030 6.3412.16根据和,判断的效果好。 10.在统计学中,常见平均数主要有和。 11. 12. 13. 14. 15. 16. 17. 简答题 1.如何控制、降低随机误差,避免系统误差? 2.什么是准确性,精确性?如何提高试验的正确性? 3.统计表与统计图有何用途?常用统计图、统计表有哪些? 4.生物统计学中常用的平均数有几种?各在什么情况下应用? 5.为什么变异系数要与平均数、标准差配合使用? 多选题 1.下列总体中属于有限总体的是()。 A 保定地区棉田中棉铃虫的头数 B 20m2的试验小区中鲁玉4号玉米的株高 C 66.7万公顷鲁玉4号玉米的株高 D 320株水稻中糯稻的株数 2.下列数据资料中属于连续型变数资料。

(完整版)卫生统计学知识点总结

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 指标频率型指标强度型指标相对比型指标 两个有关联的指标A和B之比概念近似反映某一时间出现概率单位时间内某现象的发 频率 计算 A/B 公式 无有可有、可无 有无 量纲 取值 【0,1】可大于1 无限制 范围 表示相对于B的一个单位,A有多少本质大样本时作为概率近似值频率强度,即概率强度的

卫生统计学复习题

卫生统计学复习题 选择题 一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。(1′) 1、统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后,δ越大,则正态曲线: A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是: A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于: A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料: A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用: A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料,求得的几何均数与算术均数: A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数,也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后: A.x不变,CV变 B. x变或CV变 C. x不变,CV不变 D. x变,CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是: A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1;也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布,拟用300名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: A. x+ (x lgx+ C. x± =L+i/f99(300*99/100-f L) E. lg-1(x lgx+ 15、_______小,表示用该样本均数估计总体均数的可靠性大。 C.σx E.四分位数间距 16、两样本均数比较时,分别取以下检验水准,以_______所对应的第二类错误最小。 A.α= B.α= C.α= D. α= E. α= 17、方差分析中,当P﹤时,结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中,按α=水准,认为总体服从正态分布,此时若推断有错,此错误的概率为__________。

统计学实验心得体会讲课稿

[标签:标题] 篇一:统计学实验心得体会 统计学实验心得体会 为期半个学期的统计学实验就要结束了,这段以来我们主要通过excl软件对一些数据进行处理,比如抽样分析,方差分析等。经过这段时间的学习我学到了很多,掌握了很多应用软件方面的知识,真正地学与实践相结合,加深知识掌握的同时也锻炼了操作能力,回顾整个学习过程我也有很多体会。 统计学是比较难的一个学科,作为工商专业的一名学生,统计学对于我们又是相当的重要。因此,每次实验课我都坚持按时到实验室,试验期间认真听老师讲解,看老师操作,然后自己独立操作数遍,不懂的问题会请教老师和同学,有时也跟同学商量找到更好的解决方法。几次实验课下来,我感觉我的能力确实提高了不少。统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。可见统计学的重要性,认真学习显得相当必要,为以后进入社会有更好的竞争力,也为多掌握一门学科,对自己对社会都有好处。 几次的实验课,我每次都有不一样的体会。个人是理科出来的,对这种数理类的课程本来就很感兴趣,经过书本知识的学习和实验的实践操作更加加深了我的兴趣。每次做实验后回来,我还会不定时再独立操作几次为了不忘记操作方法,这样做可以加深我的记忆。根据记忆曲线的理论,学而时习之才能保证对知识和技能的真正以及掌握更久的掌握。就拿最近一次实验来说吧,我们做的是“平均发展速度”的问题,这是个比较容易的问题,但是放到软件上进行操作就会变得麻烦,书本上只是直接给我们列出了公式,但是对于其中的原理和意义我了解的还不够多,在做实验的时候难免会有很多问题。不奇怪的是这次试验好多人也都是不明白,操作不好,不像以前几次试验老师讲完我们就差不多掌握了,但是这次似乎遇到了大麻烦,因为内容比较多又是一些没接触过的东西。我个人感觉最有挑战性也最有意思的就是编辑公式,这个东西必须认真听认真看,稍微走神就会什么都不知道,很显然刚开始我是遇到了麻烦。还好在老师的再次讲解下我终于大致明白了。回到寝室立马独自专研了好久,到现在才算没什么问题了。 实验的时间是有限的,对于一个文科专业来说,能有操作的机会不是很多,而真正利用好这些难得的机会,对我们的大学生涯有很大意义。不仅是学习上,能掌握具体的应用方法,我感觉更大的意义是对以后人生路的作用。我们每天都在学习理论,久而久之就会变成书呆子,问什么都知道,但是要求做一次就傻了眼。这肯定是教育制度的问题和学校的设施问题,但是如果我们能利用好很少的机会去锻炼自己,得到的好处会大于他自身的价值很多倍。例如在实验过程中如果我们要做出好的结果,就必须要有专业的统计人才和认真严肃的工作态度。这就在我们的实践工作中,不知觉中知道一丝不苟的真正内涵。以后的工作学习我们再把这些应用于工作学习,肯定会很少被挫 折和浮躁打败,因为统计的实验已经告知我们只有专心致志方能做出好的结果,方能正确的做好一件事。 最后感谢老师的耐心指导,教会我们知识也教会我们操作,老师总是最无私最和蔼的人,我一定努力学习,用自己最大的努力去回报。 篇二:统计学实验报告与总结

《卫生统计学》考试题及答案

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题 1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。

A .抽样时应使得总体中的每一个个体都有同等的机会被抽取 B .研究者在抽样时应精心挑选个体,以使样本更能代表总体 C .随机抽样即随意抽取个体 D .为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( B )。 A .均数不变,标准差改变 B .均数改变,标准差不变 C .两者均不变 D .两者均改变 7.比较身高和体重两组数据变异度大小宜采用( A )。 A .变异系数 B .方差 C .极差 D .标准差 8.以下指标中( D )可用来描述计量资料的离散程度。 A .算术均数 B .几何均数 C .中位数 D .标准差 9.血清学滴度资料最常用来表示其平均水平的指标是( C )。 A .算术平均数 B .中位数 C .几何均数 D .平均数 10.两样本均数的比较,可用( C )。 A .方差分析 B .t 检验 C .两者均可 D .方差齐性检验 11.配伍组设计的方差分析中,ν配伍 等于( D )。 A .ν总 -ν 误差 B . ν总-ν 处理 C .ν 总 -ν处理 +ν 误差 D .ν 总 -ν处理 -ν 误差 12.在均数为μ,标准差为σ的正态总体中随机抽样,≥-||μX ( B )的概率为5%。 A .1.96σ B .1.96X σ C .0.052,t s ν D. 0.052,X t S ν 13.完全随机设计方差分析的检验假设是( D )。 A .各处理组样本均数相等 B .各处理组总体均数相等 C .各处理组样本均数不相等 D .各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 A .分别进行比较 B .两个率比较的χ2检验

卫生统计学试题及答案(二)

卫生统计学试题及答案(二) 1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____. A.b无统计学意义 B.b有高度统计学意义 C.b有统计学意义 D.不能肯定b有无统计学意义 E.a有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是_____. A.符号秩和检验中,差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时,秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 【答案】B 3.随机事件的概率为______. A.P=1 B.P=0 C.P=-0.5 D.0≤P≤1 E.-0.5 【答案】D 4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 【答案】C 5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验 D.配对秩和检验 E.两组方差齐性检验 【答案】A 6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____. A.T值越大P值越小 B.T值越大越有理由拒绝H0 C.P值与T值毫无联系 D.T值越小P值越小 E.以上都不对

卫生统计学试题及答案1

一、选择题 1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<),则_____. 无统计学意义 有高度统计学意义 有统计学意义 D.不能肯定b有无统计学意义 有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是_____. A.符号秩和检验中,差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时,秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 【答案】B 3.随机事件的概率为______. =1

=- ≤P≤1 E.- < p=""> 【答案】D 4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 【答案】C 5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验

D.配对秩和检验 E.两组方差齐性检验 【答案】A 6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____. 值越大P值越小 值越大越有理由拒绝H0 值与T值毫无联系 值越小P值越小 E.以上都不对 【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体 【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。

实验设计与统计分析

实验设计 名词解释 总体:具有共同性质的个体所组成的集合体 样本:从总体中抽出一部分个体进行研究,这部分个体的总合称为样本或抽样总体 极差:资料中最大观察值与最小观察值的差值称为极差 方差:离均差平方的平均数称为方差 标准差:方差的正平方根称为标准差 变异系数:该样本的标准差对均数的百分数 频率:在大量重复试验中某一事件已发生的次数占试验总次数的比率称为频率 概率:描述随机事件出现的可能性大小的一个概念 频数:总体或样本中某观察值或某区间的观察值所出现的次数 频数分布:总体或样本中不同观察值或不同区间的观察值出现的次数组成的分布 抽样分布:研究从总体中独立抽取随机样本的统计数的概率分布 置信限:区间的上下限 置信概率(置信系数):保证合理误差范围的概率 因素:对某些事物的存在状况能够产生影响的其他事物 试验因素:人为控制该影响因素的变化状态,使其影响程度可以得到准确的测量或判断 不同水平:一个试验因素不同质或不同量的存在状态,叫试验因素的不同水平 试验处理:人为地使试验因素处于不同水平或试验因素不同水平的组合,称为试验处理 试验方案:同一试验所处理的总和称为试验方案 试验效应:指因素的相对独立作用,也就是因素对性状所引起的增加或减少作用 简单效应:在一种情况下因素的相对独立作用 主效应:同一试验中同一因素的简单效应平均值称为主效应 重复:同一处理在试验中出现的次数(重复具有降低试验误差,扩大试验的代表性;估计试验误差大小,判断试验可靠程度) 个体试验:同一内容的试验只在一两个不同的地点设置 群体试验:同一内容试验在有许多代表性的地点统一布置、统一方法、同时进行,这样的试验叫做群体试验 参数:能说明不同总体集中性和变异性特征的数值称总体特征数 匀地播种:在即将进行试验的土地上连续几茬播种密生植物以便均衡土壤肥力差异的方法。相关系数:对于坐标散点,显线性相关的两个变量,如果不需要由x预测y,只需要了解x 与y是否确定有相关系数,相关关系的密切程度如何,以及相关性质,则只需计算出一个新的统计量 简答题 1、正态分布的特点 答:正态分布是一种常见也是最重要的连续性随机变量的理论分布。其特点①以算术平均数u为轴点,左右对称②在x=u处,值最大,其算术平均数、中位数、众数相等,合并为一③正态分布的多数次数集中于算术平均数u附近,离平均数越远,其相应的次数越少④正态分布曲线在∣x-u∣≧ō处有拐点,曲线左右延伸⑤正态分布曲线与x轴之间的总面积等于 1. 2、试验研究一般程序 答:㈠选题确定试验研究的具体目标和任务㈡作好试验计划设计和确定完成试验任务的方法步骤(①设计试验方案②确定试验方法③制定管理措施④确定观察测定项目及其方法与

2019年卫生统计学考前复习综合测试卷及答案一

2010年卫生统计学考前复习综合测试卷及答案一 一、选择题 1.对两个定量变量同时进行了直线相关和直线回归分析,r有统计学意义(P<0.05),则_____. A.b无统计学意义 B.b有高度统计学意义 C.b有统计学意义 D.不能肯定b有无统计学意义 E.a有统计学意义 【答案】C 2.关于基于秩次的非参数检验,下列说法错误的是_____. A.符号秩和检验中,差值为零不参加编秩 B.两样本比较的秩和检验方法中的正态近似法为参数检验 C.当符合正态假定时,非参数检验犯II类错误的概率较参数检验大 D.当样本足够大时,秩和分布近似正态 E.秩和检验适用于检验等级资料、可排序资料和分布不明资料的差异 【答案】B 3.随机事件的概率为______. A.P=1 B.P=0 C.P=-0.5 D.0≤P≤1 E.-0.5 【答案】D 4.两样本均数比较,经t检验得出差别有统计学意义的结论时,P越小,说明______. A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E.越有理由认为两总体均数相同 【答案】C 5.为研究缺氧对正常人心率的影响,有50名志愿者参加试验,分别测得试验前后的心率, 应用何种统计检验方法来较好地分析此数据_____. A.配对t检验 B.成组t检验 C.成组秩和检验 D.配对秩和检验 E.两组方差齐性检验 【答案】A 6.作符号秩和检验时,记统计量T为较小的秩和,则正确的是_____. A.T值越大P值越小 B.T值越大越有理由拒绝H0

C.P值与T值毫无联系 D.T值越小P值越小 E.以上都不对 【答案】D 7.方差分析中要求______. A.各个样本均数相等 B.各个总体方差相等 C.各个总体均数相等 D.两样本方差相等 E.两个样本来自同一总体 【答案】B 8.比较非典型肺炎和普通肺炎患者的白细胞计数水平,若,可作单侧检验。 A.已知二组患者的白细胞计数均降低 B.已知二组患者的白细胞计数均升高 C.不清楚哪一组的白细胞计数水平有变化 D.已知非典型肺炎患者的白细胞计数不高于普通肺炎 E.两组白细胞计数值的总体方差不相等 【答案】D 9.计算某地儿童肺炎的发病率,现求得男、女童肺炎发病率分别为21.2%和19.1%,可认为______. A.男童的肺炎发病率高于女童 B.应进行标准化后再做比较 C.资料不具可比性,不能直接作比 D.应进行假设检验后再下结论 E.以上都不对 【答案】D 10.比较两个率时,不需要进行率的标准化的情况有______. A.内部构成不同 B.内部构成相同 C.未知各年龄别人口数 D.缺乏各年龄别死亡人数 E.不易寻找标准人口构成 【答案】B 11.四格表资料在哪种情况下作χ2检验不必校正______. A.T>1且n>40 B.T>5或n>40 C.T>5且n>40 D.1 E.T>5且n<40 【答案】C 12.欲比较三种药物的疗效(无效、好转、显效、痊愈)孰优孰劣,最好选择______. A.t检验 B.方差分析 C.χ2检验

相关文档
相关文档 最新文档