当前位置：文档视界 › 天津医科大学统计学试题

天津医科大学统计学试题

1.总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。

样本（sample）：从总体中随机抽取部分观察单位，其测量结果的集合称为样本。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。

2.随机抽样：（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

3.变异（variation）：在自然状态下，个体间测量结果的差异称为变异。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。

4.计量资料（measurement data）：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等

计数资料（count data）：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料（ordinal data）：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。

等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。

等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。

5．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。

6.随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

7．系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。

8．随机变量（random variable）是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。

9．参数（paramater）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。10．统计量（statistic）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。

11.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2…个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。

12.算术均数（arithmetic mean）描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。

13.几何均数（geometric mean）用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。

14.中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。

15.百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

16.极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。17.四分位数间距（inter-quartile range）是由第3 四分位数和第1 四分位数相减计算而得，常与中位数一起使用，描述偏态分布资料的分布特征，较极差稳定。18.方差（variance）：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

19.标准差（standard deviation）是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。

20.变异系数（coefficient of variation）用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算：标准差/均数*100%

21.统计推断（statistical inference）：通过样本指标来说明总体特征，这种从样本获取有关总体信息的过程称为统计推断。

22.抽样误差（sampling error）：由个体变异产生的，抽样造成的样本统计量与样本统计量及样本统计量与总体参数的差异，称为抽样误差，无倾向性，不可避免。

23.标准误（standard error of mean，SEM ）及X s：通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数的标准误，它反映了样本均数间的离散程度，也反映了样本均数与总体均数的差异，说明均数抽样误差的大小。

24.可信区间（confidence interval，CI）：按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间。它的确切含义是：可信区间包含总体参数的可能性是1- α，而不是总体参数落在该范围的可能性为1-α。

25.参数估计：指用样本指标值（统计量）估计总体指标值（参数）。参数估计有两种方法：点估计和区间估计。

26.假设检验中P 的含义：指从H0 规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。

27.I 型和II 型错误：I 型错误（type I error ），指拒绝了实际上成立的H0，这类“弃真”的错误称为I 型错误，其概率大小用α表示；II 型错误（type II error），指接受了实际上不成立的H0，这类“存伪”的误称为II 型错误，其概率大小用β表示。

28.检验效能：1- β称为检验效能（power of test），它是指当两总体确有差别，按规定的检验水准a 所能发现该差异的能力。

29.秩次（rank）：变量值按照从小到大顺序所编的秩序号称为秩次。30.秩和（rank sum）：各组秩次的合计称为秩和，是非参数检验的基本统计量。

31检验水准（level of a test）：是预先规定的，当假设检验结果拒绝H0，接受H1，下“有差别”的结论时犯错误的概率称为检验水准，记为α。

32..率（rate）又称频率指标，说明一定时期内某现象发生的频率或强度。计算公式为：发生某现象的观察单位数/可能发生某现象的观察单位总数*100%，表示方式有：百分率（%）、千分率（?）等。

33.构成比（proportion）又称构成指标，说明某一事物内部各组成部分所占的比重或分布。计算公式为：某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%，表示方式有：百分数等。

34.比（ratio）又称相对比，是A、B 两个有关指标之比，说明A 是B 的若干倍或百分之几。计算公式为：A/B ，表示方式有：倍数或分数等。

35.非参数统计：针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制，故称非参数统计法（non-parametric statistics），或称为不拘分布（distribution-free statistics）的统计分析方法，又称为无分布型式假定（assumption free statistics）的统计分析方法。

36.参数统计(parametric statistics)：通常要求样本来自总体分布型是已知的（如正态分布），在这种假设的基础上，对总体参数（如总体均数）进行估计和检验，称为参数统计

37.直线回归（linear regression）建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归（simple regression）。

38.回归系数（regression coefficient ）即直线的斜率(slope)，在直线回归方程中用b 表示，b 的统计意义为X每增（减）一个单位时，Y平均改变b 个单位。39.相关系数r：用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。

40系统误差：由受试对象.研究者.仪器设备.研究方法.非实验因素影响等确定性因素造成，有一定倾向性或规律性误差，可以避免。

41变异系数（coefficient of variation,CV）主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。

42等级资料（ordinal data）将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位称为等级资料，如患者的治疗结果可分为治愈，好转，有效，无效和死亡。

43随机误差（random error）：排除了系统误差后尚存的误差，受多种因素影响，是观察值不按方向性和系统性而随机的变化，误差变量一般服从正态分布，可以通过统计处理来估计，无倾向性，不可避免，只可控制在一定范围内。

44精密度（precision）指相同条件下对同一指标进行重复观察时，观察值与其均数的接近程度，沏茶之手随机误差的影响。

45准确度（accuracy）观察值与真值的接近程度，主要受系统误差的影响。

46灵敏度（sensitivity）反应其检出真阳性的能力，灵敏度高的指标能将处理因素的效应更好的显示出来。47特异度（specificity）反应其鉴别真阴性的能力，特异度高的指标不易受混杂因素的干扰。

48总变异：样本中全部实验单位的差异称为总变异，其大小可用全部观察值的均方表示。

组间变异：各处理组间观察值大小不等，这种变异称为组间变异，可用组间均方表示。

组内变异：各处理组内部观察值大小不等，这种变异称为组内变异，可用组内均方表示。

49拟合优度（Goodness of Fit）是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数（亦称确定系数）R。R的值越接近1，说明回归直线对观测值的拟合程度越好；反之，R的值越接近0，说明回归直线对观测值的拟合程度越差。

50二项分布（binomial distribution）在每次试验中只有两种可能的结果，而且是互相对立的，是独立的，与其它各次试验结果无关，结果事件发生的概率在整个系列试验中保持不变，发生阳性结果的次数x的概率分布称为二项分布。

1、描述集中趋势和离散趋势的指标的适用范围

（1）集中趋势：①算数均数：描述对称分布资料。

②几何均数：适用于观察值变化范围跨越多个等级的资料。③中位数：适用于各种分布的计量资料。

（2）离散趋势：①极差：各种分布的计量资料。②四分位数间距：适用于各种类型的连续型变量。③方差、标准差：适用于对称分布资料。④变异系数：适用于量纲不同的变量或者均数差别较大的变量之间变异程度的比较。

2、正态分布曲线的特点

正态曲线是（normal curve）一条高峰位于中央，两侧逐渐下降完全对称，曲线两端永远不会和横轴相交的钟形曲线。其特点有：（1）关于X=μ对称；（2）在X=μ初取得该概率密度曲线的最大值，在X=μ±σ处有拐点，表现为钟形曲线；（3）μ决定曲线在横轴的位置，μ增大，曲线右移，反之则曲线左移；（4）σ决定曲线的形状，当μ恒定时，数据越分散，曲线就越矮，σ越小，数据就约集中，曲线越高瘦。

3、可信区间与参考值范围的不同点。

应注意：可信区间与参考值范围的意义、计算公式和用途均不同。1.从意义和用途来看：95％参考值范围是指同质总体内包括95％个体值的估计范围，而总体均数95％可信区间是指按95％可信度估计的总体均数的所在范围。可信区间用于估计总体参数，总体参数只有一个。参考值范围用于估计变量值的分布范围，变量值可能很多甚至无限。

2.从计算公式看：若指标服从正态分布，95％参考值范围的公式是：±1.96s。

4、假设检验的注意问题：（1）要有严密的研究设计（2）不同变量或资料选用不同的检验方法；（3）正确理解显著性一词的含义；（4）做结论不能绝对化；（4）统计显著性对应于统计结论，医学临床生物学显著性对应于专业结论。

5．可信区间与假设检验的区别和联系

可信区间用于说明量的大小即推断总体均数的范围，而假设检验用于推断质的不同即判断两总体均数是否不同，两者相互联系又相互区别；可信区间亦可以回答假设检验的问题；可信区间比假设检验可提供更多的信息，但并不说明可信区间能够完全替代假设检验，可信区间只能在预先规定的概率----检验水准的前提下进行计算，而假设检验能够获得较为确切的P值，故两者结合起来才是完整的分析。

6、假设检验的基本原理和步骤。

假设检验基于反证法和小概率思想。（1）反证法，首先提出假设，用适当的统计方法确定假设成立的可能性大小，如果可能性小，则认为假设不成立，如果可能性大，还不能认为它成立；（2）小概率思想，是指小概率事件在一次随机实验中认为基本不会发生，在进行统计分析时要事先规定概率，即检验说准α。

假设检验的步骤：建立假设，确定检验水准；选定检验方法，计算统计量；确定P值，做出推断结论。7、如何正确选用单侧检验和双侧检验？

单侧检验首先应根据专业知识来确定，同时也应考虑

所要解决问题的目的，若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果，则用单侧检验；在尚不能从专业知识判断两种结果高低时，用双侧检验；若研究者对低于或高于两种结果都关心，则用双侧检验；若只关心其中一种可能，则取单侧检验。一般认为双侧检验保守和稳妥，单侧检验由于充分利用了另一侧的不可能性，更易得出有差别的结论，但应慎用。8.统计工作的步骤

统计工作全过程可分为：统计设计、搜集资料、整理资料和分析资料四个步骤。

设计：是整个设计研究实施的依据，是最关键的一环，在设计时应对后三个步骤进行周密的设想和安排。

搜集资料：是统计工作的基础。是根据设计取得准确可靠的原始数据，按其来源时间分为经常性资料和一时性资料。资料要求完整、准确和及时。

整理资料：对原始资料进行审核、校正、整理并使之系统化、条理化，便于统计分析。

分析资料：计算统计指标，反映数据的综合特征，阐明事物内在联系和规律，得出科学结论，统计分析包括统计描述和统计推断。

9.t分布的特征：（1）单峰分布，以0为中心，左右对称；（2）v越小，t值越分散，曲线的峰部越矮，尾部越高；（3）随着v逐渐增大，t分布逐渐接近标准正态分布；当v趋向∞时，t分布趋近标准正态分布。

10.方差分析的定义，基本思想和应用条件。

定义：又称F检验，是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同，用于比较两个或者两个以上均数的差别。

基本思想：根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和和自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个或几个因素的作用加以解释，通过比较不同变异的均方与误差均方比值的大小，借助F分布做出统计推断，从而了解该因素对观测指标有无影响。

应用条件：（1）各样本是相互独立的随机样本，均服从正态分布；（2）各样本的总体方差相等，即方差齐性。概括的表达为：任何观察值都是独立的来自于具有等方差的正态总体。

11.直线相关与回归分析的注意事项？

①作直线相关与回归分析要有实际意义②应先绘制散点图③变量间存在直线相关关系，并不一定说明有因果关系④利用回归方程进行预测注意使用范围。

13、简述直线回归与直线相关的区别。

1资料要求上不同：直线回归分析适用于应变量是服从正态分布的随机变量，自变量是选定变量；直线相关分析适用于服从双变量正态分布的资料。

2 两种系数的意义不同：回归系数是表明两个变量之间数量上的依存关系，回归系数越大回归直线越陡峭，表示应变量随自变量变化越快；相关系数是表明两个变量之间相关的方向和紧密程度的，相关系数越大，两个变量的关联程度越大。

13、标准差与标准误有何区别和联系？

?区别：1.含义不同:⑴s描述个体变量值（x）之间的变异度大小，s越大，变量值（x）越分散；反之变量值越集中，均数的代表性越强。⑵标准误是描述样本均数之间的变异度大小，标准误越大，样本均数与总体均数间差异越大，抽样误差越大；反之，样本均数越接近总体均数，抽样误差越小。

2.与n的关系不同：n增大时，⑴s σ（恒定）。

⑵标准误减少并趋于0（不存在抽样误差）。

3.用途不同: ⑴s:表示x的变异度大小，计算cv，估计正常值范围，计算标准误等⑵:参数估计和假设检验。?联系：二者均为变异度指标，样本均数的标准差即为标准误，标准差与标准误成正比。

14．率的标准化法的注意事项

适用条件：A 欲比较的两个人群内部的年龄分布不同。B每个人群内部年龄别死亡率也各不相同。标准化后的标准化率，已经不再反映当时当地的实际水平，它只是表示相互比较的资料间的相对水平。标准化法的实质是找一个“标准”，使两组得以在一个共同的“平台”上进行比较。选择不同的标准，算出的标准化率也会不同，但相互比较的几组数据间的相互水平不变。直接法计算简便，易于理解，较为常用。如不计算标化率，而分别比较各小组的率，也可得出正确的结论，但不能比较总率的大小。标准法常常用于对总体的标准化和比较，如果是对样本数据进行标准化，其标准化死亡率的比较应做假设检验。

15．线性相关应用中应注意的问题

样本的相关系数接近0并不意味着两个变量间一定无相关性；一个变量的数值人为选定时莫作相关；出现异常值时慎用相关；相关未必真有内在联系；分层数据盲目合并易出假象。

16.应用相对数的注意事项？

①防止概念混淆②计算相对数时分母应有足够数量③正确的合并估计频率（或强度）型指标④相对数间的比较要具备可比性a.观察的对象同质，研究方法相同，观察时间相等，及名族、地区等的一致。b.其它影响因素在各组的内部构成是否相同。⑤样本相对数的统计推断

18请比较发病率和患病率的不同。

发病率表示一定时期内，在可能发生某病的一定人群活过的总人年中，新发生的某病病历数，其分子是新病历数，分母是总人年数；患病率，又称现患率，指某时点上受检人数中先患某种病的人数，通常用于描述病程较长或发病时间不易明确的疾病的患病情况，其分子包括新旧病例数，分母是受检总人数。在一定的人群和时间内，发病率和患病率有密切关系，两者与病程（D）的关系是：PR=IR×D。

19请比较死亡率与病死率的不同。

死亡率与病死率的分子是一样的，均表示因某病死亡的人数，但死亡率的分母是总人年数，侧重反映发生的强度，或单位时间内死亡的概率；病死率的分母是患某病的人数，反映疾病死亡的概率。

20卡方检验的使用范围和各个公式的适用条件是什么？

卡方检验用于：推断两个及两个以上总体率或构成比是否有差别，两个分类变量间有无相关关系，多个率的趋势检验，以及两个率的等效检验等。此外，也用于频数分布的拟合优度检验。

对不同的设计类型的资料，检验的应用条件不同：(1) 完全随机设计两样本率的比较

1) 当n＞40，且T≥5时，用非连续性校正值；

若所得P≈α，则改用四格表的确切概率法。

2) 当n≥40，且有1≤T＜5时，用连续性校正值。

3) n＜40，或有T＜1时，不能用检验，应当用四格表的确切概率法。

(2) 配对设计四格表

1) 当b+c≥40，

2) 当b+c<40，需作连续性校正，

(3) 行列表资料

1) 不宜有1/5以上格子的理论频数小于5，或有1个格子的理论频数小于1；

2) 单向有序行列表，在比较各处理组的效应有无差别时，应该用秩和检验或Ridit检验；

3) 多个样本率（或构成比）比较的检验时，结论为拒绝无效假设时，只能认为各总体率（或总体构成比）之间总的说来有差别，但不能说明它们彼此之间都有差别，或某两者间有差别。若想进一步了解哪两者的差别有统计学意义，可用分割法。21应用相对数应注意的事项。

1.理解相对数的含义不可望文生义；

2.频率型指标的解释要紧扣总体和属性；

3.计算相对数时分母应有足够数量；

4.正确地合并频率（强度）型指标；

5.相对数间的比较要具备可比性；

6.对相对数的统计推断。

22应用标准化的注意事项:标准化的应用范围很广，适用于“某事件的发生率”可以是治愈率，也可以是患病率，还可以是发病率、病死率等。当某个分类变量在两组中分布不同时，这个分类变量就成为两组频率比较的混杂因素，标准化法的目的就是消除这个混杂因素的影响。

23假设检验的理论依据是什么？（或者问基本思想）采用逻辑上的反证法，利用“小概率思想”。小概率思想是是指概率事件（p<0.05或p<0.01）在一次试验中基本上不会发生。反证法思想是先提出假设（检验假设H0），再用适当的统计方法确定假设成立的可能性大小，如可能性小，则认为假设不成立；如可能性大，则还不能认为假设不成立。

24简述二项分布、Poisson分布、正态分布的区别与联系。

区别：二项分布、Poisson分布是离散型概率分布，用概率函数描述其分布状况，而正态分布是连续型概率分布，用密度函数和分布函数描述其分布状况。联系：Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1—π都不是很小的时候二项分布渐近正态分布，当λ》=20的时候Poisson分布渐近正态分布。25医学参考值范围：是指特定的“正常”人群（排除了对所研究指标有影响的疾病和有关因素的特定人群）的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。

统计学期末考试试题和答案解析

统计学期末综合测试一、单项选择题（每小题1分，共20分） 1、社会经济统计的数量特点表现在它是（）。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中，观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同，权数应是（）。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫，哪一种运动衫号码的度量对你更为有用（）。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米，标准差为8.4平方米，乡村人均居住面积为30平方米，标准差为11.6平方米，则该地区城市和乡村居民居住面积的离散程度（）。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性，各月计划任务有很大差异，今年1月超额完成计划3%，2月刚好完成计划，3月超额完成12%，则该厂该年一季度超额完成计划（）。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件，若报告期两组工人的平均日产量不变，乙组工人数占两组工人总数的比重上升，则报告期两组工人总平均日产量（）。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币，报告期只能购买基期商品量的90%，是因为物价（）。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为（）。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差，一般采用（）。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以（）为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知，对总体均值进行假设检验时，若抽取一个容量为100 的样本，则可采用（）。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值，则移动平均项数（）。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小，说明（）。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%，为了对下一批产品的合格率进行抽样检验，确定抽样数目时P 应选（）。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中，第二类错误的概率β表示（）。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

(完整版)统计学期末考试试卷

2009---2010学年第2学期统计学原理课程考核试卷（B）考核方式: （闭卷）考试时量：120 分钟一、填空题（每空1分，共15分） 1、按照统计数据的收集方法，可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭，调查得到每个家庭的人均月收入数据：1080，750，780，1080，850，960，2000，1250，1630（单位：元），则人均月收入的平均数是，中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值，且X服从均匀分布，其概率密度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为，方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2，E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数，用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验，通常采用的是检验。 8、在参数估计时，评价估计量的主要有三个指标是无偏性、和。二、判断题，正确打“√”；错误打“×”。（每题1分，共10 分） 1、理论统计学与应用统计学是两类性质不同的统计学（） 2、箱线图主要展示分组的数值型数据的分布。（） 3、抽样极限误差可以大于、小于或等于抽样平均误差。（） 4、在全国人口普查中，全国人口数是总体，每个人是总体单位。（） 5、直接对总体的未知分布进行估计的问题称为非参数估计；当总体分布类型已知，仅需对分布的未知参数进行估计的问题称为参数估计。（） 6.当置信水平一定时，置信区间的宽度随着样本量的增大而减少（） 7、在单因素方差分析中，SST =SSE+SSA（） 8、右侧检验中，如果P值＜α，则拒绝H 。（） 9、抽样调查中，样本容量的大小取决于很多因素，在其他条件不变时，样本容量与边际误差成正比。（） 10、当原假设为假时接受原假设，称为假设检验的第一类错误。（）三、单项选择题（每小题1分，共 15分） 1、某研究部门准备在全市200万个家庭中抽取2000个家庭，推断该城市所有职工家庭的年人均收入。这项研究的样本（）。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时（）。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值其他 (a

医学统计学试题和答案解析

第一套试卷及参考答案一、选择题 (4０分） 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式Ｂ负偏态分布 C 正偏态分布Ｄ正态分布与近似正态分布 3、要评价某市一名５岁男孩得身高就是否偏高或偏矮，其统计方法就是( A ） A 用该市五岁男孩得身高得９5%或９9%正常值范围来评价Ｂ用身高差别得假设检验来评价Ｃ用身高均数得9５％或９９%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ) Ａ变异系数 B 方差Ｃ标准差 D 四分位间距５、产生均数有抽样误差得根本原因就是（ A ) A、个体差异Ｂ、群体差异Ｃ、样本均数不同Ｄ、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为（ A ）（A)相对比（B) 构成比（C)定基比 (D)率 7、统计推断得内容为（ D ) A、用样本指标估计相应得总体指标Ｂ、检验统计上得“检验假设”C、A与Ｂ均不就是Ｄ、Ａ与Ｂ均就是 8、两样本均数比较用t检验，其目得就是检验（ C ) Ａ两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本，样本含量分别为n1与n２，在进行成组设计资料得ｔ检验时,自由度就是（ D ） (A） n1+ n2 (B) n1+ n2–１（C) n1＋ n2 +1 (D）n1+ ｎ2-２ 10、标准误反映（ A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得（Ｃ） A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小Ｄ纵向距离最小１2、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为ｔr,对回归系数检验得ｔ值为ｔb,二者之间具有什么关系？（Ｃ) A t r>t b B t r〈t b C t r= tｂ D二者大小关系不能肯定 13、设配对资料得变量值为x１与x2,则配对资料得秩与检验（D ) A分别按ｘ1与x2从小到大编秩Ｂ把x１与x2综合从小到大编秩Ｃ把x１与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、０5，ν可认为( A ) Ａ各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同Ｄ各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原，其中甲年级调查3５人，阳性人数4人；乙年级调查40人,阳性人数８人。该资料宜选用得统计方法为（ A ） A.四格表检验 B、四格表校正检验 C t检验 D U检验 1６、为调查我国城市女婴出生体重：北方n1=5385，均数为3、０8kg,标准差为0、５3kｇ；南方n２=4８96,均数为3、1０ｋg,标准差为０、34kｇ,经统计学检验，p=0、０034〈0、０1,这意味着( D )

教育统计学试题库

教育统计学一、选择题 1、当一组数据用中位数来反映集中趋势时，这组数据最好用哪种统计量来表示离散程度？( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布，从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于：( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用：( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时，在下面哪种情况下不需要进行方差齐性检验？( B ) A. 两个独立样本的容量相等且小于30； B. 两个独立样本的容量相等且大于30； C. 两个独立样本的容量不等，n1小于30, n2大于30; D. 两个独立样本的容量不等，n1大于30, n2小于30。 5、下列说法中哪一个是正确的？( C ) A. 若r1=0.40 , r2=0.20，那么r1 就是r2 的2 倍；

B. 如果r=0.80 ，那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2； D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时，应计算哪一种相关？（ B ） A. 积差相关（两个连续型变量） B. ?相关 C. 点二列相关（一个是连续型变量，另一个是真正的二分名义变量） D. 二列相关（两个连续型变量，其中之一被人为地划分成二分变量。） 7、对多组平均数的差异进行显著性检验时需计算：（ A ） A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度，可以采用何种差异量？（ A ） A. 差异系数 B. 方差 C. 全距 D. 标准差二、名词解释 1. 分层抽样：按与研究内容有关的因素或指标先将总体划分成几个部分，然后从各部分（即各层）中进行单纯随机抽样或机械抽样，这种抽样方法称为分层抽样。 2. 描述统计：对已获得的数据进行整理、概括，显现其分布特征的统计方法称为描述统计。 3. 集中量：集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

统计学期末考试试题库和答案解析

第一章绪论一、填空题 1．标志是说明特征的，指标是说明数量特征的。 2．标志可以分为标志和标志。 3．变量按变量值的表现形式不同可分为变量和变量。4．统计学是研究如何、、显示、统计资料的方法论性质的科学。 5．配第在他的代表作《》中，用数字来描述，用数字、重量和尺度来计量，为统计学的创立奠定了方法论基础。二、判断题 1．企业拥有的设备台数是连续型变量。（） 2．学生年龄是离散型变量。（） 3．学习成绩是数量标志。（） 4．政治算术学派的创始人是比利时的科学家凯特勒，他把概率论正式引进统计学。（） 5．指标是说明总体的数量特征的。（） 6．对有限总体只能进行全面调查。（） 7．总体随着研究目的的改变而变化。（） 8．要了解某企业职工的文化水平情况，总体单位是该企业的每一位职工。（） 9．数量指标数值大小与总体的范围大小有直接关系。（） 10．某班平均成绩是质量指标。（）

三、单项选择题 1.考察全国的工业企业的情况时，以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积，其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况，则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示，质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

统计学试题库7

单选题 1. 相关关系与函数关系之间的联系体现在（） A. 相关关系普遍存在，函数关系是相关关系的特例 B. 函数关系普遍存在，相关关系是函数关系的特例 C. 相关关系与函数关系是两种完全独立的现象 D. 相关关系与函数关系没有区别 2. 当一个现象的数量由小变大，而另一个现象的数量相反地由大变小时，这种相关关系称为（）。！ A. 线性相关 B. 非线性相关 C. 正相关 D. 负相关 3. 配合回归直线方程对资料的要求是()。 A. 因变量是给定的数值,自变量是随机的 { B. 自变量是给定的数值,因变量是随机的 C. 自变量和因变量都是随机的 D. 自变量和因变量都不是随机的

! 4. 在回归直线方程中,b表示() A. 当x增加一个单位时,y增加a的数量 B. 当y增加一个单位时,x增加b的数量 / C. 当x增加一个单位时,y的平均增加量 D. 当y增加一个单位时,x的平均增加量 5. 若估计标准误Syx等于因变量的标准差σy，则说明回归方程（）。） A. 很有意义 B. 毫无价值 C. 计算有误 ` D. 问题不成立多选题 1. 相关关系与函数关系各有不同的特点，主要体现在（）。 A. 函数关系是一种不严格的相互依存关系 · B. 函数关系可以用一个数学表达式精确表达

C. 函数关系中各变量均为确定性的 D. 现象相关为关系时，是有随机因素影响的依存关系 , E. 相关关系中现象之间仍然可以通过大量观察法来寻求其变化规律 2. 估计标准误差是反映（） A. 回归方程代表性的指标 · B. 自变量离散程度的指标 C. 因变量数列离散程度的指标 D. 因变量估计值可靠程度的指标） E. 自变量可靠程度的大小 3. 对于回归系b，下列说法正确的有（）。 A. b是回归直线的斜率。 B. b的绝对值介于0－1之间 C. b越接近于零表明自变量对因变量影响越小 D. b与相关系数具有b=r·σy/σx，的关系￥ E. b满足Σy=na+bΣx

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法，错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率很小，在单次研究或观察中时，称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中，属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标，其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法，不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言，参数难以测定，仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中，总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。答：当某事件发生的概率很小，习惯上认为小于或等于0.05时，统计学上称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓小概率事件原理，它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答：某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念答：研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的观察单位的集合，通常有无限总体和有限总体之分，前者指总体中的个体数是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体数是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007

统计学原理期末复习题及答案

期末复习题（答案仅供参考）一、判断题（把正确的符号“V”或错误的符号“X”填写在题后的括号中。） 1. 社会经济统计的研究对象是社会经济现象总体的各个方面。（X） 2. 在全国工业普查中，全国企业数是统计总体，每个工业企业是总体单位。（X） 3. 总体单位是标志的承担者，标志是依附于单位的。（V ） 4. 在全国工业普查中，全国工业企业数是统计总体，每个工业企业是总体单位。（X） 5. 全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的（X）。 6. 调查单位和填报单位在任何情况下都不可能一致。（X） 7. 对全同各大型钢铁生产基地的生产情况进行调查，以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。（V） 8. 统计分组的关键问题是确定组距和组数（V） 9. 总体单位总量和总体标志总量是固定不变的，不能互相变换。（X） 10. 相对指标都是用无名数形式表现出来的。（） 11. 国民收入中积累额与消费额之比为1: 3，这是一个比较相对指标。（X） 12. 抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法，因此不可避免的会产生误差，这种误差的大小是不能进行控制的。（X） 13. 从全部总体单位中按照随机原则抽取部分单位组成样本，只可能组成一个样本。（X） 14. 在抽样推断中，作为推断的总体和作为观察对象的样本都是确定的、唯一的。（X） 15. 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。（V） 16. 在其它条件不变的情况下，提高抽样估计的可靠程度，可以提高抽样估计的精确度。（X） 17. 施肥量与收获率是正相关关系。（X ） 18. 计算相关系数的两个变量都是随机变量（V） 19. 利用一个回归方程，两个变量可以互相推算（X） 20. 数量指标作为同度量因素，时期一般固定在基期（X）。 Z q1 p1 21. 在单位成本指数——中，'p1p1 —'弋1卩0表示单位成本增减的绝对额（V）。瓦q1 P o

医学统计学试题和答案.doc

医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（ b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C．研究典型案例研究误差 4．参数是指（ b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（a）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A. 均数不变，标准差改变 B. 均数改变，标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用（a ）。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中（d）可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用（c）描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后，（b）不变。 A．算术均数 B. 标准差 C. 几何均数 D.中位数 11.（ a）分布的资料，均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.（ c）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是（c ）。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

统计学试题库(选择题和判断题)

编辑版word 统计学题库一、判断题 1、统计学是研究总体数量方面的规律的，所以就不需要做定性研究。（） 2、重点调查的误差是可以事先计算和控制的。（） 3、计算比较相对指标时，通常采用总量指标。（） 4、众数和中位数均易受极端值影响，不具有稳健性。（） 5、定基增长速度等于环比增长速度的连加。（） 6、平均增长速度等于各环比增长速度的几何平均数。（） 7、因为综合指数是总指数的基本形式，所以实际计算总指数时通常运用综合指数。 8、样本指标的方差称为抽样平均误差。（） 9、若其他条件固定，则总体变量的变动程度与抽样极限误差呈正比。（） 10、相关系数与回归系数同号。（） 1、总体和总体单位的区分具有相对性，随着研究任务的改变而改变。（） 2、统计分组是统计整理的基本方法，因此它并不能分析现象之间的依存关系。（） 3、频率是加权算术平均数实质意义上的权数。（） 4、若甲、乙两总体某变量的标准差乙甲、σσ存在乙甲σσ>，则乙总体变量的差异性较小。 5、定基增长速度等于环比增长速度的连乘积。（） 6、若现象的发展，其逐期增长量大体相等，则应配合直线趋势方程。（） 7、若p 表示产品价格，q 表示产品产量，则1011q p q p ∑∑-表示因价格变动造成的产值变动额。 8、抽样平均误差不受总体变量变动程度的影响。（） 9、在重复抽样情况下，其他条件不变，则样本单位数增加一倍将使抽样平均误差减少一半。 10、若0=r ，则X 与Y 不相关。（） 1、数量标志是用数值表示的，而质量指标是用属性（文字）表示的。（） 2、离散型变量既可以进行单项式分组，也可以进行组距式分组。（） 3、以组中值代替组平均数不需要前提假设。（） 4、算术平均数与几何平均数比较大小没有实际意义。（） 5、若某国GDP2003年比2001年增长15％，2006年比2003年增长20％，则该国GDP2006年比2001年增长35％。 6、若现象的发展，其二级增长量大体相等，则应配合指数曲线趋势方程。（） 7、若p 表示产品价格，q 表示产品产量，则0001p q p q ∑∑-表示因产量变动造成的产值变动额。 8、样本单位数n 越大，样本平均数的波动越小。（） 9、在重复抽样情况下，其他条件不变，若要使抽样极限误差减少一半，则必须使抽样单位数增加两倍。 10、若X 与Y 高度曲线相关，则r 必接近于1。（） 1、标志和指标存在着一定的变换关系。（） 2、连续型变量既可以进行单项式分组，也可以进行组距式分组。（） 3、加权算术平均数的所有变量值均减少一半，而所有权数均增加一倍，则平均数不变。 4、设甲、乙两总体某变量的平均数和标准差分别为乙甲、X X 和乙甲、σσ，若存在乙甲X X <及乙甲σσ>，则乙

统计学期末考试试题(含答案)

西安交大统计学考试试卷一、单项选择题（每小题2分，共20分） 1.在企业统计中，下列统计标志中属于数量标志的是（C） A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有（B ） A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元，则这句话中有（B）个变量？ A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是（A ） A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中，属于时点指标的有（A ） A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是（B ）确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到（A ）： A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为（A ） A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p（D ） A、大于1 B、大于－1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于（A ） A、零 B、1 C、－1 D、2 二、多项选择题（每小题2分，共10分。每题全部答对才给分，否则不计分） 1.数据的计量尺度包括（ABCD ）： A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有（BE ）： A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有（ABE ） A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中（BDE ） A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中，容易受数列中极端值影响的平均数有（ABC ） A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数三、判断题（在正确答案后写“对”，在错误答案后写“错”。每小题1分，共10分） 1、“性别”是品质标志。（对） 2、方差是离差平方和与相应的自由度之比。（错） 3、标准差系数是标准差与均值之比。（对） 4、算术平均数的离差平方和是一个最大值。（错）

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体，具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比，其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布，其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A ．比较不同计量指标的变异程度 2. 对于近似正态分布的资料，描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4．应用百分位数法估计参考值范围的条件是B ．数据服从偏态分布 5．已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用 E ．四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ～9.1×109 /L ，其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差，应该使用的方法是 E.增加样本含量 5．两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

(完整word版)医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

统计学期末考试试题(含答案)

交大统计学考试试卷一、单项选择题（每小题2分，共20分） 1.在企业统计中，下列统计标志中属于数量标志的是（ C） A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有（B ） A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元，则这句话中有（ B）个变量？ A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是（A ） A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中，属于时点指标的有（A ） A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是（B ）确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到（ A ）： A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为（A ） A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p（D ） A、大于1 B、大于－1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于（A ） A、零 B、 1 C、－1 D、2 二、多项选择题（每小题2分，共10分。每题全部答对才给分，否则不计分） 1.数据的计量尺度包括（ ABCD ）： A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有（ BE ）： A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有（ ABE ） A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中（ BDE ） A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中，容易受数列中极端值影响的平均数有（ ABC ） A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数三、判断题（在正确答案后写“对”，在错误答案后写“错”。每小题1分，共10分） 1、“性别”是品质标志。（对） 2、方差是离差平方和与相应的自由度之比。（错） 3、标准差系数是标准差与均值之比。（对）

医学统计学试题及其答案

l．统计中所说的总体是指： A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2．概率P=0，则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4．测量身高、体重等指标的原始资料叫： B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5．某种新疗法治疗某病患者41人，治疗结果如下：治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是： D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6．样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程，属于统计工作哪个基本步骤：C A统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少： B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10．以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明，要计算集中趋势指标，宜选择 C A X B G C M D S E C V 13．各观察值均加（或减）同一数后： B A均数不变，标准差改变B均数改变，标准差不变 C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、l O、2、24+(小时)，问该食物中毒的平均潜伏期为多少小时 C A5B5．5C6D10E1 2

统计学试题库及试题库答案解析

统计学题库及题库答案题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差二、多项选择题(每题2分,共10分)

生物统计学期末复习题库及答案

生物统计学期末复习题库及答案 https://www.docsj.com/doc/5e9111835.html,work Information Technology Company.2020YEAR

第一章填空 1．变量按其性质可以分为（连续）变量和（非连续）变量。 2．样本统计数是总体（参数）的估计值。 3．生物统计学是研究生命过程中以样本来推断（总体）的一门学科。 4．生物统计学的基本内容包括（试验设计）和（统计分析）两大部分。 5．生物统计学的发展过程经历了（古典记录统计学）、（近代描述统计学）和（现代推断统计学）3个阶段。 6．生物学研究中，一般将样本容量（n ≥30）称为大样本。 7．试验误差可以分为（随机误差）和（系统误差）两类。判断 1．对于有限总体不必用统计推断方法。（×） 2．资料的精确性高，其准确性也一定高。（×） 3．在试验设计中，随机误差只能减小，而不能完全消除。（∨） 4．统计学上的试验误差，通常指随机误差。（∨）第二章填空 1．资料按生物的性状特征可分为（数量性状资料）变量和（质量性状资料）变量。 2. 直方图适合于表示（连续变量）资料的次数分布。 3．变量的分布具有两个明显基本特征，即（集中性）和（离散性）。 4．反映变量集中性的特征数是（平均数），反映变量离散性的特征数是（变异数）。 5．样本标准差的计算公式s=（）。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。（×） 2. 条形图和多边形图均适合于表示计数资料的次数分布。（×） 3. 离均差平方和为最小。（∨） 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。（∨） 5. 变异系数是样本变量的绝对变异量。（×）单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a，其标准差（D）。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度，应采用的指标是（C）。 A.标准差 B.方差 C.变异系数 D.平均数第三章填空

(完整版)医学统计学试题及答案[1]

医学统计学试题及答案医学试题精选2009-12-20 12:28:11 阅读6171 评论0 字号：大中小订阅第一套试卷及参考答案一、选择题（40分） 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（ A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（ D ）（A）n1+ n2 （B）n1+ n2–1 （C）n1+ n2 +1 （D）n1+ n2 -2