文档视界 最新最全的文档下载
当前位置:文档视界 › 中南大学统计学课件

中南大学统计学课件

习题

《卫生统计学》第五版(五年制预防医学用)

(一)名词解释与简答题

1.名词解释

(1)负担系数(2)总和生育率(3)生存率(4)潜在减寿年数

(5)试比较发病率与患病率, 死亡率与病死率。

2、简述二项分布、Poisson分布、正态分布的区别与联系。

3、简述控制图的基本原理。

4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。

5、样本均数的抽样分布有何特点?

6、样本均数的标准误的意义是什么?与标准差有何区别和联系?

7、与标准正态分布比较,t分布的特点是什么?

8、用同一份样本指标去估计总体参数的95%置信区间与99%置信区间,两者比较,哪一

个估计的精度好?为什么?

9、假设检验的理论依据是什么?

10、假设检验的两类错误之间的区别与联系是什么?

11、t检验的应用条件是什么?

12、假设检验中P值的意义是什么?

13、如何确定检验水准?

14、如何恰当地应用单侧与双侧检验?

15、什么情况下可以借用正态近似法估计总体概率的置信区间?

χ检验的用途。

16、简述2

17、比较两个独立样本频数分布的χ2检验,和比较配对样本两个频数分布的χ2检验在设计

方法、资料整理、假设检验等方面的差别是什么?

18、举例说明如果实验效应用等级资料表示,比较两组总体效应间差别是否有统计学意义

χ检验?

为什么不能用2

19、为什么有些四格表(或R×C表)必须要计算确切概率?

20、实验研究和调查研究的根本区别是什么?

21、实验设计的三个基本原则是什么?

22、在临床试验中使用安慰剂的目的是什么?

23、随机化的目的是什么?

24、试验设计的基本要素包括哪些?

25、估计样本含量时,所定容许误差与样本量有何关系?

26、配对设计的目的是什么?

27、避免医生和病人对实验效应观察的偏性,设计时应注意什么?

28、为明确某新化妆品对皮肤有无损害作用,将12只大白兔的左背部涂抹该化妆品,右侧

涂生理盐水作为对照,72小时后观察皮肤反应。这属于什么对照?

29、琴纳用牛痘疫苗接种23人后再接种天花,结果无人患天花,而当时一般人接触天花病

人后,天花的发病率约90%。琴纳所用的属于什么对照?

30、为比较A、B两种减肥药对肥胖病人的减肥效果。将60名肥胖患者按性别相同,体重

相近配成30对。每对患者随机分配入A、B两药组,30天后比较A、B两组患者体重的下降值(kg)。

(1)该实验属何种设计方案?

(2)变量或资料(体重下降值)属何种类型

(3)其结果可用何种统计分析方法进行分析

31、什么是析因设计?其主要特点是什么?

32、何为交叉设计?它有何优缺点?

33、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算?

34、两样本t检验与完全随机设计资料的ANOV A有何关系?配对样本t检验与随机区组设

计资料的ANOV A又有何关系?

35、举例说明何谓交互效应?并绘制交互效应图。

36、SNK−q检验Dunnett−t检验都可用于均数的多重比较,它们有何不同?

37、数据变换在资料处理中的作用是什么?

38、秩和检验有哪些优缺点?

检验?

39、两组或多组有序分类资料的比较,为什么宜用秩和检验而不用2

40、调查研究与实验研究有何异同?二者能否同时使用或结合使用?

41、究主要有哪些方法,各有何优缺点?

42、大多数的调查研究是抽样调查研究?比较常用的四种概率抽样方法。

43、哪些情况下最适合于用小组调查法。

44、法的意义与思想是什么?直接法与间接法的主要区别是什么?

45、面一些说法是否正确,若不正确,提出正确者:

(1)如果只需要比较各个年龄组的死亡率,可以不做标准化。

(2)只有当要比较总体死亡情况,而且希望归因为人口分布不同之外的其它因素时,标准化才有意义。

(3)虽然人口分布不同,但各个年龄组的死亡率相同或相差不大时没有必要做标准化。

(4)不同比较组的人口分布不同,各年龄组的死亡率也不同,但有明显的交叉,此时不宜做标准化。

46、简述线性回归、logistic回归和Cox回归的区别。

47、简述Cox回归中回归系数与相对危险度RR值的关系。

48、简述综合评价的一般步骤。

49、简述Topsis法的基本思想和步骤。

50、简述层次分析法的基本思想和步骤。

51、何谓Meta分析?

52、.说明Meta分析的用途。

53、说明Meta分析的两类统计模型。

54、说明Meta分析的基本步骤。

(二)分析计算题

1.1985年某省农村120例6-7岁正常男童胸围(cm)测量结果如表所示。

120例6-7岁正常男童胸围(cm)测量结果

51.6 54.1 51.3 56.6 51.2 53.6 56.0 58.3

54.0 56.9 55.5 57.7 56.0 57.4 55.2 53.6

57.7 55.5 57.4 53.5 56.3 54.0 57.5 55.4

58.3 55.4 55.9 53.3 54.1 55.9 57.2 56.1

53.8 57.7 56.0 58.6 57.6 56.0 58.1 49.1

51.3 53.8 50.5 53.8 56.8 56.0 54.5 51.7

57.3 54.8 58.1 56.5 51.3 50.2 55.5 53.6

52.1 55.3 58.3 53.5 53.1 56.8 54.5 56.1

54.8 54.7 56.2 53.7 52.4 58.1 56.6 56.7

53.4 57.1 54.4 53.7 54.1 59.0 56.2 55.7

53.1 55.9 56.6 56.4 50.4 53.3 56.7 50.8

51.4 54.6 56.1 58.0 54.2 53.8 55.3 55.9

56.1 61.8 56.7 52.7 52.4 51.4 53.5 56.6

59.3 56.8 58.1 59.0 53.1 54.2 54.0 54.7

59.8 53.9 52.6 54.6 52.7 56.4 55.5 54.4

(1)试编制胸围数据的频数表,绘制直方图,概括其分布特征。

(2)用合适的统计量描述胸围数据的集中趋势、变异趋势。

(3)计算P25、P50、P75。

2. 在某项治疗膀胱癌的研究中,细胞增殖抑制率(=(1-实验组A值/对照组A值)×100%))数据如表所示:

细胞增殖抑制率

分组细胞增殖抑制率(%)

第1天第3天第5天第7天实验组133 123 54 140

对照组100 98 162 250 试依据上述数据绘制合适的统计图。(注:A值为上述研究中某实验指标)

3. 1998年国家第二次卫生服务调查资料显示,城市妇女分娩地点分布(%)为医院63.84,妇幼保健机构20.76,卫生院7.63,其他7.77;农村妇女相应为医院20.38,妇幼保健机构

4.66,卫生院16.38,其他58.58。试用合适的统计图表达上述资料。

4.1985年我国北方某地区某医生记录10名儿童乳牙萌出月龄(月)数据如下:

4, 6, 5.5, 8, 11, 10, 13, 11, 9, 8。试描述该10名儿童乳牙萌出的平均时间。

5. 某卫生防疫站对30名麻疹易感儿童气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下表。试计算其平均滴度。

抗体滴度1:8 1:16 1:32 1:64 1:128 1:256 1:512 例数 2 6 5 10 4 2 1

6. 某地通过卫生服务的基线调查得到下表的资料,试作如下分析:

(1)计算全人口的性别比;(2)计算育龄妇女(15~49岁)占总人口的百分比;

(2)计算总负担系数;(4)计算老年人口系数

某地人口构成情况

年龄组(岁) 男(%) 女(%) 年龄组(岁) 男(%) 女(%)

0~ 4.2 4.0 45~ 2.4 2.7

5~ 3.2 3.1 50~ 2.1 2.4

10~ 4.4 4.2 55~ 1.2 2.2

15~ 5.5 5.3 60~ 1.3 2.4

20~ 5.1 5.2 65~ 1.1 1.4

25~ 6.0 6.1 70~ 0.8 1.2

30~ 4.3 4.5 75~ 0.5 0.9

35~ 3.2 3.3 80~ 0.2 0.5

40~ 2.3 2.5 85~ 0.1 0.2

7.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率;有4名气虚型的概率。

8.假定某批出厂半年的中药潮解率为6%。从中抽取20丸,求恰有1丸潮解的概率、不超过1丸潮解的概率和有1至3丸潮解的概率。

9.某溶液平均1毫升中含有大肠杆菌3个。摇匀后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少?

10.某人群中12岁男孩身高的分布近似于正态分布,均数为144.00cm,标准差为5.77cm。

(1)该人群中80%的12岁男孩身高集中在哪个范围?

(2)求该人群中12岁男孩身高的95%和99%参考值范围。

(3)求该人群中12岁男孩身高低于140cm的概率。

(4)求该人群中12岁男孩身高超过160cm的概率。

11.某地白血病的发病率为0.0001,现检查4万人,求没有发现白血病患者的

概率和发现白血病患者不超过3人的概率。

12. 某车间经检测每升空气中平均约有37颗粉尘,请估计该车间每升空气中有大于50颗粉尘的概率。

13. 某研究表明新研制的一种安眠药比旧安眠药增加睡眠时间。某医师从已确诊的神经衰弱病人中随机抽取了两份样本, 一份样本是20例病人服用该种新药,计算得到平均睡眠时间为6.39小时, 标准差为2.24小时; 另一份样本是93例病人也服用该种新药,计算得到平均睡眠时间为6.45小时, 标准差为2.51小时。若睡眠时间服从正态分布,试分别估计这种新安眠药的平均睡眠时间的95%置信区间;并比较这两个区间有何不同,用哪一个估计总体参数更可靠?

14. 为了解中年男性高血压患病情况,某研究单位在某市城区随机调查了45~54岁男性居民2660人,检查出高血压病人775人,试估计该市中年男子高血压患病1.大量研究显示

汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm。某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.95 9.33 9.49 9.00 10.09 9.15 9.52 9.33 9.16 9.37 9.11 9.27。试问该地区男性新生儿临产前双顶径(BPD)的是否大于一般新生儿。

15.为探讨习惯性流产与ACA(抗心磷抗体)的lgG的关系,研究人员检测了33例不育

症(流产史>2次)妇女ACA的lgG,得样本均数为1.36单位,标准差为0.25单位;同时检

测了40例正常(有1胎正常足月产史)育龄妇女ACA的lgG,相应样本均数为0.73单位,标准差为0.06单位。习惯性流产者与正常妇女lgG水平是否不同?

16.两组十二指肠溃疡患者。其中A组20例,幽门螺杆菌(Hp)皆阳性。测得其生长抑

制素(SS)样本均数为260.20(wn/10-9),标准差为27.50 (wn/10-9);B组10例,Hp皆

阴性。其SS样本均数为387.40(wn/10-9),标准差为34.50(wn/10-9)。试问,Hp对生长抑

制素含量有无影响?

17. 两组肿瘤患者,单纯放疗组(A)13 例,口服平消胶囊+放疗组(B)12 例,接受

放疗前后,血清Sil-2R水平(U/ml)如表所示。试评价平消胶囊对接受放疗患者血清Sil-2R

水平的影响?

两组肿瘤患者的血清Sil-2R水平

A组 No. 1 2 3 4 5 6 7 治疗前 1183.03 822.52 1294.00 852.50 568.89 532.12 896.36

治疗后 983.08 469.34 704.39 979.66 1040.33 895.93 612.27

No. 8 9 10 11 12 13

治疗前 530.46 808.22 375.44 1055.26 614.55 450.22

治疗后 616.70 870.14 1245.54 1753.67 1850.56 538.45

B组 No. 1 2 3 4 5 6 7 治疗前 992.85 767.33 645.85 709.54 995.41 1043.40 1022.76

治疗后 236.66 293.00 166.77 204.81 127.27 186.63 200.80

No. 8 9 10 11 12

治疗前 486.27 694.28 871.44 973.73 1063.76

治疗后 151.47 254.49 178.09 147.19 111.22

⒙在探讨硫酸氧钒降糖作用的实验中,测得两组动物每日进食量如表6-6

所示。试问两组动物每日进食量是否相同?

两组动物每日进食量

糖尿病加钒组糖尿病组

26.46 46.89

25.19 47.21

28.70 42.42

23.70 47.70

24.48 40.75

25.19 41.03

28.01 45.98

23.70 43.46

26.10 44.34

24.62 45.32

19. 22~33岁单胎初孕妇女具有妊娠高危因素者123人随机分为两组。A组63人从孕28周起到分娩止每日口服含钙胶囊;B组60人同期口服安慰剂。结果A组出现妊高症6例,B组出现14例。试问,补钙对妊高症是否具有预防作用?

20. 在甲地区抽取10万人口回顾调查, 知1990~1993年因脑血管病死亡123人,在乙地

区也抽取10万人口作回顾调查, 知同期因脑血管病死亡97人。两地区脑血管病死亡水平是否

相同?

率的95%置信区间。

21.某医院收治186例重症乙型脑炎患者,随机分成两组,分别用同样的方

剂治疗,但其中一组加一定量的人工牛黄,治疗结果如表所示。

加人工牛黄治疗乙型脑炎效果

治疗效果

疗法治愈未愈合计

不加人工牛黄26 45 71

加人工牛黄68 47 115

合计94 92 186

问加人工牛黄是否增加该方剂的疗效?

22.某研究人员观察了其他基本情况相似的60岁以上老人126名,其中患冠心病的52名,未患冠心病的74名,询问他们食盐的情况,其结果见表

冠心病患病与食盐情况

冠心病

食盐情况

合计超标未超标

有36 16 52

无42 32 74

合计78 48 126

问患冠心病和未患冠心病的老人食盐超标的概率是否不同?

23.为比较三种方剂治疗胃溃疡的效果,将200名患者随机分到三个治疗组,疗效见表,分析三个方剂的治疗效果有无差别?

三种方剂治疗胃溃疡的效果

治疗方法

治疗效果

合计有效无效

甲方剂42 18 60

乙方剂38 27 65

丙方剂56 19 75

合计136 64 200

24.为比较甲、乙两种方法的诊断效果,某研究人员随机抽查110名乳腺癌患者,同时用甲乙两种方法对各位患者进行检查,将检查结果整理成表的形式。问两种方法对乳腺癌的检出概率有无差别?

甲乙两种方法检查乳腺癌患者的情况

甲方法

乙方法合计检出未检出

检出未检出42

30

8

30

50

60

据文献,该苗在全程接种后必须提高8%以上才有推广价值。

(1)如果取α=0.05,1–β=0.80,单侧检验时,需要多大的样本含量才能实现研究目的?

(2)如果取1–β=0.90,又需要多大的样本含量?

(3)根据两个样本含量的比较,你得出什么结论?

28.为研究母乳喂养和人工喂养对婴儿血红蛋白的影响,根据文献,经母乳喂养的婴儿42天血红蛋白均数为117.7g/l,人工喂养为103.3g/l,42天婴儿血红蛋白的总体标准差σ=10.2 g/l。α取单侧0.05,检验功效为0.80,每组例数相等,问每组需要多少病例才能发现差异?若母乳喂养组样本含量占整个样本含量的60%,则每组又各需多少病例?

29.探讨复方丹参注射液对Ⅱ型糖尿病多发性末梢神经病变的治疗效果,以维生素B l、B12治疗为对照。根据有关文献的报道,对照组的总有效率为55.6%;复方丹参注射液总有效率为88.2%。若取单侧α=0.05,β=0.10,两组病例数相同的情况下,各组需要多少病例才能发现有差别?

30.为研究铅作业与工人尿铅含量的关系,随机抽查了3种作业工人的尿铅结果如表所示。问3种作业工人的尿铅含量是否不同?

3种铅作业工人尿铅含量(mg/L)测定结果

铅作业组调离铅作业组非铅作业组

0.01 0.11 0.09

0.16 0.23 0.02

0.24 0.18 0.05

0.18 0.14 0.02

0.28 0.20 0.01

0.14 0.12 0.10

0.40 0.13 0.04

0.15 0.00 0.14

31.某医师为研究人体肾上腺皮质3β–HSD(羟基类固醇脱氢酶)活性在四个季节是否有差别,采用分光光度计随机测定了部分研究对象,其数据如表所示,请作统计分析。

四个季节人体肾上腺皮质3β–HSD活性

季节n X S

春季42 0.78 0.13

夏季40 0.69 0.22

秋季32 0.68 0.14

冬季36 0.58 0.20

32.利血平可以使小鼠脑中去甲肾上腺素(NE)等递质下降,现考察某种新药MWC是否具有对抗利血平使递质下降的作用,将24只小鼠随机等分为四组,并给予不同处理后,测定脑中NE的含量(ng/g湿组织),结果如表所示:

小鼠经不同处理后脑中NE的含量

蒸馏水组利血平组MWC组利血平+MWC组

630 181 715 407

760 103 663 397

687 138 638 378

676 141 887 363

892 197 625 438

523 193 648 412

问:(1)该资料属何种设计方案?

(2)该新药MWC是否具有对抗利血平使递质下降的作用?

33.为研究雌激素对子宫发育的作用,用四个种系的未成年雌性大白鼠各3只,每只按一定剂量注射雌激素,至一定时间取出子宫并称重,结果如表所示,试比较雌激素的作用在三种剂量间、四个种系大白鼠间是否不同。

未成年雌性大白鼠的子宫重量(mg)

种系

雌激素剂量(μg/100g)

0.2 0.4 0.8

甲106 116 145

乙42 68 115

丙70 111 133

丁42 68 115

34.将10名中度甲状腺机能亢进病人随机分为两组,分别用地巴唑和地巴唑+普奈洛尔

治疗,治疗前和治疗后4周的心率测量结果如表所示。试分析治疗方法的主效应、治疗时间

的主效应以及两者的交互效应。

甲状腺机能亢进病人治疗前后的心率(次/分)

治疗方法受试对象编号治疗前治疗后4周

1 115 91

2 120 94

地巴唑 3 124 88

4 116 82

5 114 96

6 11

7 83

地巴唑+ 7 110 80

普奈洛尔8 118 92

9 119 85

10 122 84

36为研究克拉霉素的抑菌效果,某实验室对28个短小芽孢杆菌平板依据菌株的来源不

同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低

剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TH)。给予不同的处理后,观

察抑菌圈的直径,结果见表9-31,请对该资料进行分析。

28个平板给予不同处理后的抑菌圈直径(mm)

区组SL SH TL TH

1 18.0

2 19.41 18.00 19.46

2 18.12 20.20 18.91 20.38

3 18.09 19.56 18.21 19.64

4 18.30 19.41 18.24 19.50

5 18.2

6 19.59 18.11 19.56

6 18.02 20.12 18.13 19.60

7 18.23 19.94 18.06 19.54

37.为研究长跑运动对增强普通高校学生的心功能的效果,某学院对随机抽取15名男生,进行5个月的长跑锻炼,5个月前后测得的晨脉数据如表所示,问长跑锻炼后的晨脉次

数有否降低?

某校15名学生5个月长跑锻炼前后的晨脉次数(单位:次/分钟)

学生号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 锻炼前70 76 56 63 63 56 58 60 67 65 75 66 56 59 72 锻炼后48 54 60 64 48 55 54 45 50 48 56 48 62 49 50

38.分别对8名未患妊娠合并症的孕妇和9名患有妊娠合并症的孕妇进行葡萄糖耐受水

平的测试,结果见表。问两类孕妇的葡萄糖耐受能力是否不同?

两组孕妇葡萄糖耐受水平的测试结果

未患妊娠合并症组110 119 133 127 141 117 135 122

患有妊娠合并症组120 140 162 184 132 128 177 143 181

39.用中草药治疗不同类型的小儿肺炎,其疗效分为4个等级,结果见表,试比较该药

物对不同类型的小儿肺炎疗效有无差别?

用某中草药治疗不同类型的小儿肺炎的疗效

疗效病毒性肺炎细菌性肺炎合计秩次范围平均秩次合计(1)(2)(3)(4)(5)(6)=(2) (5)

控制65 42 107 1~107 54 2268

显效18 6 24 108~131 119.5 717

有效30 23 53 132~184 158 3634

无效13 11 24 185~208 197 2167

合计126 82 208 8786 40.某研究者欲研究A、B两种菌对小鼠巨噬细胞吞噬功能的激活作用,将59只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬率(%)(下表),试比较三组吞噬率有无差别?

不同菌种对小鼠巨噬细胞的吞噬率(%)

A菌组B菌组对照组

45.0 64.0 70.0 51.0 62.0 89.0 46.0 44.0

56.0 66.0 71.0 51.0 68.0 91.0 31.0 36.0

56.0 66.0 74.0 54.0 68.0 93.0 56.0 36.0

57.0 66.0 74.0 54.0 70.0 48.0 24.0

60.3 66.0 76.0 59.0 70.0 43.0 18.0

63.0 67.0 73.0 61.0 71.0 24.0 36.0

64.0 70.0 93.0 61.0 70.0 18.0 44.0

64.0 70.0 95.0 61.0 87.0 36.0 36.0

41.欲对三位运动员的综合技术作出评价,以不同专业层次的8位教师对三位运动员的技术作评分(下表),问不同教师对三位运动员技术水平的评价有无不同?

不同教师对三位运动员的技术所作评分

教师编号运动员A 运动员B 运动员C

1 5.3 6.

2 5.8

2 5.5 6.4 6.0

3 5.1 4.8 5.5

4 5.2 5.0 5.5

5 5.3 6.0 5.6

6 5.2 4.9 5.4

7 5.6 6.7 6.0

8 5.5 6.2 5.9

42.某省卫生防疫站对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如表,试检验两者有无相关关系?

8个城市的肺癌标化死亡率和大气中苯并(a)芘浓度

城市编号 1 2 3 4 5 6 7 8

肺癌标化死亡率

(1/10万)

5.6 18.50 1

6.23 11.40 13.80 8.13 18.00 12.10

苯并(a)芘

(μg/100m3)

0.05 1.17 1.05 0.10 0.75 0.50 0.65 1.20

43.试就下表资料分析肾重与心重间的关系。

10名成年男子(尸检)肾重与心重检测结果

编号肾重(克)

(x)

心重(克)

(y)

编号

肾重(克)

(x)

心重(克)

(y)

1 333 271 6 340 305

2 357 439 7 369 404

3 361 328 8 312 262

4 30

5 32

6 9 268 255

5 269 27

6 10 354 350

44. 某地防疫站用碘剂局部注射治疗219例地方性甲状腺肿,结果见表。问患者年龄与疗效间有无关联?

地方性甲状腺肿患者各年龄组疗效观察结果

年龄(岁)

疗效

合计治愈显效好转无效

11~35 1 1 3 40

20~32 8 9 2 51

30~17 13 12 2 44

40~15 10 8 2 35

50~10 11 23 5 49

合计109 43 53 14 219

45. 某医院为探讨流行性出血热临床发病情况和治疗原则之间的关系,得到了446例病情转化资料(下表),试分析早期分度与最后定型之间有无关联。

流行性出血热不同分度病情转化情况

早期分度

最后定型

合计轻型中型重危型

轻度111 21 1 133

中度 5 163 20 188

重度0 1 124 125

合计116 185 145 446

46.某医院在研究胎盘过早剥离者的出血情况时,将妊娠时间分为三个阶段,失血量分为三个等级,共调查了224例,结果见表。问失血量的多少与妊娠阶段之间有无关联?

妊娠各阶段胎盘过早剥离者的出血人数分布

妊娠阶段

失血量

合计较少中等较多

早期23 4 6 33

中期47 29 23 99

晚期51 19 22 92

合计121 52 51 224

47.试用表资料分析"右下腹压痛"与"是否患了阑尾炎"之间有无关联?

201例就诊者有无右下腹压痛与手术证实是否患有阑尾炎之间的关系

有无右下腹压痛

是否患有阑尾炎

合计是否

有93 27 120

无15 66 81

合计108 93 201

48.用如下数据计算相关系数,并检验其总体相关系数是否为零;计算回归系数,并检验其总体回归系数是否为零;解释相关系数与回归系数的含义、比较并解释两个检验结果;计算总体回归系数的95%置信区间。

X 2 4 4 5 6

Y 5 6 7 9 12

49.15个儿童的身高与肺死腔容积的观测数据如表所示.

儿童的身高与肺死腔容积的观测数据

对象号身高(cm) 肺死腔容积(ml), Y

1 110 44

2 116 31

3 12

4 43 4 129

45 5 131

56 6 138

79 7 142

57 8 150

56 9 153

58 10 155

92 11 156

78 12 159

64 13 164

88 14 168

112 15 174 101 试用该资料进行相关与回归分析:

(1)计算基本统计量;

(2)计算相关系数;

(3)进行相关系数等于零的假设检验;

(4)计算样本回归方程的截距与回归系数;

(5)进行回归系数等于零的假设检验;

(6)验证是否存在F t t b r == 的关系 ;

(7)估计回归系数β的95%置信区间;

50.研究者调查16个不同地区在某一固定时期内到中心医院的就诊率,同时测量了每一地区中心点到医院的距离,结果如表所示:

16个地区到中心医院的距离和就诊率

地区编号 距离(km )(X ) 就诊率% (Y )

1 6.8 21

2 10.

3 12

3 1.7 30

4 14.2 8

5 8.8 10

6 5.8 26

7 2.1 42

8 3.3 31

9 4.3 21

10 9.0 15

11 3.2 19

12 12.7 6

13 8.2 18

14 7.0 12

15 5.1 23

16 4.1 34

(1) 请用该数据进行回归分析。

(2) 求回归系数的95%置信区间。

51. 为何总体回归线置信带的上下缘是对称于回归线的两条弧形线,而不是平行线?

52. 为何个体值预测带的上下缘曲线要比回归线置信带的上下缘曲线离回归直线更远?

53. 什么是回归系数的标准误?什么是预测值的标准误?后者如何受前者影响?

(1)如果X 的均数为20,Y 的均数为50,X 与Y 的相关系数为r ,试写出Y 依X 的回归方程。

(2)用如下年龄与血红蛋白的检测数据分别拟合简单线性、二次与三次多项式,并评价

何种模型为优?

年龄 6 8 10 12 14 16 18 20 22

HB(克%)10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20

(3)某一食品中不同维生素E含量(X)对小白鼠喂养三月后的增重(Y)数据如下,

试问用何种回归模型最能描述其关系?

X0.34 0.29 0.28 0.42 0.29 0.40 0.66 0.74 0.45 0.60 Y0.62 0.35 0.75 1.35 0.48 0.92 6.35 5.98 2.32 1.15

(4)观察某地破伤风预防接种率与发病率数据如下表所示,试问:何种回归模型最能综

合表达该地破伤风发病率(Y)与预防接种率(X)的关系?

接种率X0.00 0.10 0.20 0.32 0.50 0.66 0.72 0.78 1.00 发病率Y8.70 7.80 5.59 3.53 2.18 1.98 1.85 1.50 1.35

54.给定R2=.44,N =50,k = 12,试计算调整确定系数2

a

R。

55.在多重回归分析中,将某一自变量(X i)的值乘以10,会对该自变量的回归系数产生何种影响?如果是对自变量值乘以10,又会对标准化回归系数产生何种影响?

56.考虑有四个与某疾病有关的因素与该病的患病率资料如表所示,试用该数据进行多重回归分析。

某疾病的患病率与四个影响变量

X1X2X3X4患病率(%)

Y

17 25 14 26 56.9

4 56 24 38 87.4

8 42 12 27 65.4

11 32 9 48 88.5

7 52 7 34 96.2

11 58 10 24 109.2

4 67 1

5

6 103.3

2 34 20 46 82

1 20 18 56 98.7

25 47 6 30 115.8

2 42 24 42 82.6

12 66 12 14 120.3

10 67 9 13 108.8

7 26 6 60 78.5

1 29 15 5

2 74.3

12 56 9 21 102.2

4 62 37 2

5 78.8

57.获得年龄与血红蛋白测量数据如下,试用该数据拟合简单线性、二次、三次多项式模型,并评价模型的拟合优度。

年龄中值 6 8 10 12 14 16 18 20 22 HB(g%)10.41 10.80 10.85 10.36 10.31 10.68 10.82 11.04 11.20

58. 如表是随机抽取的11名儿童的智力测试数据,试以IQ为因变量拟合多重线性回归模型。并讨论本例应用回归分析所存在的问题。

儿童智力测试数据

常识X1 算术

X2

理解

X3

拼图

X4

积木

X5

译码

X6

IQ

Y

14 13 28 14 22 39 54

10 14 15 14 34 35 37

12 12 19 13 24 39 28

7 8 7 9 20 24 19

13 12 24 12 26 38 36

19 15 23 16 24 38 28

19 16 26 21 38 69 53

9 10 14 9 31 46 40

10 8 15 13 15 43 51

9 8 12 10 22 43 55

12 10 20 14 12 28 42 59.根据下表的数据,计算:

①奥克拉荷马州和蒙塔那州的标准化死亡率;

②奥克拉荷马州和蒙塔那州的期望寿命。

美国1960年的人口分布及两个州的死亡率

年龄1960年美国人口

(千人)

奥克拉荷马州

死亡率r i(‰)

蒙塔那州

死亡率r i(‰)

0~4112 25.5 25.8

1~16209 1.2 1.2

5~35456 0.5 0.5

15~24020 1.2 1.6

25~22818 1.6 1.8

35~24081 2.9 3.1

45~20486 6.9 7.5

55~15572 14.8 16.3

65~10997 32.4 37.3

75~4634 79.0 87.3

85~929 190.4 202.8

合计179323

取自:Grove , R. D., and Hetzel,A.M.(1963). Vital Statistics Rates in the United States, 1940-1960.

National Center for Health Statistics, Washington DC.

60.根据表16-14的资料编制简略寿命表,并且分别将0岁组死亡率和60岁组死亡率改变为原来的50%、30%、10%再计算其期望寿命,比较0岁组期望寿命的变化。

1958年中国某山区少数民族男性人口数、死亡数

年龄组人口数死亡数年龄组人口数死亡数

0~99997 3521 40~90555 1651

1~96494 1156 45~88908 2439

5~95339 630 50~86484 3857

10~94621 438 55~82622 5789

15~94230 454 60~76840 8407

20~93856 637 65~68430 11508

25~93157 648 70~56923 14705

30~92471 829 75~42220 16329

35~91666 1112 80~25890 25890 61.2002年云南某地女性人口数、死亡数和肿瘤死亡数见表.

(1)请编制全死因简略寿命表。

(2)编制去肿瘤死亡后的去死因寿命表。

2002年云南某地女性人口数、死亡数和肿瘤死亡数资料

年龄组人口数死亡数肿瘤死亡数年龄组人口数死亡数肿瘤死亡数

0- 29890 563 1 45- 90756 265 153 1- 87540 113 3 50- 85671 429 196 5- 99862 120 9 55- 70682 598 292 10- 139541 135 13 60- 63842 894 348 15- 195424 155 15 65- 40685 1123 405 20- 211138 196 19 70- 30857 1568 269 25- 186543 234 37 75- 10364 1684 107 30- 126952 201 48 80- 4216 785 79 35- 103280 198 56 85- 986 452 11 40- 91258 210 76

62. 真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况列于表, 请分析不同治疗方案的白血病发病率及其相对危险性。

真性红细胞增多症病人经不同的放射线治疗后发生白血病的情况

治疗方案治疗人数白血病发病人数

未接受放射治疗133 1

接受X-线治疗 79 7

接受P32 治疗228 25

接受X-线 + P32 治疗 72 12

合计512 45

63. 一项石棉与肺癌死亡的历史前瞻性研究结果列于表, 试用分层分析方法阐明石棉对肺癌发病的影响, 并与不分层的分析结果相比较。

石棉与肺癌死亡的历史前瞻性研究资料

石棉工人非石棉工人

工龄(年)

人年数死亡数死亡率人年数死亡数死亡率10~89462 36 4.02 74395 14 1.88

20~51925 164 31.58 62528 86 13.75

30~17001 177 104.11 19360 96 45.59

40~8465 109 128.77 7236 41 56.66

合计166853 486 29.13 163519 237 14.49

64. 就第63题的资料(资料引自: 陈镜群主编: 职业流行病学)分别考察石棉工人中和非石棉工人中肺癌死亡率是否有随年龄上升的趋势。

65.一项膀胱癌患者及对照者吸烟史的病例-对照研究资料列于表, 试分析膀胱癌与吸

烟史之间的关系。

膀胱癌患者及对照者吸烟史资料

观察组有吸烟史无吸烟史合计

膀胱癌患者192 129 321

对照者156 181 337

合计348 310 658

66. 一项心肌梗塞发生前饮酒量的病例-对照研究结果列于表, 试计算优势比并进行趋势检验。

心肌梗塞患者及对照者的每日饮酒量

每日饮酒量(g) 病例数对照数

0 136 110

0~100 202 238

100~200 42 46

250+ 11 24

调查总数391 418

67. 两个重要命题:病例-对照研究中不同疾病状态下暴露于危险因素这一事件的优势之比等于追踪研究中不同暴露水平下发病这一事件的优势之比; 在发病率很低(如小于1%)的情况下, 后者很接近相对危险度。

(1)以D和D表示病例和对照,E和E表示暴露和无暴露,试用条件概率

()D E P,()D E P,()D E P和()D E P以及()E D P,()E D P,()E D P和()E D P表示上述两

种优势比。

(2)试利用Bayes公式证明这两种优势比相等。

(3) 证明发病率很低时, 后者很接近相对危险度。

68. 一项乳腺癌与授乳史关系的1:1配对病例-对照研究资料列于表, 试计算优势比以分析有无授乳史对乳腺癌发病的影响。如果按非配对公式计算优势比, 其数值有何变化?

乳腺癌与授乳关系的1:1配对病例-对照研究资料

乳腺癌病人的授乳史

对照者授乳史有授乳史无授乳史合计

有授乳史27 65 92

无授乳史23 43 66

合计50 108 158

69. 42名确诊的白血病患者被随机分为2组,其中一组服用6-疏嘌呤(6-MP),另一组服安慰剂,服药后症状缓解时间如表所示。试估计两组缓解率并绘制生存曲线,给出各组中位缓解时间并推断生存曲线是否不同?

70. 为探讨某恶性肿瘤的预后,收集了31名该肿瘤患者的生存时间T(月)、结局Y(0为死亡,1为删失)及可能的影响因素。影响因素包括病人年龄age (岁)、性别sex (1男,0女)、组织学类型type(1为高分化,0为低分化)、治疗方式treat (1为传统方法,0为新方法)、是否有淋巴结转移lym(1是,0否)等。分别作每个自变量的单因素Cox回归、包括所有自变量的多因素Cox回归以及逐步回归,结果如表1、表2和表3所示,试就此结果做出你认为合理的分析结论。

表1 31名恶性肿瘤患者生存资料单因素Cox回归结果

变量自由度回归系数b b的标准误2χP值-2ln(L) RR∧RR95%置信区间上限下限

age 1 -0.00251 0.02074 0.0146 0.9037

133.893 0.997 0.958

1.039

sex 1 1.25673 0.46349 7.3519 0.0067

125.795 0.285 0.115 0.706

0.151 0.827

type 1 1.04060 0.43375 5.7557 0.0164

128.140 0.353

treat 1 0.56352 0.47830 1.3881 0.2387

132.406 1.757 lym 1 -0.37253 0.45450 0.6718 0.4124

133.206 0.689 0.688 4.486

0.283

1.679

表2 31名恶性肿瘤患者生存资料多因素Cox回归结果(-2ln(L)=104.979)

变量自由度回归系数b b的标准误2χP值

RR∧RR95%置信区间上限下限

age 1 0.01994 0.02364 0.7109 0.3992 1.020

0.974 1.069 sex 1 3.46658 0.89535 14.9905 0.0001 0.031

0.005 0.181 0.007 0.211 type 1 3.24466 0.86096 14.2026 0.0002 0.039

treat 1 1.93508 0.81330 5.6610 0.0173 0.144

lym 1 1.27890 0.75620 2.8602

0.0908 3.593

0.029 0.711 0.816 15.816

表3 31名恶性肿瘤患者生存资料多因素Cox 逐步回归结果(-2ln(L )=108.033)

变量 自由度 回归系数b b 的标准误 2χ P 值

RR ∧

RR 95%置信区间 上限 下限 sex 1 3.35018 0.92938 12.9942 0.0003 0.035

0.006 0.217 0.029 0.317 type 1 2.35071 0.61346 14.6836 0.0001 0.095

treat 1 2.07064 0.85168 5.9110 0.0150 0.126

0.024 0.669

71.收集了1994~1998年反映医疗质量的7项指标值如表所示,

(1)试采用Topsis 法对该医院5年的医疗质量进行综合评价。

1994~1998年某医院医疗质量指标

年度

1X 2X 3X 4X 5X 6X 7X 1994

21584 76.7 7.3 1.01 78.3 97.5 2.0 1995

24372 86.3 7.4 0.80 91.1 98.0 2.0 1996

22041 81.8 7.3 0.62 91.1 97.3 3.2 1997

21115 84.5 6.9 0.60 90.2 97.7 2.9 1998 24633 90.3 6.9 0.25 95.5 97.9 3.6

注:1X -出院人数, 2X –病床使用率(%), 3X –出院者平均住院日,4X –病

死率(%)

5X –危重病人抢救成功率(%)

,6X –治愈好转率,7X –院内感染率(%)

(2)试采用层次分析法对该医院5年的医疗质量进行综合评价。

(3)比较两种方法评价的结果。

72.就下表资料练习Meta 分析。

3项某降脂药物的疗效的RCT 实验结果

研究 治疗组 对照组

样本量 均数 标准差 样本量 均数 标准差

1 13 5.0 4.7 13 6.5 3.8

2 30 4.8 2.7 48 6.0 2.4

3 36 22.5 3.5 28 24.9 10.8

4 58 12.3 2.9 49 13.4 3.8

5 43 9.8 3.2 38 7.4 2.6

(1)对资料作同质性检验,正确选择统计分析模型。

(2)利用电脑实验中的程序对资料进行Meta 分析,并与上述结果比较。

73.某研究者拟分析心肌梗死病人服用阿司匹林预防死亡的效果,经过检索得到下表资

料。

7项心肌梗死病人服用阿司匹林预防死亡的研究

死亡数/病人数

研究编号阿司匹林组安慰剂组

1 49/615 67/624

2 44/758 64/771

3 32/317 38/309

4 102/832 126/850

5 85/810 54/406

6 246/226

7 219/2257

7 1570/8587 1720/8600

(1)如何进行资料的同质性检验?怎样选择Meta分析的统计模型?

(2)利用电脑实验中的程序对资料进行统计分析,并作出结论。

(三)思考题

⒈某医生欲比较某饮食疗法与一种药物疗法对降低血清胆固醇含量的疗效,选择了40

名高脂血症病人。设立了4个组 正常饮食组; 饮食疗法组; 药物组; 药物+饮食疗法组。请问最好采用何种试验设计方案,并简述其理由。

⒉为研究膳食中添加赖氨酸盐后对正常儿童生长发育有无影响,拟在面包中添加L-赖

氨酸盐后用幼儿园的学生进行干预试验。问

(1)可采用何种设计方案?

(2)如何设置对照?

(3)观察指标有哪些?

(4)需控制哪些非处理因素?如何控制?

3.为进行对苯二甲酸、乙二醇联合作用对肾脏损伤的实验研究,将48只SD大鼠随机

分为到对苯二甲酸组、乙二醇组、苯二甲酸+乙二醇和生理盐水组,每组12只。

(1)你认为最好选用那种试验设计方案?并说明理由。

(2)如果研究的目的为比较苯二甲酸、乙二醇对肾脏是否有损伤,损伤是否有差异,又该

选用何种设计方案?

⒋为何多个均数的比较不能直接作两两比较的t检验?若要采用两两比较的t检验,则

其检验水准和两样本均数之差的标准误该作何调整?

⒌方差分析中的F检验为何是单侧检验?

⒍三个样本均数的比较经ANOVA有统计学意义,在多重比较中出现了“不拒绝μ1=μ2,

也不拒绝μ1=μ3,但拒绝μ2=μ3”的结果,该结果应如何解释?为什么?

⒎是否一定要经ANOVA发现有统计学意义后,再作均数间的两两比较?

⒏为研究三种不同处理下大白鼠血糖浓度随室温(℃)的变化,抽取条件相同或

相近的24只大白鼠随机分配于三种不同处理的八种室温下进行实验,结果见表:

不同处理及不同室温下大白鼠的血糖浓度(g/L)

处理0℃5℃10℃15℃20℃25℃30℃35℃

A 0.98 0.96 1.10 1.08 1.20 1.25 1.40 1.45

B 0.86 0.80 1.00 1.16 1.15 1.30 1.20 1.40

C 0.90 0.95 0.98 1.20 1.22 1.36 1.35 1.50

问:(1)该资料是随机区组设计资料还是重复测量资料?为什么?

(2)三种处理的血糖浓度是否不同?八种室温的血糖浓度是否不同?

⒐ Pearson积差相关系数r经检验无统计学意义,是否意味着两变量间一定无关系?

⒑ Pearson积差相关系数r经检验有统计学意义,P值很小,是否意味着两变量间一定有很强的线性关系?

⒒在云南省漫湾地区建立了一个漫湾电站。欲了解该电站对漫湾地区的生态环境、对周围居民健康是否有影响及影响程度,请作一个调查设计。

⒓根据我们对全国出生缺陷监测资料的统计分析,发现神经管缺陷的发生具有明显的季节性,表现为1-3月份出生的孩子的发生率较高。今欲调查其原因,应采取什么调查方法?

请做出完整的调查设计并制定出调查表。

13.欲了解某县育龄妇女下生殖道感染情况及其影响因素,该县有人口95000人,育龄妇女占30%,其中70%已婚,拟调查已婚育龄妇女3000人,请作一个抽样调查方案。

14.欲了解某市糖尿病患病情况及其影响因素,请作一个调查设计。

15.欲了解某市某小学在校学生的近视眼患病情况。该校共有6个年级,每个年级10个班,每班50人左右。欲通过分层整群抽样,调查600名学生,如何抽样?

16. 地区A 共有25名社区医生。假定客观上各位社区医生的学历和上个月家访的次数如下表所示。

25名社区医生上个月家访的次数

医生 1 2 3 4 5 6 7 8 9 10 次数 3 5 4 7 6 1 2 4 12 0 大学毕业 1 1 1 1 1 1 1 1 1 1 医生 11 12 13 14 15 16 17 18 19 20 次数 0 3 10 11 9 8 7 5 12 9 大学毕业 1 1 0 0 0 0 0 0 0 0

请从中随机抽取5名,获得调查数据后,估计该地区社区医生上个月家访的总次

数、每名医生家访的次数和该地区社区医生中大学毕业的所占百分比。并且思考下述问题:

(1)将你的结果和真值比较,有何发现?如何解释?

(2)将你的结果和你的同学所得结果比较,有何发现?如何解释?

(3)如果将这次调查视为预调查,下次正式调查应该怎么做?

17.如果事先知道每一位社区医生的学历情况,便可根据大学毕业与否将第一题的资料分为两层。请在这一总体中作按比例分层随机抽样调查,总样本量为5名。试估计该地区社区医生上个月家访的总次数、每名医生家访的次数。并且也思考第16题提出的3个问题。

18. 另一地区B 共有社区医生40名,其他情况与上述地区类似。他们也准备用简单随机抽样作同样目的的调查,要求相对误差不超过30%,置信系数达到95%。请参考第16题的计算结果估算样本量。

19. 如果事先知道地区B 每一位社区医生的学历情况,便可根据大学毕业与未毕业将该地区的社区医生分为两层,设15,2521==N N 。欲在这一总体中作按比例分层随机抽样调查,要求相对误差不超过30%,置信系数达到95%。请参考第17题的计算结果估算样本量。

20. 某市按地理位置划分成30个学区,每学区有4所小学。经一阶段整群抽样,抽得3个学区。对这3个学区的每一所学校调查了学生总数和色盲的人数,数据见下表: 3个学区各学校的学生总数和色盲人数

学区编号 学校编号 学生人数 色盲人数

1 1 430 7

2 610 12

3 630 12

4 510 20

8 1 360 8

2 510 17

3 420 4

4 490 3

17 1 370 16

2 530 10

3 430 3

4 220 3

试估计该市共有多少小学生,多少色盲小学生,以及小学生中色盲者所占百分比。

21. 视第20题为预试验,在此基础上估算正式作一阶段整群抽样调查所需的样本量。要求相对误差不低于30%,置信系数达到95%。

22. 第20题属于一阶段整群抽样,其中的“群”是什么?可否用分层随机抽样达到同一目的?这时的“层”是什么?

23.围绕估计总体均数所需样本量的估算公式讨论,何时采用完全随机抽样?何时采用分层随机抽样?何时采用一阶段整群抽样?

24.甲、乙两地女性乳腺癌死亡率(1/10万)资料如下表所示。

(1)分别用以下标准人口通过直接法标准化比较两地女性乳腺癌死亡率,并讨论:①以甲地人口为标准人口。

②以乙地人口为标准人口。

③以甲乙两地人口合计为标准人口。

(2)分别用以下标准死亡率死亡率间接法标准化比较两地女性乳腺癌死亡率,并讨论:

①以甲地死亡率为标准死亡率。

②以乙地死亡率为标准死亡率。

③以甲乙两地相同年龄组死亡数之和除以人口数之和求出两地合并年龄别死亡率,以此为标准死亡率。

甲、乙两地女性乳腺癌死亡率(1/10万)资料

年龄组(岁)

甲地乙地

人口数人口分布死亡数死亡率人口数人口分布死亡数死亡率

0~193740 0.53 2 1.03 229800 0.58 3 1.31 30~55400 0.15 6 10.83 65400 0.17 5 7.65 40~43500 0.12 12 27.59 41000 0.10 13 31.71 50~38500 0.10 14 36.36 29800 0.08 11 36.91 60~25400 0.07 9 35.43 17300 0.04 7 40.46 70~12300 0.03 4 32.52 11200 0.03 5 44.64 合计368840 1.00 47 12.74 394500 1.00 44 11.15 25.甲、乙两地慢性阻塞性支气管炎患病率资料见下表:

(1)分别用以下标准人口通过直接法标准化来比较两地慢性阻塞性支气管炎患病率,并

讨论:①以甲地人口为标准人口。

②以乙地人口为标准人口。

③以甲乙两地人口合计为标准人口。

(2)分别用以下标准通过间接法标准化来比较两地慢性阻塞性支气管炎患病率,并讨论:①以甲地患病率为标准患病率。

②以乙地患病率为标准患病率。

③以甲乙两地相同年龄组患病数之和除以人口数之和求出两地合并年龄别患

病率,以此为标准患病率。

甲、乙两地慢性阻塞性支气管炎患病率资料

年龄组(岁)

甲地乙地

人口数人口分

布%

患病

人数

患病

率%

人口数人口分

布%

患病

人数

患病

率%

0~12100 3.93 54 0.45 12300 3.29 32 0.26 10~34200 11.10 120 0.35 39800 10.64 63 0.16 20~83400 27.07 965 1.16 96350 25.76 868 0.90 30~53400 17.33 1284 2.40 63200 16.90 986 1.56 40~49700 16.13 5369 10.80 58600 15.67 4621 7.89 50~32100 10.42 3864 12.04 49320 13.18 4952 10.04 60~28900 9.38 4036 13.97 36200 9.68 6351 17.54 70~14300 4.64 2785 19.48 18300 4.89 5398 29.50 合计308100 100.00 18477 5.99 374070 100.00 23271 6.22

26. 设一配对设计的病例-对照研究资料,用非条件logistic回归作分析,对结果有什

么影响?

27. 某人在分析疾病发生与X1和X2两变量关系时,单个引入X1或X2都有统计学意义,

但两变量同时引入时却都没有统计学意义,为什么?

28. 在随访某工厂1000人的队列研究中,暴露于危险因素(苯)的900人中有194人

出现白细胞减少,非暴露人群100人中有21人出现该症状。再随访另一工厂1000人,暴露

组100人中有6人出现白细胞减少,非暴露组900人中则有29人出现该症状。两工厂的资料合并得表。

两工厂资料的合并

E+ E- 合计

D+ 200 50 250

D- 800 950 1750

合计1000 1000 2000

试用经典方法估计OR值并做 2检验,再用单因素logistic回归估计OR并做Wald检验,比较结果。进一步讨论各工厂分开分析与合并分析结果的差异及解决方法。

中南大学以学统计学精品课程网站:

https://www.docsj.com/doc/6b18981658.html,/JPKC2006/China/04yxtjx/index.asp

中南大学统计学课件

习题 《卫生统计学》第五版(五年制预防医学用) (一)名词解释与简答题 1.名词解释 (1)负担系数(2)总和生育率(3)生存率(4)潜在减寿年数 (5)试比较发病率与患病率, 死亡率与病死率。 2、简述二项分布、Poisson分布、正态分布的区别与联系。 3、简述控制图的基本原理。 4、简述双侧正态分布资料的医学参考值范围为什么是均数±1.96倍标准差。 5、样本均数的抽样分布有何特点? 6、样本均数的标准误的意义是什么?与标准差有何区别和联系? 7、与标准正态分布比较,t分布的特点是什么? 8、用同一份样本指标去估计总体参数的95%置信区间与99%置信区间,两者比较,哪一 个估计的精度好?为什么? 9、假设检验的理论依据是什么? 10、假设检验的两类错误之间的区别与联系是什么? 11、t检验的应用条件是什么? 12、假设检验中P值的意义是什么? 13、如何确定检验水准? 14、如何恰当地应用单侧与双侧检验? 15、什么情况下可以借用正态近似法估计总体概率的置信区间? χ检验的用途。 16、简述2 17、比较两个独立样本频数分布的χ2检验,和比较配对样本两个频数分布的χ2检验在设计 方法、资料整理、假设检验等方面的差别是什么? 18、举例说明如果实验效应用等级资料表示,比较两组总体效应间差别是否有统计学意义 χ检验? 为什么不能用2 19、为什么有些四格表(或R×C表)必须要计算确切概率? 20、实验研究和调查研究的根本区别是什么? 21、实验设计的三个基本原则是什么? 22、在临床试验中使用安慰剂的目的是什么? 23、随机化的目的是什么? 24、试验设计的基本要素包括哪些? 25、估计样本含量时,所定容许误差与样本量有何关系? 26、配对设计的目的是什么? 27、避免医生和病人对实验效应观察的偏性,设计时应注意什么? 28、为明确某新化妆品对皮肤有无损害作用,将12只大白兔的左背部涂抹该化妆品,右侧 涂生理盐水作为对照,72小时后观察皮肤反应。这属于什么对照? 29、琴纳用牛痘疫苗接种23人后再接种天花,结果无人患天花,而当时一般人接触天花病 人后,天花的发病率约90%。琴纳所用的属于什么对照? 30、为比较A、B两种减肥药对肥胖病人的减肥效果。将60名肥胖患者按性别相同,体重 相近配成30对。每对患者随机分配入A、B两药组,30天后比较A、B两组患者体重的下降值(kg)。 (1)该实验属何种设计方案? (2)变量或资料(体重下降值)属何种类型 (3)其结果可用何种统计分析方法进行分析 31、什么是析因设计?其主要特点是什么? 32、何为交叉设计?它有何优缺点? 33、方差分析的基本思想是什么?总离均差平方和以及总自由度怎样计算? 34、两样本t检验与完全随机设计资料的ANOV A有何关系?配对样本t检验与随机区组设 计资料的ANOV A又有何关系? 35、举例说明何谓交互效应?并绘制交互效应图。

中南大学卫生统计学复习题及参考答案

20XX年中南大学卫生统计学复习题及参考答案 《卫生统计学》课程复习资料 一、名词解释: 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.变异 7.频数表8.算术均数 9.中位数10.极差 11.方差12.标准差 13.变异系数14.正态分布15.标准正态分布16.统计推断17.抽样误差18.标准误 19.可信区间20.参数估计21.假设检验中P的含义22.I型和II型错误23.检验效能24.检验水准25.方差分析26.随机区组设计27.相对数28.标准化法29.构成比30.Yates校正31.非参数统计32.直线回归33.相关系数34.统计图 35.回归系数

二、单项选择题: 1.观察单位为研究中的 [D ] A.样本 B.全部对象 C.影响因素 D.个体 2.总体是由 [ C] A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 3.抽样的目的是 [ B ] A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体统计量 4.参数是指 [ B ] A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 5.关于随机抽样,下列哪一项说法是正确的? [ A ] A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好

6.各观察值均加(或减)同一数后 [ B ] A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用 [ A ] A.变异系数 B.方差 C.极差 D.标准差 8.以下指标中( )可用来描述计量资料的离散程度。 [ D ] A.算术均数 B.几何均数 C.中位数 D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是 [ C ] A.算术平均数 B.中位数 C.几何均数 D.平均数 10.两样本均数的比较,可用 [C ] A.方差分析 B.t 检验 C.两者均可 D.方差齐性检验 11.配伍组设计的方差分析中,?配伍等于 [ D ] A.?总-?误差 B.?总-?处理 C.?总-?处理+?误差 D.?总-?处理-?误差

中南大学统计学原理复习题及参考答案

中南大学网络教育课程考试复习题及参考答案 统计学原理 一、选择题: 1.当44=β时,次数分布曲线为 [ ] A.正态峰度 B.平顶峰度 C.尖顶峰度 D.无法判断 2.不属于估计量优劣标准的是 [ ] A.无偏性 B.一致性 C.有效性 D.同质性 3.下列标志中属于质量指标的有 [ ] A.总产量 B.播种面积 C.亩产量 D.总产值 4.下列标志中属于品质标志的有 [ ] A.年龄 B.学历 C.体重 D.性别 5.某公司2006年8月销售额为10 万元,此指标属于 [ ] A.时点指标 B.质量指标 C.实物指标 D.相对指标 6.某生产小组四名工人的日产量分别为20件、21件、18件、24件,这四个数值是 [ ] A.指标 B.标志 C.变量 D.标志值 7.研究某市职工家庭生活状况,总体是 [ ] A.该市职工家庭户数 B.该市全部居民住户 C.该市全部职工 D.该市全部居民 E.该市全部职工家庭 8.检查某种机械零件的直径,结果尺寸大都不相同,这种情况在统计学中称为 [ ] A.变量 B.变异 C.标志 D.标志表现 E.可变标志 9.在组距数列中,用组中值作为组内变量值的代表值,是因为 [ ] A.组中值比组平均数准确 B.组中值就是组内各变量值的平均数 C.组中值计算容易 D.不可能得到组平均数 10.统计分组的关键是 [ ] A.确定分组标志 B.编制分配数列 C.确定组数 D.确定组距 11.在相对指标中,计算结果一定小于 100%的有 [ ] A.比较相对指标 B.比例相对指标 C.结构相对指标 D.强度相对指标 12.已知不同等级苹果的销售额和销售单价,计算苹果综合平均售价,用( )计算。 [ ] A.简单算术平均数 B.加权算术平均数 C.调和算术平均数 D.几何平均数 13.从全及总体中抽出来进行调查的那部分单位所组成的整体叫 [ ] A.总体 B.样本 C.样本单位 D.抽样总体 E.样本容量 14.(甲)对专业工龄不到一年的两个工作班进行工时测定,以便确定这些工人制造某种零件的时 间消耗;(乙)为测定车间工时损失,对车间各班每隔3班抽1班工人进行调查。哪一种调查 属于抽样调查 [ ] A.甲 B.乙 C.甲、乙 D.二者均不是 15.100(1-α)%是 [ ] A.置信限 B.置信区间 C.置信度 D.可靠因素 E.精确度 16.εββ++=x y 10的估计模型为 [ ] A.01y x ββ=+ B.01?y x β β =+ C.x y E 10)(ββ+= D.x y 10???ββ+= 17.某城市猪肉价格6月为10元/斤,8月为8元/斤,则 [ ] A.上升80% B.下降80% C.上升20% D.下降20% 18.将总量指标在不同时间上的数值按时间先后顺序排列形成的数列是 [ ] A.总量指标时间数列 B.相对指标时间数列 C.平均指标时间数列 D.结构指标时间数列 19.温度可以运用( )来测度。 [ ] A.定类尺度 B.定序尺度 C.定距尺度 D.定比尺度

中南大学《卫生统计学》课程作业(网上作业)一及参考答案

(一) 单选题 1. 将一个正态分布的资料所有的原始数据都乘以一个大于1的常数,下列说法正确的 是()。 (A)均 数 不 发 生 改 变 (B) 标准 差将 不发 生改 变 (C) 均数 是否 变化 不一 定 (D) 变异 系数 不发 生改 变 (E) 中 位 数 不 发 生 改 变 参考答案: (D) 2. 关于偏态分布资料说法不正确的是()。 (A)正偏态资料的频数分布集中位置偏向数值大的一侧 (B) 负偏态资料的频数分布集中位置偏向数值大的一侧 (C) 偏态分布资料频数分布左右不对称 (D) 不宜用均数描述其集中趋势 (E) 不宜用变异系数来描述其离散程度 参考答案: (A) 3. 将一个正态分布的资料所有的原始数据都加上一个正数,下列说法正确的是()。 (A)均数将增大,标准差不改变 (B) 均数和标准差均增大

(C) 均数不变,标准差增大 (D) 不一定 (E) 均数和标准差均没有变化 参考答案: (A) 4. 为了制定尿铅的正常值范围,测定了一批正常人的尿铅含量,下列哪种说法正确()。 (A)无法制定,要制定正常值范围必须测定健康人的尿铅含量 (B) 可以制定,应为单侧上限 (C) 可以制定,应为单侧下限 (D) 可以制定,但是无法确定是上侧范围还是下侧范围 (E) 可以制定双侧95%的参考值范围 参考答案: (B) 5. 下列关于变异系数的说法,错误的是()。 (A)与标准差一样都是用来描述资料变异程度的指标,都有单位 (B) 可以比较计量单位不同的几组资料的离散程度 (C) 可以比较均数相差悬殊的几组资料的离散程度 (D) 变异系数的实质是同一个资料的标准差与均数的比值 (E) 变异系数可以用来描述正态分布资料的变异程度 参考答案: (A)

中南大学《卫生统计学》课程作业(网上作业)二及参考答案

(一) 单选题 1. 构成比具有的特点为()。 (A)各个组成部分的构成比之和等于100%或1 (B) 各个组成部分的构成比之和小于100%或1 (C) 各个组成部分的构成比之和大于100%或1 (D) 各个组成部分的构成比之和大于或小于100%或1 (E) 以上都不对 参考答案: (E) 2. 配对资料的秩和检验,统计量的确定为()。 (A)只可取T+作为统计量 (B) 只可取T-作为统计量 (C) T+、T-可任取一个作为统计量 (D) 只以绝对值小的作为统计量 (E) 以上均不对 参考答案: (C) 3. 等级资料两样本比较的秩和检验中,如相同秩次过多,应计算校正值,校正结果 使()。 (A)值增大,值减小

(B) 值增大,值增大 (C) 值减小,值增大 (D) 值减小,值减小 (E) 视具体资料而定 参考答案: (A) 4. 下列哪种说法是错误的()。 (A)计算相对数尤其是率时应有足够数量的观察单位数或观察次数 (B) 分析大样本数据时可以用构成比代替率 (C) 应分别将分子和分母合计求合计率或平均率 (D) 相对数的比较应注意其可比性 (E) 样本率或构成比比较时应作假设检验 参考答案: (B) 5. 甲、乙两个医院的等级相同,规模相当。在某年疾病统计中发现:甲院对5型肝炎 的治愈率都高于乙院,但总的治愈率却是乙院的总治愈率反而高于甲院的总治愈率,造成这种矛盾现象,最可能的原因是()。 (A)两个医院对预后的诊断标准不一致 (B) 两个医院各型病人的构成比相差太大 (C) 两个医院医疗技术相差悬殊 (D) 两个医院的领导重视程度相差悬殊

(E) 两个医院的设备相差太大 参考答案: (B) 6. 样本含量分别为的两组数值变量资料比较,用秩和检验时有()。 (A)秩次范围为 (B) 秩次范围为 (C) 秩次范围为 (D) 秩次范围为 (E) 无限个秩次 参考答案: (C) 7. 设配对设计资料的变量值为,则配对资料的秩和检验()。 (A)分别按从小到大编秩 (B) 把所有观察值从小到大编秩 (C) 把所有观察值按绝对值从小到大编秩 (D) 把的差值从小到大编秩 (E) 把的差值的绝对值从小到大编秩 参考答案: (E)

中南大学《卫生统计学》课程作业(网上作业)三及参考答案

(一) 单选题 1. 关于回归系数的描述,下列说法错误的是()。 (A),表示回归直线与y轴交点在原点上方 (B) ,回归直线与x轴平行 (C) 越大,则回归直线越陡 (D) b一般有单位 (E) 表示回归直线从左上方走向右下方 参考答案: (A) 2. 在同一双变量(x,y)的相关与回归分析中,下列说法正确的是()。 (A) r值与b值毫无数量关系 (B) r值和b值的符号毫无关系 (C) r值与b值的符号相同 (D) r值与b值相等 (E) r值与b值有相同的单位 参考答案: (D) 3. 直线回归分析中,有直线回归方程=0.004+0.0488X,代入两点描出回归线。下面选项中哪项正确()。 (A) 所有实测点都应在回归线上

(B) 所绘回归直线必过点(,) (C) 原点是回归直线与Y轴的交点 (D) 回归直线X的取值范围为(-1,1) (E) 实测值与估计值差的平方和必小于零 参考答案: (B) 4. 为进行某地乙肝患病家族聚集情况的调查,其调查对象和观察单位分别为()。 (A) 该地 全体 人 口、 个人 (B) 该地 常住 人 口、 个人 (C) 该地 全体 人 口、 家庭 (D) 该地 常住 人 口、 家庭 (E) 以 上 均 不 对 参考答案: (D) 5. 回归系数b的t检验,其自由度为()。 (A) n (B) 2n-1 (C) (D) (E) 以上说法都不对 参考答案: (D) 6. 直线相关分析中,下列描述错误的是()。

(A) r没有单位 (B) r的取值范围为 (C) r的绝对值越接近1,表示两变量间相关关系密切程度越高 (D) =0表示完全相关 (E) 直线相关是描述具有直线关系的两变量的相互关系 参考答案: (D) 7. 若决定系数为0.04,则下列说法错误的是()。 (A) 散点图中所有的实测点都排列在一条回归线上 (B) 决定系数即是 (C) y的总变异中有4%可以由x的变化来解释 (D) 相关系数=0.2 (E) 回归贡献相对较小 参考答案: (A) 8. 双盲的目的是为了()。 (A) 减小试验过程中的随机误差 (B) 增加研究对象的依从性 (C) 防止试验过程中主观因素所造成的偏倚 (D) 防止选择性偏倚

中南大学研究生应用统计课件

中南大学研究生应用统计课件 数理统计的基本概念与抽样分布 §1.1 引言 什么是数理统计学?它的研究内容有哪些?这是每位初学者所关心的问题。 我们先看一个这样的例子: 某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作第一,对生产出来的钢筋的强度进行检测,获得必要的数据。这里有两种获得数据的方法,⑴对10000根钢筋的强度均进行检测,可得到10000个强度数据,这种检测方式称为全面试验,全面地进行试验一般是不可取的,它费时、费力、甚至于不可能。⑵从10000根钢筋中抽取一部分钢筋进行检测,得到部分强度数据。这里抽取部分钢筋进行检测的方式称为抽样。抽取的方式也有很多种方法,它是数理统计的一个重要内容,形成了试验设计与抽样理论。 第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。由于抽取的数据不全面,并且检测过程中每个数据还有测量误差(我们称为随机误差)。含有随机误差的数据会给我们带来一定影响,并且难以获得准确的结论。概率论就是解决这些问题主要数学工具。为解决这些问题所发展起来的理论和方法就构成了数理统计的内容。一般说来,数理统计是以概率论为主要的数学工具,研究如何有效地收集、整理和分析受随机影响的数据,并对所考虑的问题作出推断和预测,为决策和行动提供依据和建议的一门数学学科。 数理统计方法的应用十分广泛,几乎在人类活动的一切领域都能不同程度地找到它的应用。英国著名的统计学家费歇(R.A.Fisher)和皮尔逊(K.Pearson)是数理统计的奠基人,在20世纪初从事大量的数理统计方法的研究,就是出于在生物学、数量遗传学、优生学和农业科

432统计学(专业学位)考试大纲

附件七:432统计学(专业学位) 中南大学2012年全国硕士研究生入学考试 《统计学》考试大纲 本考试大纲由数学科学与计算技术学院学院教授委员会于2011年7月7日通过。 I.考试性质 统计学硕士专业学位《统计学》考试是为我校所招收统计学专业硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读统计学专业硕士学位所必须的基本素质、一般能力和培养潜能,以利于选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型的统计专业人才。 II.考试目标 《统计学》考试的要求是:测试考生掌握数据收集、处理和分析的一些基本统计理论和统计方法。 具体来说。要求考生: 1.掌握数据收集和处理的基本方法。 2.掌握数据分析的基本原理和方法。 3.掌握基本的概率论知识。 4.具有运用统计方法分析数据和解释数据的基本能力。

Ⅲ.考试形式和试卷结构 1、试卷满分及考试时间 本试卷满分为150 分,考试时间为180 分钟 2、答题方式 答题方式为闭卷,笔试。允许使用计算器(仅限具备四则运算和开方运算功能、不带有公式和文本存储功能的计算器),但不得使用带有公式和文本存储功能的计算器 3、试卷内容结构 本课程考试采用四种题型,具体题型及分值分布如下: 1、单选题,约25%; 2、简答题,约25%; 3、计算题,约40%。 4、问答题,约10% Ⅳ.考试内容 第一部分数据的搜集和整理 应在了解数据的计量尺度和类型的基础上,系统掌握统计调查方案的内容,并能根据特定的调查内容设计具体的调查方案;掌握统计调查的具体方法以及不同方法的特点及适用条件;重点掌握统计数据的整理及显示方法,能够运用所学习的方法

中南大学研究生医学统计学

1 •均数的标准误与标准差的区别: 均数的标准误 标准羞 总义 反映X 的抽样谋差大小 反映•组数据的离散悄况 记法 a x (吐) cr(S) (r x =a/\/n 肿(5 计算 S 牙=s/ 4n V N 0(5 V 川-1 挪J 方法 增加〃以标准唳 不能通过统讣方法*控制

1•答:有强度相对数(率)、结构相对数(构成比)、相对比三种。 率的含义:某现象实际发生的例数与可能发生的总例数之比,说明某现象发生的频率或强度。其特点为:说明某现象发生的强弱。 计算公式: 、"二某时期内发生某现象的观察单位数比例肚数 -同期可能发生某现彖的观察单位总数X 构成比的含义:事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布,通常以100为比例基数,乂称为百分比。其特点为:①一组构成比的总和应等于100%,即各个分子的总和等于分母;②各构成部分之间是相互影响的,某一部分比重的变化受到两方面因素的影响,其一是这个部分自身数值的变化,其二是受其它部分数值变化的影响。 计算公式: 切七“—某一组成部分的观察单位数lnno/ 构万 _同一事物各组成部分的观察单位总数X °

相对比的含义:是两个有关指标之比,说明两指标间的比例关系。其特点 为:两个指标可以是性质相同,也可以是性质不同;两个指标可以是绝对数、相对数或平均数。 计算公式: 相对比=雪啓(X100%)乙指标 2.计量单样本资料t检验与u检验的异同点: 同:(1)U的相同:均用于检验未知总体均数与已知总数是否相等 (2)分析步骤相同:建立假设确定a,计算检验统计量,确定P做出结论 (3)两者的前提条件相同:总体均数满足正态分布方差齐性 异:(1)分析对象不同:t检验适合小样本资料;u检验适合大样本资料 (2)计算公式不同: (3)t分布为实际分布,u分布为理论分布 (4)t分布适用于计量资料,u分布既适用于计量资料也适用于计数资料 5.假设检验时,一般当P<0. 05时,则拒绝H0,理论依据是什么? P值是指从H0规定的总体随即抽样抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。当P<0. 05时,说明在H0成立的条件下,得到现有检验结果的概率小于通常确定的小概率时间标准0. 05.因小概率事件在一次试验中儿乎不可能发生,现在的确发生了,说明现有样本信息不支持H0,所以怀疑原假设H0不成立,故拒绝H0。在下有差别的结论同时,我们能够知道犯1型错误的概率不会大于0.05,这在概率上有了保证。 4.均数的可信区间与参考值范用有何不同

中南大学应用统计培养方案

专业学位研究生培养方案 学位类别:383 应用统计硕士专业学位 专业领域名称025200 应用统计硕士 执行开始--终止年 级: 2011--2013 制订二级单位:数学科学与计算技术学院 一、专业概况 从1981年以来,我校先后获得概率论与数理统计、数量经济学和统计学专业等多个学科的硕士学位授予权,招生规模不断扩大,教学质量持续改善,在研究生的培养方面积累了很多成功经验。深厚的数理基础、多学科的相互渗透,为培养应用统计学专业硕士创造了极为有利的条件。我校在概率论及其应用、马尔可夫过程、数理金融、应用统计学等领域具有雄厚的研究基础,取得了大批在国内外颇具影响的重要研究成果。现有教授8人,博士生导师6人,副教授12人,主要学术带头人与学术骨干90%以上具有海外留学经历。另聘有国内外著名学者10余人为客座教授、兼职教授,定期前来讲学。近年来,承担国家、部省级课题10余项。统计实验室、创新数模实验室和多领域的实习基地,丰富的统计软件为学生提供了理论联系实际、操练专业技能的良好平台,同时也为他们的创新思维、自主探索提供了广泛的空间。 二、培养目标 应用统计学专业硕士的培养目标是:为工商企业、信息咨询业、金融投资业和政府经济管理部门培养具有良好思想素质和统计学素养、能够熟练地运用统计学方法和数据分析软件解决实际问题的高层次、应用型、复合型统计学专门人才。学员毕业后,可在相关部门从事商务调查、客户信息管理、市场预测与市场分析、风险评价与风险控制、统计质量管理、数据挖掘、系统可靠性分析等方面的应用和研究工作。 三、学科专业主要研究方向 序 号 研究方向代码名称研究方向英文名称 1 02520001 抽样调查与市场研 究 Sample survey and market research 2 0252000 3 商务统计Commercial statistics 3 0252000 4 宏观经济统计Macroeconomic statistics 4 0252000 5 统计质量管理Statistical quality control 5 02520002 风险投资与管理Venture capital investment and management 四、学习年限、课程学习时间与培养要求 1、掌握马克思主义基本原理和中国特色社会主义理论体系,具有良好的政治素质和职业

中南大学统计学博士研究生培养方案

中南大学统计学博士研究生培养方案 一、学科概况 统计学是一个国家经学科调整而新成立的理学一级学科。它是以 数学、应用数学和概率论理论为基础的具有广泛应用的学科。中南大 学拥有统计学科一级博士点授予权,是中南大学校级重点学科,拥有 与统计学相关的概率论与数理统计、流行病与卫生统计学和生物统计 等多个二级学科博士点和应用统计、金融、保险三个专业硕士点,其 中概率论与数理统计是1981年全国首批博士点、“十五”和“十一五”国家重点学科。统计学专业2000年开始相继招收本科生和研究生, 本学科点,结合中南大学在应用统计和应用概率等领域的研究特色, 在统计方法,统计应用和交叉学科等方面有一个完整的统计学科团 队。 本学科目前在应用统计和应用概率等方向招收博士研究生。 应用统计是将参数估计、假设检验、统计推断、方差分析、试验 设计、回归分析、相关分析和非参数建模等统计理论在自然科学与工 程技术,经济与金融,医药卫生以及社会科学等各个领域的应用,它 是统计学和其他学科之间的交叉学科。随着社会的发展和科学的进步,现在比以往任何时侯都更容易获得大量数据。从数据收集、标准化、 质量控制技术到超大规模数据库管理、检索技术以及数据知识和规律 的分析、综合、提炼等, 应用统计的理论和方法日益成为数据分析不 可缺少的工具。应用概率是将概率论的理论和方法应用于实际问题, 是统计学的一个重要分支,包括马尔可夫过程、随机过程及其应用, 主要有排队论与排队网络、复杂网络、风险与金融、随机动力学和随 机控制等方面。随着现代科学技术的迅速发展,应用概率已经广泛的 渗透到经济金融、交通运输、计算机与通讯、信息论、博弈论和随机

中南大学研究生医学统计学

频数表:频数表亦称频数分布表,是由变量值的分组 和各组段的例数构成 统汁描述:指选用恰当的指标,通常称为统计量,选用合适的统计表与统计•图,对资料的数量特征及其分布规律进行测定和描述。包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来 统汁推断:指如何在一定的可信度下山样本信息统计指标来推断总体相应指标, 乂称参数估计。包括进行推测、假设检验、确定关系然后作出预测,有点估计和区间估计。 小概率事件:统汁分析中的很多结论都是基于一定可信程度下的概率推断,习惯上将P〈二0. 05称为小概率事件,表示一次实验或观察中该事件发生的可能很小,可以视为可能不发生。 算术均数:简称均数可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。 儿何均数:可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料 中位数:是将变量值从小到大排列,位置居于中间的那个变量值。符号为Md, 反映一批观察值在位次上的平均水平。适用于:1、各种分布类型的资料2、特别是偏态分布资料和开口资料(一端或两端无确切数值的资料)。3、资料分布不明等 白分位数:将一组数据从大到小按顺序排列起来,并汁算相应的累计白分位(频率)。那某一百分位所对应的数据变量值就叫这一百分位的白分位数白分位数的应用:确定医学参考值范围;中位数Md与四分位半间距QD 一起使用,描述偏态分布资料的特征

参考值范RI:山于个体存在差异,医学数据,并不是常数,而是在一定范围内波动,是指包括绝大多数正常人形态、功能和代谢产物等各种生理及生化指标常数,也称正常值。 白分位数:数据从小到大排列;在百分尺度下,所占白分比对应的值。记为 Pxo包括直接算法和频数表法 应用:1.确定医学参考值范围:如9概参考值范围二P97. 5-P2. 5;表示有95%正常个体的测量值在此范围。2.中位数Md与四分位半间距QD 一起使用,描述偏态分布资料的特征抽样误差:山个体变异产生的,抽样造成的样本统讣量与总体参数的差异 方差也称均方差,样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。 标准差即方差的正平方根;其单位与原变量X的单位相同。 B x ,标准误:将样本统计量的标准差称~,样本均数的标准差称均数标准误,反映了样本均属间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小 自山度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自山度 变异系数:多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。医学参考值是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围作为判定正常和异常的参考标准。

中南大学《统计学原理》课程作业(在线作业)二及参考答案

(一) 单选题 1. 某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95%、92%、 90%、85%、80%,则整个流水生产线每道工序产品的平均合格率( )。 (A) 88.40% (B) 90% (C) 88.24% (D) 89.12% 参考答案: (C) 2. 数组8,4,6,2,10,15的中位数是( )。 (A) 6 (B) 2 (C) 7 (D) 4 参考答案: (C) 3. 数组72,76,77,78,80,81,81,84,84,85,87的极差是( )。 (A) 12 (B) 13 (C) 14 (D) 15 参考答案: (D) 4. 必然事件的概率为( )。 (A) 0 (B) 0.5 (C) 1 (D) 100 参考答案: (C) 5. 偏态系数的变动范围为( )。

(A) [0,1] (B) [-1,1] (C) [-3,3] (D) [-2,2] 参考答案: (C) 6. 犯“弃真”与“取伪”错误的概率的关系是( )。 (A) 此大彼小 (B) 同样大小 (C) 之和为1 (D) 没关系 参考答案: (A) 7. 假设检验的基本依据( )。 (A) 小概率原理 (B) 反证法原理 (C) 归纳法原理 (D) 演绎法原理 参考答案: (A) 8. 某生产班组每人的日生产量如表,则该班组工人平均日生产量( )。

(A) 15 (B) 16 (C) 17 (D) 16.5 参考答案: (B) 9. 总体方差 已知,关于均值的检验是( )。 (A) 检验 (B) 检验 (C) 检验 (D) 检验 参考答案: (A) 10. 对于任意两个事件,有( )。 (A ) (B ) (C ) (D ) 参考答案: (A) 11. ( )是计算平均指标最基本、最常用的方法。

中南大学《统计学原理》课程作业(在线作业)三及参考答案

(一) 单选题 1. 方差分析研究的对象是( )。 (A)因素(B) 水平(C) 颜色(D) 销量 参考答案: (A) 2. 在我国统计实践中,数量指标指数计算公式是( )。 (A) (B) (C) (D) 参考答案: (A) 3. 双因素相对数变动分析关系式是( )。 (A) (B)

(C) (D) 参考答案: (A) 4. 相关系数的取值范围是( )。 (A) (B) (C) (D) 参考答案: (A) 5. 一元线性回归模型随机尾项方差的无偏估计为( )。 (A) (B) (C) (D) 参考答案: (A) 6. 某地区2000年经济总量100亿元,2008年经济总量400亿元,则该地区这几年经济 总量的平均发展速度为( )。 (A)110.80% (B) 118.90% (C) 121.50%

(D) 119.60% 参考答案: (B) 7. 某企业9月末、10月末、11月末、12月末某商品库存分别为2260吨、2320吨、2314 吨、2350吨,则第四季度平均(每月)库存为( )。 (A)2311吨 (B) 2313吨 (C) 2320吨 (D) 2350吨 参考答案: (B) 8. 按统计指数的对比基期不同,统计指数分为( )。 (A)定基指数和环比指数 (B) 时间性指数、空间指数和计划完成指数 (C) 平均指数和综合指数 (D) 数量指标指数和质量指标指数 参考答案: (A) 9. 综合指数法中必须通过( )因素把指标过渡到具有可加性的综合指标。

(A)质量 (B) 数量 (C) 同度量 (D) 总量 参考答案: (C) 10. 年距增长量的计算公式为( )。 (A)年距增长量=年末水平-年初水平 (B) 年距增长量=报告期水平-基期水平 (C) 年距增长量=报告期水平-去年同期水平 (D) 年距增长量=报告期水平-上年同期水平 参考答案: (D) 11. 某城市猪肉价格6月为10元/斤,8月为8元/斤,则( )。 (A)上升80% (B) 下降80% (C) 上升20% (D) 下降20% 参考答案:

中南大学统计学专业培养方案-5.12

统计学专业本科培养方案 一、专业简介 统计学是关于数据科学的方法论学科。统计学专业培养掌握数据采集、处理、管理 与分析的方法和技能的专门人才。中南大学统计学专业是在“概率论与数理统计”全国 首批博士点、“十五”和“十一五”国家重点学科基础上发展而来。统计学专业2000年 开始相继招收本科生和研究生,2011年获得一级学科博士点授予权,是校级重点学科。统计学专业师资队伍结合中南大学在生物医学、经济管理和金融保险统计学科优势,在 统计理论、方法和应用等方面形成一个完整且具有特色的教学与科研团队。 二、培养目标 统计学专业旨在培养具有扎实的数学基础,系统掌握统计理论与方法,并具备良好 的软件编程能力,能熟练运用专业知识,通过计算机和统计软件进行建模,解决实际问题;能在政府管理部门、企事业单位、互联网公司等单位从事统计调查、数据管理与咨询、数据分析等方面的开发、应用和实际管理工作,或能在相关教育、科研部门从事教 学和研究工作的复合型专门人才。 三、培养要求 掌握统计学的基本理论和基本方法,进行统计调查、计算机和统计软件、数据分析与建模等方面的基本训练。 1. 知识要求 (1)掌握数学分析、代数、几何等数学基本理论,为统计学专业学习打好基础。 (2)掌握统计学基本思想、理论和方法。 (3)完成统计调查、数据分析和建模方面的基本训练。 (4)熟练运用计算机,学会应用专业统计软件,至少掌握一门编程软件(如R语言 或Matlab或Python等)。 (5)了解统计学的理论前沿、应用前景和最新发展动态。 (6)了解统计学应用领域的相关知识。 (7)熟练掌握一门外语。 2. 能力要求

(1)具有较强的语言表达和写作能力。 (2)具有统计调查、数据搜集、整理分析和撰写统计分析报告的能力。 (3)能熟练运用统计方法和统计软件对数据进行分析、计算和建模。 (4)能对相关领域的实际问题提炼和分析,进行统计建模与推断。 3.素质要求 (1)有积极的生活态度、健康的价值观、健全的心理和强健的体魄。 (2)有一定的组织管理能力、具备统计问卷和市场调查、分析与应用的基本素质。 (3)具备较高的统计专业素养,能灵活和系统的运用本专业基本方法对各类数据进 行计算和数量分析、统计推断和建模预测、对所建模型进行评估并能正确使用模型。 四、毕业学分要求 毕业学分要求 课程模块类别 必修课选修课合计占总学分 比例(%) 学分学时(周) 学分学时(周) 学分学时(周) 通识教育课程 理论教学29 548 8 128 37 676 20.61% 集中实践环节 4 4周 4 4周 2.23% 学科教育课程 理论教学40 640 40 640 22.28% 集中实践环节 专业教育课程 理论教学28.5 456 39 624 67.5 1080 37.60% 集中实践环节23 23周23 23周12.81% 个性培养课程 理论教学 2 32 2 32 1.11% 课外研学 6 6周 6 6周 3.34% 总计126.5 1676+27周53 752+6周179.5 2428+33周 其中:实践教学课内实践12.125 194 1 16 13.125 210 7.31% 集中实践27 27周27 27周15.04% 课外研学0.5 8 6 6周 6.5 8+6周 3.62% 合计39.625 202+27周7 16+6周46.625 218+33周25.97% 五、学制与学位 标准学制:4年,学习年限3-6年

xx年中南大学卫生统计学复习题及参考答案

xx年中南大学卫生统计学复习题及参考答 案 《卫生统计学》课程复习资料 一、名词解释: 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.变异 7.频数表 8.算术均数 9.中位数10.极差 11.方差12.标准差 13.变异系数 14.正态分布 15.标准正态分布16.统计推断 17.抽样误差 18.标准误 19.可信区间xx年麻疹发病率,其分母为[ E ] A.该地体检人数 B.该地年平均就诊人数 C.该地年平均人口数 D.该地平均患者人数 E.该地易感人群人数 32.两个独立小样本计量资料比较的假设检验,首先应考虑[E ] A.用t 检验 B.用u检验 C.用Wilcoxon秩和检验 D.检验或Wilcoxon秩和检验均可 E.资料符合t检验还是Wilcoxon秩和检验条件 33.若决定系数为,则下列说法错误的是[ A ] A.散点图中所有的实测点都排列在一条回归线上 B.决定系数即是r 的总变异中有4%可以x的变化来解释

D.相关系数r= E.回归贡献相对较小 34.老年人口系数下降,可使[ B ] A.粗死亡率上升 B.粗死亡率下降 C.婴儿死亡率上升 D.婴儿死亡率下降 E.以上都不对 35.标准化以后的总死亡率[ D ] A.标化后的率比原来的率低 B.标化后的率比原来的率高 C.反映了实际水平 D.反映了相对水平,仅作为比较的基础 E.不随标准选择的变化而变化 36.配对样本差值的Wilcoxon符号秩检验,确定P值的方法为[D ] 越大,P越大越大,P越小值在界值范围内,P小于相应的? 值在界值范围内,P大于相应的? 值即u值,查u界值表 37.关于回归系数的描述,下列说法错误的是[ A ] ?0,表示回归直线与y轴交点在原点上方 ?0,回归直线与x轴平越大,则回归直线越陡 一般有单位?0表示回归直线从左上方走向右下方 38.实验设计和调查设计的根本区别是[ D ] A.实验设计以动物为对象 B.调查设计以人为对象 C.实验设计可随机分组 D.实验设计可人为设置处理因素 E.两者无区别

2014年中南大学卫生统计学复习题及参考答案

《卫生统计学》课程复习资料 一、名词解释: 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.变异 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数 28.标准化法 29.构成比 30.Yates校正 31.非参数统计 32.直线回归 33.相关系数 34.统计图 35.回归系数 二、单项选择题: 1.观察单位为研究中的 [D ] A.样本 B.全部对象 C.影响因素 D.个体 2.总体是由 [ C] A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 3.抽样的目的是 [ B ] A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体统计量 4.参数是指 [ B ] A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 5.关于随机抽样,下列哪一项说法是正确的? [ A ] A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后 [ B ] A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用 [ A ] A.变异系数 B.方差 C.极差 D.标准差 8.以下指标中( )可用来描述计量资料的离散程度。 [ D ] A.算术均数 B.几何均数 C.中位数 D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是 [ C ] A.算术平均数 B.中位数 C.几何均数 D.平均数 10.两样本均数的比较,可用 [C ] A.方差分析 B.t 检验 C.两者均可 D.方差齐性检验 11.配伍组设计的方差分析中, 配伍等于 [ D ]

中南大学远程教育(卫生统计学)作业及答案

(一)单选题 1.描述定量资料集中趋势的指标有()。 (A) 均数、几何均数、变异系数 (B)均数、几何均数、四分位数间距 (C) 均数、变异系数、几何均数 (D) 均数、四分位数间距、变异系数 (E) 均数、几何均数、中位数 参考答案: (E) 2。排除了有序数列两端各()的观察值的影响。 (A)5% (B)10% (C)15%(D)20% (E) 25% 参考答案: (E) 3.下列关于确定正常人肺活量参考值范围说法正确的是()。 (A)只能为单侧,并且只有上限 (B)只能为单侧,并且只有下限 (C)只能为双侧,这样才能反映全面 (D)单双侧都可以 (E) 以上说法均不确切 参考答案: (B) 4. 下列关于医学参考值范围的说法中正确的是()。 (A)医学参考值范围是根据大部分健康人的某项指标制定的 (B)医学参考值范围的制定方法不受分布资料类型的限制 (C) 在制定医学参考值范围时,最好用95%范围,因为这个范围最能说明医学问题 (D)在制定医学参考值范围时,最好用95%范围,因为这样比较好计算 (E)以上说法均不正确 参考答案: (A)

5. 离散程度指标中,最容易受极端值影响的是()。 (A) (B) (C) (D) (E) 参考答案: (E) 6。频数分布两端无确切值的资料,宜用来描述其分布集中趋势的指标是()。 (A) (B) (C) (D) (E) 参考答案: (C) 7.对于一个两端都没有确切值的资料,宜用下列哪个指标来描述其集中趋势()。 (A) 几何均 数 (B) 均 数 (C) 方 差 (D) 中位 数 (E) 四分位数间 距 参考答案: (D) 8。下列关于标准正态分布的说法中错误的是()。 (A)标准正态分布曲线下总面积为1 (B)标准正态分布是=0并且=1的正态分布 (C) 任何一种资料只要通过变换均能变成标准正态分布 (D) 标准正态分布的曲线是唯一的 (E) 因为标准正态分布是对称分布,所以所对应的曲线下面积相等参考答案: (C) 9. 标准误越小,说明此次抽样所得样本均数().

相关文档