文档视界 最新最全的文档下载
当前位置:文档视界 › 第一章 统计案例

第一章 统计案例

第一章 统计案例
第一章 统计案例

12

1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;

2. 了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.

3. 会用相关指数,残差图评价回归效果.

复习1:用相关系数r可衡量两个变量之间关

系.r>0, 相关, r<0 相关; r越接近于1,两个变量的线性相关关系,它们的散点图越接近;r>,两个变量有关系.

复习2:评价回归效果的三个统计量:

总偏差平方和;残差平方和;回归平方和.

二、新课导学

※学习探究

探究任务:如何评价回归效果?

新知:

1、评价回归效果的三个统计量

(1)总偏差平方和:

(2)残差平方和:

(3)回归平方和:

2、相关指数:2R表示对的贡献,公式为:

2

R=

2

R的值越大,说明残差平方和,说明模型拟合效果.

3、残差分析:通过

来判断拟合效果.通常借助图实现.

残差图:横坐标表示,纵坐标表示.

残差点比较均匀地落在的区的区域中,说明选用的模型,带状区域

的宽度越,说明拟合精度越,回归方程

14

A. 很好

B. 较好

C. 一般

D. 较差

※ 当堂检测(时量:5分钟 满分:10分)计分: 1. 两个变量 y 与x 的回归模型中,分别选择了 4 个不同模型,它们的相关指数 2R 如下 ,其中拟合 效果最好的模型是( ).

A. 模型 1 的相关指数2R 为 0.98

B. 模型 2 的相关指数2R 为 0.80

C. 模型 3 的相关指数2R 为 0.50

D. 模型 4 的相关指数2R 为 0.25

2. 在回归分析中,残差图中纵坐标为( ). A. 残差 B. 样本编号 C. x D. n e

3. 通过12,,,n e e e 来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分工称为( ). A.回归分析 B.独立性检验分析 C.残差分析 D. 散点图分析

4.2R 越接近1,回归的效果 .

5. 在研究身高与体重的关系时,求得相关指数

2R = ,可以叙述为“身高解释了69%的体重变化,而随机误差贡献了剩余 ”所以身高对体重的效应比随机误差的 . 练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据

(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y bx a =+;

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?

(参考数值3 2.543546 4.566.5?+?+?+?=) (4)求相关指数评价模型.

§1.1.1回归分析的基本思想及其初步

应用(三)

由上表中的数据得到回归直线方程上图中,样本点的分布没有在某个区域,因

16

思考:评价这两个模型的拟合效果.

小结:利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行. 其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题.

三、总结提升 ※ 学习小结

利用线性回归方程探究非线性回归问题,可按“作散点图→建模→确定方程”这三个步骤进行.

※ 知识拓展

非线性回归问题的处理方法: 1、 指数函数型bx a y e +=

① 函数bx a y e +=的图像:

② 处理方法:两边取对数得ln ln()bx a

y e +=,即ln y bx a =+.令ln ,z y =把原始数据(x,y )转化为(x,z ),再根据线性回归模型的方法求出,b a . 2、对数曲线型ln y b x a =+ ① 函数ln y b x a =+的图像

② 处理方法:设ln x x '=,原方程可化为y bx a '=+ 再根据线性回归模型的方法求出,a b . 3、2y bx a =+型

处理方法:设2x x '=,原方程可化为y bx a '=+,再根据线性回归模型的方法求出,a b .

※ 自我评价 你完成本节导学案的情况为( ).

17

1.通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性;

2.会根据22?列联表求统计量2

K .

学习过程

一、课前准备

1214

复习1:回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤.

二、新课导学 ※ 学习探究 新知1:

1.分类变量: .

2. 22?列联表: .

试试:你能列举出几个分类变量吗?

探究任务:吸烟与患肺癌的关系

1.由列联表可粗略的看出:

(1)不吸烟者有 患肺癌; (2)不吸烟者有 患肺癌.

因此,直观上课的结论: . 2.用三维柱柱图和二维条形图直观反映: (1)根据列联表的数据,作出三维柱形图:

由上图可以直观地看出, 吸烟与患肺癌 .

(2) 根据列联表的数据,作出二维条形图:

由上图可以直观地看出, 吸烟与患肺癌 .

根据列联表的数据,作出等高条形图:

由上图可以直观地看出, 吸烟与患肺癌 .

反思:(独立性检验的必要性)通过数据和图形,我们得到的直观印象是患肺癌有关.那是否有一定的把握认为“吸烟与患肺癌有关”呢?

新知2:统计量2

K

吸烟与患肺癌列联表

18

第一步:提出假设检验问题

H

K观测值第二步:根据公式求2

20

C. 随机误差的贡献是89% C. 随机误差的贡献是0.89% 10、在吸烟与患肺病这两个分类变量的计算中,下

列说法正确的是 ( )

A .若k =6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.

B .从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能 性患肺病.

C .若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.

D .以上三种说法都不对.

11、3. 通过12,,,n e e e 来判断模拟型拟合的效果,

判断原始数据中是否存在可疑数据,这种分析称为

( )

A .回归分析

B .独立性检验分析

C .残差分析 D. 散点图分析

12、在独立性检验时计算的2

K 的观测值k =3.99,

那么我们有 的把握认为这两个分类变量有

关系 ( ) A .90% B .95% C .99% D .以上都不对

二、填空题(本大题共4小题,每题4分) 13、已知回归直线方程 0.50.81y x =-,则25x =时,y 的估计值为 . 14、如下表所示:

计算2

K = . 15、下列关系中:

(1)玉米产量与施肥量的关系; (2)等边三角形的边长和周长; (3)电脑的销售量和利润的关系; (4)日光灯的产量和单位生产成本的关系. 不是函数关系的是 .

16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的2

K =27.63,根据这一数据分析,我

们有理由认为打鼾与患心脏病是 的.(填

“有关”“无关”) 三、解答题(本大题共2小题,每题18分)

18、为考察某种药物预防疾病的效果,进行动物试验,

得到如下列联表

22

数学第一章统计案例测试1新人教A版选修1 2

高中新课标选修(1-2)统计案例测试题1 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足() A.23.841K?B.23.841K? C.26.635K?D.26.635K? 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代),剩下的4组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结 果(单位:人) 不患肺癌患肺癌不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91

9 965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90% B.95% C.99% D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89 你认为婴儿的性别与出生时间有关系的把握为() A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为yabx??,方程中的回归系数b() A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y(元)与铸件废品率x%建立的回归方程568c yx??,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r?,则x增大时,y也相应增大;②若0r?,则x增

统计学 统计学-——典型案例、问题和思想

经济管理类“十二五”规划教材统计学 -基于典型案例、问题和思想 主讲林海明

第一章绪论 【引言】我们从如下9个重要事例,说明统计学有什么用。 事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了

这些危险区域,使英军取得了空战的胜利。 事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。

事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。 事例4:在居民收入贫富差距的测度方

面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。 事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,

日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。 事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。 事例7:在产品质量检验方面,英国统

案例统计公式(绝对精华)

统计案例 一、回归分析 1. 线性回归方程???y bx a =+的求法 (1)求变量x 的平均值,即1231 ()n x x x x x n =+++???+ (2)求变量y 的平均值,即1231 ()n y y y y y n = +++???+ (3)求变量x 的系数?b ,即1 2 1 ()() ?() n i i i n i i x x y y b x x ==--=-∑∑(题目给出,不用记忆) 1 2 1()() ?() n i i i n i i x x y y b x x ==--=-∑∑ 1 1 1 1 2 2 1 1 1 2n n n n i i i i i i i i n n n i i i i i x y x y xy x y x xx x =======--+= -+∑∑∑∑∑∑∑1 22 21 2n i i i n i i x y nx y nx y nx y x nx nx ==--+= -+∑∑12 21 n i i i n i i x y nx y x nx ==-= -∑∑(理解记忆) (其中1 1 n n i i i x x nx ====∑∑,1 1 n n i i i y y ny ====∑∑,() ,x y 称为样本点中心) (4)求常数?a ,即??a y bx =- (5)写出回归方程???y bx a =+(?a ,?b 的意义:以?a 为基数,x 每增加1个单位,y 相应地平均增加?b 个单位) 注意:若?0b >则正相关,若?0b <则负相关. 2. 相关系数 假设两个随机变量的取值分别是()11,x y ,()22,x y ,……,(),n n x y ,则变量间线性相关系数的计算公式如下: ()() n n i i i i x x y y x y nx y r ---= = ∑∑ 相关系数r 的性质: (1)当0r >时,表明两个变量正相关;当0r <时,表明两个变量负相关;当0r =时,表明

统计案例试题及答案

10-4统计案例 基 础 巩 固 一、选择题 1.对于事件A 和事件B ,通过计算得到χ2的观测值χ2≈4.514,下列说法正确的是( ) A .有99%的把握说事件A 和事件 B 有关 B .有95%的把握说事件A 和事件B 有关 C .有99%的把握说事件A 和事件B 无关 D .有95%的把握说事件A 和事件B 无关 [答案] B [解析] 由独立性检验知有95%的把握说事件A 与B 有关. 2.r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强; ③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1 B .2 C .3 D .4 [答案] D 3.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得∑i =1 8 x i =52,∑i =1 8 y i =228,∑ i =18 x 2 i =478,∑ i =1 n x i y i =1849,则 y 与x 的回归方程是( ) A.y ^ =11.47+2.62x B.y ^ =-11.47+2.62x

C.y ^ =2.62+11.47x D.y ^ =11.47-2.62x [答案] A 4.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=(a +b )(c +d )(a +c )(b +d ) 算得,K 2= 110×(40×30-20×20)2 60×50×60×50≈7.8. 附表: A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C [解析] 本小题考查内容为独立性检验.

第一章《统计案例》练习

----------专业最好文档,专业为你服务,急你所急,供你所需------------- §1.1 独立性检验 1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”. 2.分类变量X 和Y .(填序号) ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 3.通过随机询问110 χ2=110×(40×30-20×20) 60×50×60×50 ≈7.8,得到的正确结论是________. ①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 4.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 则有________的把握确定吸烟量与年龄有关. 5.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响;

----------专业最好文档,专业为你服务,急你所急,供你所需------------- ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 6 设H 0:主修统计专业与性别无关,则 χ2的值约为________,从而得出结论有 把握认为主修统计专业与性别有关系,这种判断出错的可能性为________. 7.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的 零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: (1)分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.

统计案例分析

统计案例分析 毛石小学:彭向慈 1、学生在一年级上学期已初步学习统计的方法,会认识象形统计图和统计表,并善于提出不同的数学问题。但是,因而要在学习中,进一步引导学生深层次地分析问题,促进学生比较合理地解决问题。 2.学生已有生活经验和学习该内容的经验 学生绝大多数来源于城市,学生思维活跃,表达能力较强,善于动手操作,有初步的合作交流能力,能够积极探究新知识。 3.学生学习该内容可能的困难 学生在统计的过程中,还存在收集数据不仔细、数据不准确的情况,同时对统计中的数学问题的分析还比较肤浅。 4.学生学习的兴趣、学习方式和学法分析 一年级的学生年龄小,好奇心强,喜欢动手操作、直观感悟强, 5.我的思考: 通过对教材和学生的分析,我清醒地认识到,对一个一年级的学生来说,如何让学生经历“简单的条形统计”的整个过程,创设什么样的问题情境,运用什么样的教学方法,是我这节课应该关注的焦点。为此,在教学设计中要突出以下两个方面: ①预设矛盾,感受统计的必要——“生活中需要统计”。 设计一个有价值的矛盾生成点,往往会对一节课取到事半功倍的效果。统计教学对于小学生来说比较枯燥,尤其是低年级的学生,注意力容易转移,激发他们的学习兴趣显得更为重要。本课教学中,我注重在每一环节中设计有价值的问题情境,以激活学生的思维。上课伊始,我可以采取谈话法与学生交流:你们喜欢看动画片吗?焦老师也给大家带来了几部动画片,想看吗?用学生喜闻乐见的动画片调动学生的积极性。然后趁热打铁地提出问题:我们时间有限,只能放一部动画片,你最希望放哪一部?大家的意见不统一,老师应该听谁的呢?矛盾产生后,学生积极主动地探索解决的办法。这样借助学生现实生活中的喜欢看的动画片进行教学,根据学生实际喜欢的项目提出问题,让他们觉得确实需要统计。 ②开放活动的探索空间,让学生亲历统计过程——“培养统计意识”。

统计案例的应用就在身边

统计案例的应用就在身边 224100 江苏省盐城市大丰区南阳中学 潘锦明 统计是与生活关系最为密切的一门学科, 统计知识的学习更侧重于体会,理解统计学的基本概念、方法、原理及其相应的实际意义,突出了统计中分析处理问题的基本思想方法.同学们只有亲自实践并与实际问题进行对比,才能有深刻而真实的体会. 一.环保问题 例1 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP )和这一年各城市患白血病的儿童数量,如下表: (1)画出散点图; (2)求y 对x 的回归直线方程; (3)如果这个省的某一城市同时期年人均GDP 为12万元,估计这个城市一年患白血病的儿童数目; 分析:利用公式分别求出∧ ∧a b ,的值,即可确定回归直线方程,然后再进行预测. 解:(1)作x 与y 对应的散点图,如右图所示; (2)计算得67.1286)()(, 17.226,33.56 1 =--==∑ =y y x x y x i i i 33.55)(6 1 2=-∑ =i i x x , ∴25.2333.5567 .1286≈=∧ b ,25.10233.525.2317.226≈?-=∧a , ∴y 对x 的回归直线方程是25.10225.23+=∧ x y ; (3)将12=x 代入25.10225.23+=∧ x y 得38125.1021225.23≈+?=∧ y ,估计这个城市一年患白血病的儿童数目约为381. 评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题——环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识. 二.互联网问题 例2 寒假中,某同学为组织一次爱心捐款,于2010年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计: 人均G

统计学案例二 统计数据采集与处理

统计学案例二统计数据采集与处理 一项完整的统计数据采集与处理工作,应当包括调查方案的制定和调查问卷设计;对调查资料的分组、汇总、编制统计表和绘制统计图;根据整理后的统计资料进行基本的统计分析,写出调查报告。本案例的目的就是为了展现上述数据采集与处理的基本过程。 (一)调研题目 某省高职教育培养费用及其分担问题研究 (二)调查方案 高职教育学生培养费用调查方案 为了了解××省高职院校学生在校期间费用支出情况,研究高职教育相关各方对学生教育培养费用的负担程度,并对比国际高等教育培养费用水平,提出相应政策意见和建议,特制定本调查方案。 1.调查目的 通过对××省数所有代表性(在社会经济发展水平等方面)的高等职业技术院校及其在校学生的调查,全面掌握高职教育相关各方关于学生培养教育费用支出的数据资料,为科学制定高职教育基本费用水平、费用分担对象及分担比率,提供可靠依据。 2.调查方法 在组织方式上采用典型调查,即选择该省中等发展水平地区少数高等职业技术院校进行调查。在数据采集方法上采用统计报表和调查问卷相结合的方法,即请选中的调查院校填报学校培养费用调查表,对选中院校的部分班籍进行问卷调查。同时,通过文案调查法搜集国内外关于高职教育的成本及其分担问题的文献资料,以便比较研究。 3.调查对象和调查单位 根据研究目的,某省高等职业技术教育培养费用调查对象应当是该省所有高等职业技术院校及其在校学生,调查单位则应是该省每一所高等职业技术院校及其每一名在校学生。由于我们采用了典型调查,所以具体的调查对象是被选中的高等职业技术院校及其部分在校学生。 4.调查项目和调查表 根据调查目的要求,本次调查的主要对象分院校和学生两个部分。 具体调查项目如下: (1)对高职院校的调查项目:应包括有为教育培养本校学生所支出的全面费用项目,主要有基本工资、职工福利费、社会保障费、奖(助)学金、公务费、业务费、设备购置费(当年应分摊)、修缮费、财务费、其它费用; (2)对学生的调查项目:应包括学生在校学习期间正常学习和生活的全部费用支出,主要有学费、生活费(按10个月算)、住宿费、书杂费、通讯费(按10个月算)、交通费(按10个月算)、医疗费(按10个月算)、其它正常开支。 调查表样式见后面的调查资料表。 此外,还要通过相关数据库查阅国内外关于高职教育成本及成本分担问题的文献资料。 5.调查时间 调查资料所属时间是:高职院校费用项目为2005年、2006年和2007年三年的数据资料;学生的费用支出为2007年全年的数据资料。 调查工作期限为2008年5月1日至5月31日。 6.调查组织实施计划 这次调查由选中的三所院校分管财务工作的副院长、相关财务工作人员、调查主持人组成调查领导小组,选中院校的相关统计教师、班主任(或辅导员)、班干部组成调查工作组,具体实施调查工作。在调查过程中,每周作一次进度通报,月中进行一次质量检查,以确保

统计学案例——集值统计分析

《统计学》案例——集值统计分析 集值统计方法在项目风险概率估计中的应用 1、问题的提出 通过识别某软件项目的9个风险因素:需求风险A1、资源风险A2、设计风险A3、开发风险A4、接口风险A5、管理风险A6、测试风险A7、使用风险A8、保障风险A9。现对某软件项目风险发生概率值进行估计。 2、数据的收集 请专家根据估计概率参考说明对每一个项目风险因素发生概率给出一个大致范围,,以期得到相对客观的概率估计值。风险发生概率的参考说明如下表所示。 表:风险发生概率的参考说明表 如下表表风险因素栏,请5位相关专家对各风险因素发生的概率进行估计,估计数值如表数据栏所示。 表:某软件项目风险概率专家评估数值表

3、方法的确定 对数据进行集值统计计算其中估计数值均为区间估计值,这样可以最大限度 包含专家估计时的思维模式,涵盖专家最真实的估计判断,可以使得估计结果更加客观合理,从而风险分析的结果更趋于真实科学。假设共有n 位专家,每位专 家对风险概率大小的判断是一个区间估计值,记为[] k k p p 21,(k 表示第k 位专家), 根据风险概率值的计算方法对每一个风险因素均有: [()()][] ∑∑==- --=n k k k k k n k p p p p p 1 1221 2 2 1 /21 按此公式每一个风险因素的概率综合估计值填写在该行最后一列,最终计算结果如表中所示。进而对每一风险因素概率估计数值进行可信性检验,,即每一行数据按公式: [][] ∑∑=-=--=n k k k n k k p p p p g 1 12312/)(31 表:某软件项目风险概率专家评估数值表

[高考专项训练]统计与统计案例

[高考专项训练]统计与统计案例

小题押题16—14??统计与统计案例 卷别年 份 考题位 置 考查内 容 命题规律分析 全 国卷Ⅱ201 5 选择题 第3题 条形图、 两变量 间的相 关性 统计与统计案 例部分,抽样方法考 查较少,且考查时题 目较简单;回归分析 与独立性检验在客 观题中单独考查时 较少;随机抽样、用 样本估计总体以及 全国卷Ⅲ201 7 选择题 第3题 折线图 的应用201 6 选择题 第4题 统计图 表的应

用 变量的相关性是命 题热点,难度较低. 江苏 201 8 第3题 平均数、茎叶图 考查点一 抽样方法 1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人 数

老年 教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90B.100 C.180 D.300 解析:选C设该样本中的老年教师人数为 x,由题意及分层抽样的特点得 x 900= 320 1 600,解 得x=180. 2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是

() A.抽签法B.系统抽样法 C.分层抽样法D.随机数法 解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为(). A.89 B.91 C.90 D.900 解析:选C考察平均数的计算与茎叶图的转换关系 考查点二用样本估计总体 4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定

最新统计学第一章练习题27395电子教案

第一题:单项选择题 1.同质性、大量性、差异性() A只有有限总体具有 B只有无限总体具有 C有限总体和无限总体都具有 D有限总体和无限总体都不具有 2.”统计”的基本含义是() A统计调查、统计整理、统计分析 B统计分析、统计推断、统计描述 C统计工作、统计资料、统计学 D统计分组、统计指标、统计分析 3.研究生招生目录中,201为英语、202为俄语、203为日语。这里语种属于() A定类数据 B定序数据 C定距数据 D定比数据 4.电视观众对收费频道是否应该插入广告的态度为不应该、应该、无所谓。这里“不应该、应该、无所谓”是() A定类数据 B定序数据 C定距数据 D定比数据 5.学生的智商等级是() A定类数据 B定序数据 C定距数据 D定比数据 6.下列表述正确的是() A定序数据包含定类数据和定距数据的全部数据 B定类数据包含定序数据的全部信息 C定序数据与定类数据是平行的 D定比数据包含了定类数据、定序数据和定距数据的全部信息 7.用部分数据去估计总体数据的理论和方法,属于() A理论统计学 B应用统计学 C描述统计学 D推断统计学 8.了解学生的学习情况,要调查足够多的学生,这个方法称为() A大量观察法 B统计分组法 C综合指标法 D相关分析法 9.了解居民的消费支出情况,则()

A所有居民的消费支出额是总体单位 B所有居民是总体 C某个居民的消费支出额是总体 D所有居民是总体单位 10.统计学的数量性特点表现在它是() A一种纯数量的研究 B利用大量的数字资料建立数学模型 C在质与量的联系中来研究现象总体的数量特征 D以数学公式为基础的定量研究 11.统计学的总体性特点是指() A研究现象各个个体的数量特征 B研究由大量个别事物构成的现象整体的数量特征 C从认识总体入手开始研究现象的数量特征 D从现象量的研究开始来认识现象的性质和规律 12.统计研究中的大量观察法是指() A一种具体的调查研究方法 B对总体中的所有个体进行观察和研究的方法 C收集大量总体资料的方法 D要认识总体的数量特征就必须对全部或足够多个体进行观察和研究13.对全市工业企业职工的生活状况进行调查,调查对象是() A该市全部工业企业 B该市全部工业企业的职工 C该市每一个工业企业 D该市工业企业的每一个职业 14.某年全国汽车总产量是() A随机变量 B连续变量 C离散变量 D任意变量15.要反映我国工业企业的整体业绩水平,总体单位是()

第一章 统计案例 复习题

第一章 统计案例 复习题 一、选择题 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A.2 3.841K > B.2 3.841K < C.2 6.635K > D.2 6.635K < 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费; ③家庭的支出与收入.其中不是函数关系的有( ) A.0个 B.1个 C.2个 D.3个 4.当2 3.841K >时,认为事件A 与事件B ( ) A.有95%的把握有关 B.有99%的把握有关 C.没有理由说它们有关 D.不确定 5.已知回归直线方程 y bx a =+,其中3a =且样本点中心为(1 2),,则回归直线方程为( ) A.3y x =+ B.23y x =-+ C.3y x =-+ D.3y x =- 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表: 你认为性别与是否喜欢数学课程之间有关系的把握有( ) A.0 B.95% C.99% D.100% 7.在回归直线方程 y a bx =+中,回归系数b 表示( ) A.当0x =时,y 的平均值 B.x 变动一个单位时,y 的实际变动量 C.y 变动一个单位时,x 的平均变动量 D.x 变动一个单位时,y 的平均变动量 8.对于回归分析,下列说法错误的是( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 B.线性相关系数可以是正的,也可以是负的 C.回归分析中,如果21r =,说明x 与y 之间完全相关 D.样本相关系数(11) r ∈-, 9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上(D)选择两个变量中任意一个变量在y 轴上 10、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右. 11、两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.98 B.模型2的相关指数2R 为0.80 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.25 12、在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 2 13、工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为?6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资d 的90元 14、对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是( ) A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度 越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大 15、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )

统计学教学案例汇总

统计学教学案例集统计学精品课建设小组

2004年11月

【案例一】全国电视观众抽样调查抽样方案 一、调查目的、范围和对象 1.1 调查目的 准确猎取全国电视观众群体规模、构成以及分布情况;猎取这些观众的收视适应,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据。 1.2 调查范围 全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。 1.3 调查对象 全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童。包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居

(村)委会内居住满6个月或可能居住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住宅的人口。 二、抽样方案设计的原则与特点 2.1 设计原则 抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的都市或地区有代表性。其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量可能的抽样误差尽可能小。第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。 2.2 需要考虑的具体问题、专门要求及相应的处理方法 2.2.1 城乡区分 都市与农村的电视观众的收视适应与爱好有专门大的区不。理所因此地应分不研究,以便于对比。最方便的处理是将他们作为两个研

究域进行独立抽样,但代价是,如此做的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡。如此做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种因素,本方案采纳第二种处理方式。 在样本区、县中,以居委会的数据代表都市;以村委会的数据代表农村。 2.2.2 抽样方案的类型与抽样单元的确定 全国性抽样必须采纳多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要。本项调查除个不直辖市及都市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级抽样单元最为适宜。因为全国区、县的总数量专门大,区、县样本量也会比较大,因而第一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。

统计分析案例趣味研究

《统计分析》几个有趣问题研究 资料一消失的厢型车 纽约长岛有一位叫麦纳马拉的车商,在1985至1991年间,向通用汽车公司借贷了超过60亿美元。仅在1990年12月,他就借了4.25亿,购买了17000辆通用厢型车,交由印第安纳州一家公司来改装,号称要销售到海外。因为他的信用良好,所以通用汽车欢欢喜喜的借钱给他。我们应该相信麦纳马拉的话吗? 分析结果:我们不应该相信麦纳马拉的话,他是个骗子。 理由:首先,在1985那个年代,整个厢型车改装行业,一个月差不多改装17000辆,麦纳马拉的话相当于宣称他一个人就买下了全美整个月的数量,这明显不符合事实;其次,这种车在1990年只有1.35%外销,称一个月要买17000辆车来外销,也是不合情理的;最后,即使和厢型车的全部产量相比,这些数据也值得怀疑,雪佛兰1990年全年才生产100167辆厢型车。这些数据足以证明麦纳马拉的话不可以相信。 资料三老年大军来了 1976年出版的《科学》期刊某期中一篇文章的作者提出∶“在美国,65岁以上的人口现有共1000万,到公元2000年时会达到3000万,而且会占美国人口的25%,是前所未有的高比率。”警钟响起了∶老年人会在四分之一世纪里变成三倍,会构成全体美国人口的四分之一。 事实果真如此吗? 分析结果:事实与期刊中的文章所说的不一致。 理由:我们可以先进行一个简单的计算,3000万人占总人口数的25%,则2000年的总人口应该是3000/0.25=1.2亿,而美国人口在1975年已经是2.16亿了。再查找资料可发现以下事实:1975年,美国65岁以上的人口是2240万,而不是1000万,占总人口的比率为10.37%,到2000年,美国总人口约2.5亿,3000万占总人口的比率为13%。人的寿命越来越长,所以老年人的数目会有持续增加的趋势,但是,在25年之间,老年人口比重从10%增加到13%,这比《科学》期刊中作者说的25%低多了。所以事实并不如此。

统计基础知识第一章概述(娄庆松杨静主编)教案

第一章概述 学习目标 知识点 理解统计和统计学的含义和统计活动、统计研究的基本方法;掌握统计学中常用的基本概念。能力点 能结合现实中所遇到的具体事例说明什么是总体、总体单位、标志、指标、指标体系、变量;能识别统计数据的类型 本章结构图 一、统计学和统计活动 二、统计学中常用的基本概念

第一节统计学和统计活动 教学目标; 1. 统计和统计学的含义 2.统计学的研究对象及其特点 3. 统计工作过程和统计的职能 4. 统计研究的具体方法 教学重难点: 1. 统计和统计学的含义 2.统计学的研究对象及其特点 3. 统计研究的具体方法 教学方法: 知识讲解法、学生自学和引导 课时安排: 2课时 讲授新课: 一、统计和统计学的含义 在日常生活中,人们离不开统计数据。例如,教学班级每天都要统计出勤人数,同学们考试后要统计总成绩、平均成绩、及格率、优良率等;企业管理人员要统计供、产、销、利、税等数字;许多媒体要报道国内生产总值、物价指数、证券股票指数等。这些数字就是统计数据。统计数据室人们通过实际统计活动获得的。统计就是一门研究数据的技术。。

二、统计学的研究对象及其特点 (一)统计学的研究对象 统计学研究些什么,怎样研究,也即统计学的研究对象是什么,是学习统计学首先要解决的问题。 统计学的研究对象是指统计研究所要认识的客体,它决定着统计学的研究领域以及相应的研究方法。一般地说,统计学的研究对象是如何去认识客观事物的数量特征和数量关系的理论与方法。人们要认识客观事物,就必须通过试验或调查来采集有关数据,并加以整理、归纳和分析,以便对客观事物规律性的数量表现做出统计上的解释。例如,统计需要哪一类数据,怎样去采集和加工这些数据,怎样从复杂纷繁的数据中得出结论并解释这个结论,没有统计理论和方法的指导是无法进行的。所以说统计学是一门关于如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学。 (二)社会经济统计的特点 本书阐述统计学中的社会经济统计学,所涉及的统计工作指社会经济统计工作。 社会经济统计的研究对象是大量社会经济现象总体的数量方面,即研究社会经济现象总体的数量特征和数量关系。 社会经济统计学从其性质来讲它是一种对社会经济现象总体数量方面的认识活动,是一门研究方法论的社会科学。因此,社会经济统计具有如下特点: 三、统计工作过程和统计的职能 (一)统计工作过程

第一章统计案例单元检测题及答案

第一章统计案例 命题人:卧龙寺中学鲁向阳审题人:唐军宁 第I卷 说明:本试卷分第I卷(选择题)和第II卷(非选择题)两部分,共150分,时间90分钟 一、选择题:(每小题5分,共计60分) 1.下列结论正确的是() ①函数关系是一种确定性关系;②相关关系是一种非确定性关系; ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④ 2.年劳动生产率x(千元)和工人工资y(元)之间回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均() A.增加70元B.减少70元C.增加80元D.减少80元 3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则 回归直线方程为() A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23 4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到班级与成绩列联表如下: 则随机变量2K的观测值约为() A.0.60 B.0.828 C.2.712 D.6.004 5.下列属于相关现象的是() A.利息与利率C.电视机产量与苹果产量 B.居民收入与储蓄存款D.某种商品的销售额与销售价格 6.下列关系中是函数关系的是() A.等边三角形的边长和周长关系C.电脑的销售额和利润的关系B.玉米的产量和施肥量的关系 D.日光灯的产量和单位生产成本关系7. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93。用这个模型预测这个孩子10岁时的身高,则正确的叙述是() A.身高一定是145.83cm C.身高在145.83cm以下 B.身高在145.83cm以上D.身高在145.83cm左右 8. 变量y与x之间的回归方程表示() A. y与x之间的函数关系 B. y与x之间的不确定性关系 C. y与x之间的真实关系 D. y与x之间的真实关系达到最大限度的吻合

【精选】应用统计学案例——统计调查方案设计-精心整理

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位 调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容 调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表 如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其他内容 包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。

(3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面可以灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。 三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法 逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情理。 2、经验判断法 经验判断法是指通过组织一些具有丰富市场调查经验的人士,对设计出来的统计调查方案进行初步研究和判断,以说明统计调查方案的合理性和可行性。 3、试点调查法 试点调查法是通过在小范围内选择部分单位进行试点调查,对统计调查方案进行实地检验,以说明调查方案的可行性的方法。 (二)统计调查方案的模拟实施 统计调查方案的模拟实施是只对那些调查内容很重要,调查规模又很大的调查项目才采用模拟调查,并不是所有的统计调查方案都需要进模拟调查。模拟调查的形式很多,如客户论证会和专家评审会等形式。 (三)统计调查方案的总体评价 统计调查方案的总体评价可以从不同角度来衡量。但是,一般情况下,对统计调查方案进行评价应包括四个方面的内容,即:统计调查方案是否体现调查目的和要求;统计调查方案是否具有可操作性;统计调查方案是否科学和完整;统计调查方案是否具有调查质量高、效果好。 ▲案例:湘潭大学单放机市场调查计划书 一、前言

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

统计和统计案例(教师版)

高三 年级 数学 科辅导讲义(第 讲) 学生姓名: 授课教师: 授课时间: 第一部分 基础知识梳理 1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].

标准差: s = 1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是 则K 2 (χ2 )=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量). 第二部分 考点解析 热点一 抽样方法 例1 (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 (2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200 解析 (1)由840 42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以 1603 200=160-150 x ,所以x =200. 思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. (1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人 做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18 (2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )

相关文档
相关文档 最新文档