2020 年高考文科数学《概率与统计》题型归纳与训练
【题型归纳】
题型一古典概型
例 1从甲、乙等5名学生中随机选出2人,则甲被选中的概率为().
A. 1
B.
2
C.
8
D. 5525
9
25
【答案】 B
【解析】可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方法有:
(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有种选法,其中只有前 4 种是甲被选中,所以所求概率为 . 故选 B.
例 2将2本不同的数学书和1 本语文书在书架上随机排成一行,则 2 本数学书
相邻的概率为 ________.
【答案】
2
3
【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语;数1,语,数 2; 数 2,数 1,语 ;数2,语,数1;语,数2,数1;语,数1,数2共有
6 种,其中 2 本数学书相邻的有 4 种,则其概率为:p 4 2
.6 3
【易错点】列举不全面或重复, 就是不准确
【思维点拨】直接列举, 找出符合要求的事件个数.
题型二几何概型
例 1 如图所示,正方形ABCD内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称. 在正方形内随机取一点,则此点取自黑色部分的概率是().
A. 1
B.π
C.1
D.π4824
【答案】 B
【解析】不妨设正方形边长为 a ,由图形的对称性可知,太极图中黑白部分面积
相等,即各占圆面积的一半. 由几何概型概率的计算公式得,所求概率为2
1a
22
a28
.故选B.
例 2在区间[0,5]上随机地选择一个数p ,则方程 x2 + 2 px + 3 p - 2 = 0 有两个负根的概率为 ________.
【答案】
2
3
4 p24(3 p2)0【解析】方程 x2 + 2 px + 3p -2 = 0 有两个负根的充要条件是x1 x22p0即
x1x2 3 p20
2p 1, 或 p 2 ,又因为 p[0,5] ,所以使方程x2+ 2 px + 3 p - 2 = 0 有两个负根的p
3
(1 2
) (5 2) 2
,故填:2 .
的取值范围为 ( 2
,1] U [2,5] ,故所求的概率
3
3533
【易错点】“有两个负根”这个条件不会转化 .
【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可.
题型三抽样与样本数据特征
例 1某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200, 400,300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取
60件进行检验,则应从丙种型号的产品中抽取________件.
【答案】 18
【解析】按照分层抽样的概念应从丙种型号的产品中抽取6018(件).
300
1000
例 2已知样本数据 x1, x2,, x n的均值x 5 ,则样本数据2x11, 2x21,,2x n1的均值为.
【答案】 11
【解析】因为样本数据,,,的均值,又样本数据,,,的和为 2 x1x2 L x n n ,所以样本数据的均值为= 11.
例 3 某电子商务公司对10000名网络购物者 2018 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3,0.9] 内,其频率分布直方图如图所示.
(1)直方图中的a =.
(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.
【答案】 a 3人数为 0.6 10000 6000
【解析】由频率分布直方图及频率和等于1,可得
0.2 0.1 0.8 0.1 1.5 0.1 2 0.1 2.5 0.1 a 0.1 1 ,解之得 a 3 .
于是消费金额在区间0.5,0.9 内频率为 0.2 0.1 0.8 0.1 2 0.1 3 0.10.6 ,
所以消费金额在区间0.5,0.9 内的购物者的人数为 0.6 10000 6000.
例 4某城市100户居民的月平均用电量(单位:度),以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图所示.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为220,240,240,260,260,280,280,300的四组用户中,
用分层抽样的方法抽取 11户居民,则从月平均用电量在220,240的用户中应抽取多少户?
【答案】见解析
【解析】(1)由0.002 0.0095 0.011 0.0125x 0.005 0.0025 20 1,
得 x0.0075 .
220 240
(2)由图可知,月平均用电量的众数是230 .
2
因为 0.002 0.0095 0.011 20 0.450.5 ,
又 0.002 0.0095 0.011 0.0125 20 0.70.5 ,
所以月平均用电量的中位数在220,240 内.
设中位数为 a ,由0.002 0.0095 0.011 20 0.0125 a 2200.5,得 a 224 ,所以月平均用电量的中位数是224 .
(3)月平均用电量为220,240的用户有0.0125 20 100 25(户);月平均用电量为 240,260 的用户有 0.0075 20 100 15(户);
月平均用电量为 260,280 的用户有 0.005 20 100 10 (户);
月平均用电量为280,300 的用户有 0.0025 20 100 5 (户).
抽取比例为11
1051 ,
25155
所以从月平均用电量在220,240 的用户中应抽取251
5 (户).5
【易错点】没有读懂题意 , 计算错误 . 不会用函数思想处理问题
【思维点拨】根据题意分情况写出函数解析式; 2 牵涉到策略问题 , 一般可以转化为比较两个指标的大小.
题型四回归与分析
例 1 下图是我国 2008 年至 2014 年生活垃圾无害化处理量(单位:亿吨)的折线图
(1)由折线图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(2)建立关于的回归方程(系数精确到),预测年我国生活垃圾无害化处理量 .参考数据:,,,.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
【答案】见解析
【解析】(1)由折线图中数据和附注中参考数据得,,,
,.
因为与的相关系数近似为,说明与的线性相关程度相当高,从而可以用线性回归
模型拟合与的关系 .
(1)变量与的相关系数,
又,,,,,
所以,故可用线性回归模型拟合变量与的关系 .
(2),,所以,
,所以线性回归方程为.
当时, . 因此,我们可以预测2016 年我国生活垃圾无害化处理亿吨.
【易错点】没有读懂题意 , 计算错误 .
【思维点拨】将题目的已知条件分析透彻 , 利用好题目中给的公式与数据 .
题型五独立性检验
例 1 甲、乙、丙、丁四位同学各自对 A、 B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m如下表:
甲乙丙丁
r
m 115 106 124103
则哪位同学的试验结果体现A、B 两变量更强的线性相关性?() A.甲B.乙C.丙
D.丁
【答案】 D
【解析】 D因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高
【易错点】不理解相关系数和残差平方和与相关性的关系
【思维点拨】相关系数 r 的绝对值越趋向于 1, 相关性越强 . 残差平方和 m越小相关性越强
【巩固训练】
题型一古典概型
1.将一颗质地均匀的骰子(一种各个面上分别标有个点的正方体玩具)先后抛掷次,则出现向上的点数之和小于的概率是.
【答案】
【解析】将先后两次点数记为,则基本事件共有(个),
其中点数之和大于等于有,共种,
则点数之和小于共有种,所以概率为.
2. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫
猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 723 .在不超过 30 的素数中,随机选取两个不同的数,其和等于30 的概率是().
A.1B.1C.1D.1 12141518
【答案】 C
【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个,随机选取两数有 45 (种)情况,其中两数相加和为30 的有 7 和 23,11 和 19,
31
P
45
15
13 和 17,共 3 种情况,根据古典概型得
.故选C.
3.袋中有形状、大小都相同的 4 只球,其中 1只白球, 1只红球, 2 只黄球,从中一次随机摸出 2 只球,则这 2 只球颜色不同的概率为.
【答案】P5
6
【解析】 1只白球设为a,1只红球设为b, 2 只黄球设为c,d,
则摸球的所有情况为a,b , a, c , a,d , b, c , b,d , c,d ,共6件,
足意的事件a,b , a,c , a,d , b,c , b,d ,共5件,故概率P 5 .
6型二几何概型
1.某公司的班在 7:00 ,8:00 ,8:30 ,学 . 小明在 7:50 至 8:30 之到达
站乘坐班,且到达站的刻是随机的,他等不超10 分的概率是().
B.D.
【答案】 B
【解析】如所示,画出.
小明到达的会随机的落在中段中,而当他的到达落在段或,才能保他等的
不超分 .
根据几何概型,所求概率. 故B.
2.从区随机抽取 2n个数,,?,,,,?,,构成n个数,,?,
,其中两数的平方和小于 1 的数共有m个,用随机模的方法得到的周率
的近似().
A.B.C.D.
【答案】 C
【解析】由意得:在如所示方格中,而平方和小于 1 的点均在如所示的阴
影中,由几何概型概率计算公式知,所以.故选C.
3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,
三个半圆的直径分别为直角三角形 ABC 的斜边 BC ,直角边AB, AC ,△ABC的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为 p1, p2, p3,则
A.p1p2B.p1p3C.p2p3D.p1p2p3
【答案】 A
【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可 .设直角三角形ABC 的三个角A,B, C 所对的边长分别为 a ,b, c ,则区域Ⅰ的面
积为 S11 ab,2
区域Ⅱ的面积为区域Ⅲ的面积为
222
S2
1
π
1
c
1
π
1
b
1
ab
1
π
1
a
1
ab ,22222222
2
1 π 1 b
2
1 πa2
1
ab .
S3 1 π 1 c
1
ab
2222282
显然 p1p2.故选A.
题型三抽样与样本的数据特征
1. 已知一组数据4,6,5,8,7,6,那么这组数据的平均数为.【答案】 10
【解析】平均数 x 1 4658766.6
2.某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消
费金额(单位:万元)都在区间 [0.3, 0.9] 内,其频率分布直方图如图所示.
(Ⅰ)直方图中的a_________;
(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为_________.
【答案】 3;6000
【解析】频率和等于 1 可得0.2 0.1 0.8 0.1 1.5 0.1 2 0.1 2.50.1a0.1 1 ,
解之得 a 3 .于是消费金额在区间 [0.5, 0.9] 内频率为 0.20.10.80.120.1 3 0.1 0.6 ,所以消费金额在区间 [0.5, 0.9] 内的购物者的人数为: 0.6100006000 ,故应填3;6000.
3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准(吨)、一位居民的月用水量不
超过的部分按平价收费,超出的部分按议价收费 . 为了了解居民用水情况,
通过抽样,获得了某年位居民每人的月均用水量(单位:吨),将数据按照,,,分成组,制成了如图所示的频率分布直方图.
(1)求直方图中的值;
(2)设该市有万居民,估计全市居民中月均用水量不低于吨的人数,请说明理
由;
(3)若该市政府希望使的居民每月的用水量不超过标准(吨),估计的值,并说
明理由 .
【答案】见解析
【解析】(1)由频率分布直方图知,月均用水量在中的频率为,同理,在,,,,,中的频率分别为,,,,,.
由,解得 .
(2)由( 1),位居民每人月均用水量不低于吨的频率为.
由以上样本的频率分布,可以估计全市万居民中月均用水量不低于吨的人数为.(3)因为前组的频率之和为,
而前组的频率之和为,所以
由,解得 .
题型四回归与分析
1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区 5 户家庭,
得到如下统计数据表:
收入 x(万
元)
支出 y (万
元)
根据上表可得回归直线方程???
,其中
???
y bx a b0.76,a y bx ,据此估计,该社区
一户收入为 15 万元家庭年支出为()
A.万元B.万元C.万元D.万元
【答案】 B
8.28.610.011.311.9
(万元),
【解析】由已知得x510
6.2
7.5
8.0 8.5
9.88(万元),故 ?8 0.76 10 0.4,
5
所以回归直线方程为y? 0.76 x 0.4 .当社区一户收入为15 万元,家庭年支出为
y? 0.76 150.411.8 (万元).故选B.
2.为了研究某班学生的脚长x (单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为.已知,,.该班某学生的脚长为 24,据此估计其身高为().
A.B.C.D.
【答案】 C
【解析】,,所以,时,.故选C.
3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)
对年销售量y
(单位: t )和年利润z(单位:千元)的影响,对近8 年的年宣传
费 x i和年销售量y i i 1,2, ,8
数据作了初步处理,得到下面的散点图及一些统计量的
值.
x y w
82
88
8
x i x2w i w y i y
w i w x i x y i y i 1
i 1
i 1i 1
561469 3
表中 w i
18
x i, w w i ,
8 i 1
(1)根据散点图判断,y a bx 与y c d x 哪一个适宜作为年销售量y
关于年宣
传费x的回归方程类型(给出判断即可,不必说明理由)?
(2)根据( 1)的判断结果及表中数据,建立y
关于x的回归方程;
(3)已知这种产品的年利润z与x,y
的关系式为z 0.2 y x,根据( 2)的结果回答
下列问题:
(ⅰ)年宣传费x49
时,年销售量及年利润的预报值是多少?
(ⅱ)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据 u1, v1u2,v2,, u n ,
v n,其回归直线v u 的斜率和
n
?u i u v i v
i 1?
截距的最小二乘估计分别为, ? v u .
n
u i2
u
i 1
【答案】见解析
【解析】(1)由散点图变化情况可知选择y c d x 较为适宜.
8
w i w y i
y
(2)由题意知
d
i 1
8
2
108.8 68 .又 y c d x 一定过点
, y ,
w i w
1.6
i 1
所以 c y d
563 68 6.8 100.6 ,
所以 y 与 x 的回归方程为 y 100.6 68 x .
(3)(ⅰ)由( 2)知,当 x 49 时, y 100.6 68
49 576.6 t ,
z 0.2 576.6 49 66.32(千元),
所以当年宣传费为 x 49 时,年销售量为 576.6 t ,利润预估为 66.32千元.
(ⅱ)由( 2)知, z
0.2 y x
0.2
100.6 68 x x 13.6 x x 20.12
2
x 6.8时,年利润的预估值最大,
x 6.86.82 20.12 ,所以当
即 x 6.8 2 46.24 (千元). 题型五 独立性检验
1. 某医疗研究所为了检验某种血清预防感冒的作用, 把 500 名使用血清的人与另
外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2列联表计算的 K 2≈,则下列表述中正确的是( )
A .有 95℅的把握认为“这种血清能起到预防感冒的作用”
B .若有人未使用该血清,那么他一年中有
95℅的可能性得感冒
C.这种血清预防感冒的有效率为95℅D.这种血清预防感冒的有效率为5℅【答案】 A
【解析】由题可知,在假设 H 成立情况下,P( K
2
3.841)
的概率约为,即在犯错的
概率不错过的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用” . 这里的 95℅是我们判断H不成立的概率量度而非预测血清与感冒的几率的量度,故 B 错误. C,D也犯有 B 中的错误.故选 A
2. 观察下面频率等高条形图,其中两个分类变量x,y 之间关系最强的是( )
A.B.
【答案】 D
【解析】在频率等高条形图中,
C.D.
a
与
c
相差很大时,我们认为两个分类变量a b c d
有关系,四个选项中,即等高的条形图中x1, x2所占比例相差越大,则分类变量 x, y 关系越强,故选 D .
3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽
取了 100 个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.
(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低
于 50kg ,新养殖法的箱产量不低于50kg ,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
箱产量箱产量
50kg?50kg
旧养
殖法
新养
殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精
确到 0.01).
附:
P K2?k
k
K 2n( ad bc)2.
(a b)(c d )(a c)(b d )
【答案】见解析
【解析】(1)记:“旧养殖法的箱产量低于50kg ”为事件B,“新养殖法的箱产量不低于50kg”为事件 C,由题图并以频率作为概率得
P B
0.040 5 0.034 5 0.024 5 0.014 5 0.012 5 0.62,
P C0.068 5 0.046 5 0.010 5 0.008 50.66,P A P B P C0.4092 .(2)
箱产量50kg箱产量≥50kg 旧养殖法6238
新养殖法3466
k 220062 6638 342
由计算可得 K2的观测值为15.705 ,因为15.705 6.635,所以
10010096104
P K2≥ 6.6350.001,从而有 99%以上的把握认为箱产量与养殖方法有关.
(3)1 5 0.2,0.10.0040.0200.0440.032,0.0320.0688,85 2.35,
1717
50 2.35 52.35,所以中位数为52.35.