高中数学选修1-2知识点总结
第一章 统计案例
1.线性回归方程
①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系
③线性回归方程:a bx y +=∧
(最小二乘法)
其中,1
22
1n
i i i n
i
i x y nx y b x nx a y bx
==?
-?
?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x .
2.相关系数(判定两个变量线性相关性):∑∑∑===----=
n
i n
i i i
n
i i i
y y x x
y y x x
r 1
1
2
21
)()()
)((
注:⑴r >0时,变量y x ,正相关;r <0时,变量y x ,负相关;
⑵①||r 越接近于1,两个变量的线性相关性越强;②||r 接近于0时,两个变量之间几
乎不存在线性相关关系。
1.(2011·)某产品的广告费用x 与销售额y 的统计数据如下表:
广告费用x /万元 4 2 3 5 销售额y /万元
49
26
39
54
根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 ( ).
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
解析 ∵x -=4+2+3+54=72,y -=49+26+39+54
4=42,
又y ^=b ^x +a ^必过(x -,y -),∴42=72×9.4+a ^,∴a ^
=9.1.
∴线性回归方程为y ^
=9.4x +9.1.
∴当x =6时,y ^
=9.4×6+9.1=65.5(万元). 答案 B
2.(2011·)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x /cm 174 176 176 176 178 儿子身高y /cm
175
175
176
177
177
则A.y ^=x -1 B.y ^
=x +1 C.y ^=88+12x D.y ^
=176
解析 因为x -=174+176+176+176+178
5=176,
y -
=
175+175+176+177+177
5
=176,
又y 对x 的线性回归方程表示的直线恒过点(x -,y -
), 所以将(176,176)代入A 、B 、C 、D 中检验知选C. 答案 C
3.(2011·)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个
样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( ). A .x 和y 的相关系数为直线l 的斜率 B .x 和y 的相关系数在0到1之间
C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
D .直线l 过点(x -,y -
)
解析 因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的 绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据回 归直线方程一定经过样本中心点可知D 正确,所以选D. 答案 D
4.(2011·)为了解篮球爱好者小的投篮命中率与打篮球时间之间的关系,下表记录了小某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:
时间x
1
2
3
4
5
命中率y 0.4 0.5 0.6 0.6 0.4
篮球的投篮命中率为________. 解析 小这5天的平均投篮命中率 y -
=
0.4+0.5+0.6+0.6+0.4
5
=0.5,
可求得小这5天的平均打篮球时间x -=3.根据表中数据可求得b ^=0.01,a ^
= 0.47,故回归直线方程为y ^
=0.47+0.01x ,将x =6代入得6号打6小时篮球的 投篮命中率约为0.53. 答案 0.5 0.53
5.(2011·)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y ^
=0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加
________万元.
解析 由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案 0.254
6.(2011·)某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份 2002 2004 2006 2008 2010 需求量(万吨)
236
246
257
276
286
(1)利用所给数据求年需求量与年份之间的回归直线方程y =b x +a ; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.
解 (1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理如下:
年份-2006 -4 -2 0 2 4 需求量-257
-21
-11
19
29
对预处理后的数据,容易算得x =0,y =3.2. b ^
=
-4×-21+-2×-11+2×19+4×29-5×0×3.2
-42+-22+22+42-5×0
2
=
26040
=6.5,a ^=y --b x -
=3. 由上述计算结果,知所求回归直线方程为 y ^
-257=b ^(x -2 006)+a ^
=6.5(x -2 006)+3.2,
即y ^
=6.5(x -2 006)+260.2.
①
(2)利用直线方程①,可预测2012年的粮食需求量为
6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨).
7.(2010·新课标全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
性 别
是否需要志愿者
男 女 需要 40 30 不需要
160
270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例? 说明理由. 附:
P (K 2≥k )
0.050 0.010 0.001 k
3.841
6.635
10.828
K 2
=
n ad -bc 2a +b
c +
d a +c
b +d
解 (1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70
500=14%.
(2)K 2
=
500×40×270-30×160
2
70×300×200×430
≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据 能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此
在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两
层并采用分层抽样方法比采用简单随机抽样方法更好.
8.(2010·)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)
表1:注射药物A后皮肤疱疹面积的频数分布表
疱疹面积[60,65)[65,70)[70,75)[75,80)
频数30402010
表2:注射药物B后皮肤疱疹面积的频数分布表
疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)
频数1025203015
(1)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;
(2)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注
射药物B后的疱疹面积有差异”.
表3:
疱疹面积小于70 mm2疱疹面积不
小于70 mm2
总计
注射药物A a=b=
注射药物B c=d=
总计n=
附:K2=
n ad bc2
a+b c+d a+c b+d
P(K2≥k)0.1000.0500.0250.0100.001 k 2.706 3.841 5.024 6.63510.828
解(1)
从频率分布直方图中可以看出注射药物A后皮肤疱疹面积的中位数在65至70之间,而注射药物B后皮肤疱疹面积的中位数在70至75之间,所以注射药物A后疱疹面积的中位数小于注射药物B后疱疹面积的中位数.
(2)表3:
疱疹面积小于70 mm2疱疹面积不
小于70 mm2
总计
注射药物A a=70b=30100 注射药物B c=35d=65100 总计10595n=200
K2=
2
100×100×105×95
≈24.56.
由于K2>10.828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.