1.2 回归分析(一)
明目标、知重点 1.会建立线性回归模型分析两个变量间的相关关系.2.能通过相关系数判断两个变量间的线性相关程度.
1.回归直线方程
在回归直线方程y ^
=a ^
+b ^
x 中,b ^
=
∑n
i =1
x i -x
y i -y
∑n i =1
x i -x 2
=
∑n
i =1
x i y i -n x y
∑n i =1
x 2
i -n x
2
,a ^
=y
-b ^
x .其中x =1
n ∑n
i =1x i ,y =1n
∑n i =1
y i . (x ,y )称为样本点的中心,回归直线过样本点的中心. 2.相关系数
(1)对于变量x 与y 随机抽到的n 对数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),检测统计量是样本相关系数
r =
∑n i =1 x i -x
y i -y
∑n i =1
x i -x
2
∑n i =1
y i -y
2
=
∑n
i =1x i y i -n x y
∑n i =1
x 2
i -n x
2
∑n
i =1
y 2
i -n y
2
.
(2)相关系数r 的取值范围是[-1,1],|r |值越大,变量之间的线性相关程度越高;|r |值越接近0,变量之间的线性相关程度越低.当|r |>r 0.05时,表明有95%的把握认为两个变量之间有线性相关关系.
[情境导学]
“名师出高徒”这句谚语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 探究点一 回归直线方程
思考1 两个变量之间的关系分几类? 答 分两类:①函数关系,②相关关系.
函数关系是一种确定性关系,而相关关系是一种非确定性关系. 上面所提的“名师”与“高徒”之间的关系就是相关关系.
思考2 什么叫回归分析?
答 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 思考3 对具有线性相关关系的两个变量进行回归分析有哪几个步骤? 答 基本步骤为画散点图,求回归直线方程,用回归直线方程进行预报. 例1 若从某大学中随机选取8名女大学生,其身高和体重数据如下表所示:
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg
48
57
50
54
64
61
43
59
. 解 (1)画散点图
选取身高为自变量x ,体重为因变量y ,画出散点图,展示两个变量之间的关系,并判断二者是否具有线性关系.
由散点图可以发现,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用回归直线y =bx +a 来近似刻画它们之间的关系.
(2)建立回归方程由计算器可得b ^
=0.849,a ^
=-85.712.
于是得到回归直线方程为y ^
=0.849x -85.712. (3)预报和决策
当x =172时,y ^
=0.849×172-85.712=60.316(kg). 即一名身高为172 cm 的女大学生的体重预报值为60.316 kg. 反思与感悟 在使用回归直线方程进行预报时要注意: (1)回归直线方程只适用于我们所研究的样本的总体; (2)我们所建立的回归直线方程一般都有时间性; (3)样本取值的范围会影响回归直线方程的适用范围;
(4)不能期望回归直线方程得到的预报值就是预报变量的精确值.
跟踪训练1 某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据:
x 6 8 10 12 y
2
3
5
6
(1)请画出上表数据的散点图(