江西省九江市实验中学高二数学 第三章 第三章第一课时《回归分析》》教案 北师大版选修2-3
展开江西省九江市实验中学高中数学 第三章 第三章《第一课时 回归分析》教案 北师大版选修2-3
一、教学目标:(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对回归模型的合理性等问题的研究,渗透线性回归分析的思想和方法;(3)能求出简单实际问题的线性回归方程。
二、教学重点,难点:线性回归模型的建立和线性回归系数的最佳估计值的探求方法。
三、教学方法:讨论交流,探析归纳
四、教学过程
(一)、问题情境
1、情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估计当x=9时的位置y的值.
时刻/s | ||||||||
位置观测值/cm |
根据《数学(必修)》中的有关内容,解决这个问题的方法是:
先作散点图,如下图所示:
从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程来刻画它们之间的关系.根据线性回归的系数公式,
可以得到线性回归方为,所以当时,由线性回归方程可以估计其位置值为
2、问题:在时刻时,质点的运动位置一定是吗?
(二)、学生活动
思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映与之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估计值之间存在着误差。
(三)、新课探析
1、线性回归模型的定义:我们将用于估计值的线性函数作为确定性函数;的实际值与估计值之间的误差记为,称之为随机误差;将称为线性回归模型.
说明:(1)产生随机误差的主要原因有:①所用的确定性函数不恰当引起的误差;②忽略了某些因素的影响;③存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题: ①模型是否合理(这个问题在下一节课解决); ②在模型合理的情况下,如何估计,?
2、探求线性回归系数的最佳估计值:
对于问题②,设有对观测数据,根据线性回归模型,对于每一个,对应的随机误差项,我们希望总误差越小越好,即要使越小越好.所以,只要求出使取得最小值时的,值作为,的估计值,记为,.
注:这里的就是拟合直线上的点到点的距离.用什么方法求,?
回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求,的方法:最小二乘法.利用最小二乘法可以得到,的计算公式为
,其中,
由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程.其中,分别为,的估计值,称为回归截距,称为回归系数,称为回归值.
在前面质点运动的线性回归方程中,,.
3、线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位。
(四)、数学运用
1、例题:
例1、下表给出了我国从年至年人口数据资料,试根据表中数据估计我国年的人口数.
年份 | |||||||||||
人口数/百万 |
解:为了简化数据,先将年份减去,并将所得值用表示,对应人口数用表示,得到下面的数据表:
作出个点构成的散点图,由图可知,这些点在一条直线附近,可以用线性回归模型来表示它们之间的关系.
根据公式(1)可得
这里的分别为的估
计值,因此线性回归方程为。由于年对应的,代入线性回归方程可得(百万),即年的人口总数估计为13.23亿。
例2、 从某大学中随机选取8 名女大学生,其身高和体重数据如表
编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
身高/cm | 165 | 165 | 157 | 170 | 175 | 165 | 155 | 170 |
体重/kg | 48 | 57 | 50 | 54 | 64 | 61 | 43 | 59 |
求根据女大学生的身高预报体重的回归方程,并预报一名身高为 172 cm 的女大学生的体重.
解:由于问题中要求根据身高预报体重,因此选取身高为自变量 x ,体重为因变量 y .
作散点图
从图中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.
根据探究中的公式(1)和(2 ) ,可以得到. 于是得到回归方程
.因此,对于身高172 cm 的女大学生,由回归方程可以预报其体重为
( kg ) . 是斜率的估计值,说明身高 x 每增加1个单位时,体重y就增加0.849 位,这表明体重与身高具有正的线性相关关系。
2、练习:课本P76页练习题
(五)、课堂小结:1、线性回归模型与确定性函数相比,它表示与之间是统计相关关系(非确定性关系)其中的随机误差提供了选择模型的准则以及在模型合理的情况下探求最佳估计值,的工具;2、线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位;3、求线性回归方程的基本步骤。
(六)作业:课本P85页习题3-1中第1题