数学选择性必修 第三册8.2 一元线性回归模型及其应用第1课时教案设计
展开《一元线性回归模型及其应用第1课时》教学设计
一、单元内容及其解析
1.内容
一元线性回归模型,一元线性回归模型参数的最小二乘估计.
本单元教学约需3课时,第1课时,一元线性回归模型;第2课时,一元线性回归模型参数的最小二乘估计;第3课时,一元线性回归模型的应用.
2.内容解析
一元线性回归模型是描述两个随机变量之间相关关系的最简单的回归模型.当两个变量之间具有显著的线性相关关系时,可以建立一元线性回归模型刻画两个变量间的随机关系,并通过模型进行预测.
建立一元线性回归模型的基础是成对样本数据的相关性分析,通过对散点图的直观观察,可以大致确定变量间是否存在线性关系,通过样本相关系数可以分析线性关系的强弱.在此基础上建立一元线性回归模型,用最小二乘法估计线性回归模型中的参数,得到经验回归方程,并利用残差及利用残差构建的指标对模型进行评价和改进,使模型不断完善.最后根据模型进行预测帮助决策.
在建立一元线性回归模型过程中,方程的建立、参数的估计、模型有效性分析等都是培养学生数据分析、数学建模、逻辑推理、数学抽象的重要素材,也是加强学生“四基”,提高“四能”的重要内容.
基于以上分析,确定本单元的教学重点:(1)一元线性回归模型的含义;(2)用最小二乘法估计回归模型参数的方法;(3)残差分析和决定系数的意义;(4)一元线性回归模型的应用.
二、单元目标及其解析
(1)结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理.
(2)掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
(3)掌握残差分析的方法,理解决定系数的意义.
(4)针对实际问题,会用一元线性回归模型进行预测.
2.目标解析
达成上述目标的标志是:
(1)知道线性回归模型与函数模型的区别,知道线性回归模型中误差e的含义,知道假设误差e满足的理由.
(2)能依据用距离来刻画接近程度的数学方法了解最小二乘原理,能利用最小二乘原理推导参数估计值的计算公式.
(3)会利用统计软件画散点图、求样本相关系数、求回归方程,能用残差、残差图和决定系数对回归模型进行评价.
(4)通过具体案例,理解利用一元线性回归模型可以刻画随机变量之间的线性相关关系,在建立一元线性回归模型解决实际问题的过程,提升数据分析、数学建模、逻辑推理等素养.
三、单元教学问题诊断分析
通过“成对数据的统计相关性”的学习,学生已掌握通过散点图直观判断成对样本数据之间相关关系的方法,会用样本相关系数判断成对样本数据线性相关性的强弱,也初步了解用样本估计总体的方法.在本单元的学习中,学生可能对线性回归模型中随机误差的假设、最小二乘原理和方法等存在理解困难.此外,学生对于回归模型中参数的意义可能理解不准确,容易误将根据样本通过最小二乘法求出的参数估计值当作模型中的参数,主要原因是对样本的随机性理解不够到位,对于同一个总体的不同样本会有不同的参数估计缺少体验.
本单元的教学难点是:(1)对随机误差的理解;(2)最小二乘原理与方法;(3)参数的意义及参数估计公式的推导;(4)残差变量的解释与分析;(5)模型的应用及优度的判断.
四、单元教学支持条件分析
一元线性回归模型主要研究两个随机变量的线性相关关系,通过成对样本数据建立数学模型.在教学中,需要利用 GeoGebra,Excel,R,图形计算器等统计软件或工具处理样本数据,画出散点图和回归直线,利用统计软件或工具进行参数估计值的计算和分析.也可利用软件或工具进行模拟,对同一个总体的不同样本作回归分析、比较,以加深对回归模型的理解.
五、课时教学设计
(一)教学内容
一元线性回归模型.
(二)教学目标
结合具体实例,通过分析变量间的关系建立一元线性回归模型,并能说明模型参数的统计意义,提高数据分析能力.
(三)教学重点和难点
重点:一元线性回归模型的概念,随机误差的概念、表示与假设.
难点:回归模型与函数模型的区别,随机误差产生的原因与影响.
(四)教学过程设计
1.复习回顾
问题1:生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的身高较高时儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表1所示.
表1
那么,由这组样本数据能否推断儿子的身高与父亲的身高有关系?关系的相关程度如何?是函数关系还是线性相关关系?为什么?
师生活动:要求学生整理和表示数据,通过分小组合作完成.以横轴表示父亲的身高,纵轴表示儿子的身高,建立平面直角坐标系,再将表中的成对样本数据表示为散点图.然后根据散点图作解读,回答问题.
教师可以引导学生使用技术工具开展学习活动,例如选用 Geogebra软件作为教学支持工具解决问题,具体过程如下:
(1)打开GeoGebra,在表格区A,B列分别输入父亲身高和儿子身高的数据.
(2)在表格区选择A,B两列,并在工具栏第三个图标的下拉菜单中,选择“点列”,出现对话框,在对话框中给成对样本数据所在的点列命名,选择好自变量和因变量,点击“确定”.在绘图区的窗口,点击右键,在出现的菜单中选择“适应窗口”,便画出这组成对样本数据的散点图,如图.
根据散点图可以发现,散点大致分布在一条从左下角到右上角的直线附近,表明儿子的身高和父亲的身高不是函数关系而是线性相关关系.
(3)在GeoGebra的输入框,输入“相关系数”,在“选项”菜单的“精确度”栏中选择合适的精确度,即可求得样本相关系数.表明儿子身高和父亲身高正线性相关,且相关程度较高.
设计意图:通过一个具体问题,既可以对前面所学内容作系统的回顾,同时又可以作为探究一元线性回归模型的例子,使教学过程自然、连贯.
2.问题探究
引导语:通过问题1,我们已经了解到根据成对样本数据的散点图和样本相关系数,可以推断两个变量是否存在线性相关关系,是正相关还是负相关,以及线性相关程度的强弱.如果能像建立函数模型刻画两个变量的确定关系那样,通过建立适当的统计模型刻画两个随机变量的相关关系,那么我们就可以利用这个模型研究两个变量之间的相关关系.
问题2:根据表1的数据,问题1中的儿子身高与父亲身高这两个变量之间的关系能用函数模型刻画吗?
师生活动:引导学生观察表格中的数据,启发学生根据函数的概念进行分析、作出判断.列表法是函数的一种表示方法,但并不是所有列表表示的数据都是函数关系,要成为函数关系必须满足函数的定义,即应满足“集合中的任意一个数,在集合中都存在唯一的数与它对应”.格1中的数据,存在父亲身高相同而儿子身高不同的情况.例如,第6个和第8个观测父亲的身均为,而对应的儿子的身高为和;同样在第3,4个观测中,儿子的身都是,而父亲的身高分别为.可见儿子的身高不是父亲身高的函数,同样父亲的身高也不是儿子身高的函数,所以不能用函数模型来刻画.
设计意图:通过具体实例,说明有些现实问题中呈线性相关关系的两个变量可能不存在函数关系.师生活动设计中强调了判断两个交量之间不是函数关系应考虑的两个方面,即不是的数,同时也不是的函数.如果只考虑一个方面,两个变量仍有可能是函数关系.
问题3:从成对样本数据的散点图和样本相关系数可以发现,散点大致分布在一条直线附近,说明儿子身高和父亲身高有较强的线性关系.我们可以这样理解,由于有其他因素的存在,使得儿子身高和父亲身高有关系但不是函数关系.那么请你说说影响儿子身高的其他因䒺是什么?
师生活动:通过组织学生讨论问题,形成以下主要结论:影响儿子身高的因素除父亲的身高外,还有母亲的身高、生活的环境、饮食习惯、营养水平、体育锻炼等随机的因素,儿子身高不是父亲身高的函数的原因是存在这些随机的因素.
设计意图:在建立回归模型时,解释变量X不是随机变量,而随机误差(随机扰动)e是随机变量,所以被解释变量(响应变量)Y也是随机变量.通过这个问题,使学生初步了解后面要建立的回归模型中变量的含义.
3.建立模型
问题4:由问题3我们知道,正是因为存在这些随机的因素,使得儿子的身高呈现出随机性.各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机因素的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系吗?
师生活动:教师指出,如果用表示父亲身高,表示儿子的身高,用表示各种其他随机因素影响之和,称为随机误差.由于儿子身高与父亲身高线性相关,所以.由此引导学生分析变量之间的关系,自主写出关系式.
追问:为什么要假设,而不假设其为某个不为0的常数?
师生活动:教师引导学生分析问题并适时指出,因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.如果随机误差的均值为一个不为0的常数,则可以将合并到截距项中,否则模型无法确定,即参数没有唯一解.另外,如果不为0,则表示存在系统误差,在实际建模中也不希望模型有系统误差,即模型不存在非随机误差.
设计意图:通过对随机误差的分析,建立用随机变量表示的数学模型,将一些次要的随机因素用一个随机变量表示,并基于简洁性原则对随机变量e作合理的假设.由此,理解研究随机问题的重要思想,即将一个随机量表示成一个主要的确定性的量与一个次要的随机量之和,只要控制次要的随机量在一定的范围之内,那么随机问题就可以通过研究确定性问题得到理想的结果.
问题5:请根据以上的分析,你能建立一个数学模型表示儿子身高与父亲身高的关系吗?
师生活动:教师引入数学符号表示相关量,用x表示父亲的身高,Y表示儿子的身高,因二儿子身高是随机变量,用大写字母表示,用e表示各种其他随机因素影响之和.进而引导学生根据以上分析,可以建立如下的数学模型:
①
我们称①式为关于的一元线性回归模型.其中,称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.模型中的是随机变量,其值虽然不能由变量的值确定,但却能表示为与的和(叠加),前一部分由唯一确定,后一部分是随机的.如果,那么与之间的关系就可以用一元线性函数模型来描述.
设计意图:问题5是本节课的重点和难点,由于随机误差的引入,在函数模型的基础上建立含有随机变量的回归模型,这是定量描述随机现象的重要方法.通过问题5,完成一元线性回归模型的建立,理解回归模型与函数模型的区别.
追问:你能结合父亲和儿子身高的实例,说明回归模型①的意义吗?
师生活动:教师引导学生对“儿子身高与父亲身高的关系”的案例进行分析,对于父亲身高和儿子身高的一元线性回归模型①,由于,可以解释为父亲身高为的所有男大学生身高组成一个子总体,该子总体的均值为,即该子总体的均值与父亲的身高是线性函数关系.而对于父亲身高为的某一名男大学生,他的身高并不一定为,它仅是该子总体的一个观测值,这个观测值与均值有一个误差项.
设计意图:通过具体实例,加深学生对一元线性回归模型的理解.
问题6:你能结合具体实例解释产生模型①中随机误差项的原因吗?
师生活动:组织学生展开讨论,形成共识.在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:
(1)除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等.
(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差.
(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性归模型来近似这种关系,这种近似关系也是产生随机误差e的原因.
设计意图:通过具体实例,加深学生对随机误差的理解.
4.归纳小结
教师引导学生回顾本节课所学内容,并让学生回答下面的问题:
回顾建立一元线性回归模型的过程, 你能说出建立回归模型的依据, 并谈一谈对回归模型的 认识吗?
师生活动:要求学生思考后回答并相互补充,教师进行总结.
由于成对样本数据的散点图中,散点分布在一条直线的周围,因此可以用表示的均值,引入随机误差,用以囊括其他所有随机影响因素,可建立一元线性回归模型
在一元线性回归模型中,表达式刻画的是随机变量与变量之间的线性相关关系,其中参数和为模型的未知参数,需要根据成对样本数据进行估计.
设计意图:帮助学生进一步厘清一元线性回归模型的含义,掌握用数学语言表达随机事件,了解总体参数与样本数据之间的关系.
5.布置作业
教科书第107页练习第题.
某种新产品表面需要腐蚀刻线,腐蚀深度与腐蚀时间有关,测得结果如表2所示.
表2
(1)请根据以上数据判断,腐蚀深度与腐蚀时间之间的关系能否用一元线性回归模型来刻画?并请说明理由.
(2)请说明模型中与分别表示什么?本题中的具体含义是什么?
(五)目标检测设计
儿童的身高随年龄的增加而增加,我国岁儿童的平均身高如表3所示.
表3
(1)儿童的平均身高Y与年龄t之间是函数关系还是相关关系?
(2)如果是相关关系,如何判断是线性相关还是非线性相关?相关的密切程度如何?
(3)如果设,其中是由年龄唯一确定的部分,e是随机误差,请简要解释随机误差的原因.
设计意图:考查学生对函数关系与相关关系的区别和回归模型随机误差意义的理解.
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学设计及反思: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学设计及反思,共5页。教案主要包含了教学目标,教学重难点,教学过程,课后作业等内容,欢迎下载使用。
高中数学8.2 一元线性回归模型及其应用教案设计: 这是一份高中数学8.2 一元线性回归模型及其应用教案设计,共6页。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学设计: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用教学设计,共4页。教案主要包含了内容与内容解析,目标与目标解析,教学问题诊断解析,教学过程设计,板书设计,目标检测设计等内容,欢迎下载使用。