搜索
    上传资料 赚现金
    英语朗读宝

    2023新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用教师用书新人教A版选择性必修第三册

    2023新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用教师用书新人教A版选择性必修第三册第1页
    2023新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用教师用书新人教A版选择性必修第三册第2页
    2023新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用教师用书新人教A版选择性必修第三册第3页
    还剩9页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    2023新教材高中数学第8章成对数据的统计分析8.2一元线性回归模型及其应用教师用书新人教A版选择性必修第三册

    展开

    8.2 一元线性回归模型及其应用1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘法原理.掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.2.针对实际问题,会用一元线性回归模型进行预测.3.了解随机误差、残差、残差图的概念. 1.通过对散点图、线性回归的分析,培养数据分析素养.2.借助回归模型的建立,培养数学建模、数据分析及数学运算素养.某地区从某一年开始进行了环境污染整治,得到了如下数据:x1234567污染指数y6.15.24.54.73.83.43.1作出这些成对数据的散点图,判断污染指数yx是否线性相关?在知道yx线性相关的前提下,你能找出近似描述yx之间关系的一次函数表达式吗?根据所得到的关系式,你能估计出该地区第8年的污染指数吗?知识点1 一元线性回归模型Y关于x的一元线性回归模型,其中,Y称为因变量响应变量x称为自变量解释变量ab为模型的未知参数,a称为截距参数,b称为斜率参数.eYbxa之间的随机误差.1.下列说法不正确的是(  )A在回归模型中,变量间的关系是非确定性关系,因变量不能由自变量唯一确定B在函数模型中,变量间的关系是确定性关系,因变量由自变量唯一确定C在回归模型中,变量xy都是普通变量D在回归模型中,回归系数可能是正的也可能是负的C [在回归模型中,x是解释变量,y是响应变量,当解释变量取值一定时,响应变量的取值带有一定的随机性.]知识点2 经验回归方程x称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,求经验回归方程的方法叫做最小二乘法,求得的叫做ba的最小二乘估计.2.已知某品牌的新能源汽车的使用年限x(单位:年)与维护费用y(单位:千元)之间有如下数据:使用年限x/年24568维护费用y/千元34.56.57.59xy之间具有线性相关关系,且y关于x的经验回归方程为=1.05x.据此估计,当使用年限为7年时,维护费用约为(  )附:经验回归方程x中的系数A4千元 B.5千元C8.2千元 D.8.3千元C [由题意,=5,=6.1,因为经验回归直线经过样本点中心,所以6.1=1.05×5+,解得=0.85,=1.05x+0.85.当使用年限为7年时,维护费用约为1.05×7+0.85=8.2(千元).]知识点3 残差与残差平方和及R2(1)残差对于响应变量Y,通过观测得到的数据称为观测值.通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.(2)残差平方和及R2①残差平方和为(yii)2R21-R2越大,则残差平方和越小,模型的拟合效果越好;R2越小,则残差平方和越大,模型的拟合效果越差.3.在两个变量yx的回归模型中,分别选择了4个不同的模型,它们的决定系数R2如下,其中拟合效果最好的模型是(  )A模型1的决定系数R2为0.98B模型2的决定系数R2为0.80C模型3的决定系数R2为0.50D模型4的决定系数R2为0.25A [R2越大拟合效果越好.] 类型1 求经验回归方程【例1】 随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量y(单位:次)之间的对应数据如下表所示:x/件24568y/次3040506070(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于x的经验回归方程;(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少.[解] (1)散点图如图所示.(2)根据散点图,可得变量xy之间具有线性相关关系.根据数据,可知=5,=50,iyi=1 390,=145,代入公式得=7,=50-7×5=15.故所求的经验回归方程是=7x+15.(3)根据上面求出的经验回归方程,当成交量突破100件(含 100件),即x≥100时,≥715,所以预测这家店铺的浏览量至少为715次.求经验回归方程的基本步骤(1)画出散点图,从直观上分析数据间是否存在线性相关关系.(2)计算:iyi(3)代入公式求出x中参数的值.(4)写出经验回归方程并对实际问题作出估计.提醒:只有在散点图大致呈线性时,求出的经验回归方程才有实际意义.[跟进训练]1.“足球进校园”一直是热议话题.为了解某区域足球特色学校的发展状况,社会调查小组得到如下统计数据:年份x/年20162017201820192020足球特色学校y/百个1.001.401.701.902.00(1)根据表中数据,计算yx的相关系数r,并说明yx的线性相关性强弱;(2)求y关于x的经验回归方程,并预测该区域2022年足球特色学校的个数(精确到个).注:当|r|≤0.25,则认为yx的线性相关性较弱;当0.25<|r|<0.75,则认为yx的线性相关性一般;当0.75≤|r|≤1,则认为yx的线性相关性很强.附:经验回归方程x,其中相关系数r参考数据≈2.569 0,≈3.162 3.[] (1)由题中的数据可得=2018,=1.6,(xi)2=4+1+0+1+4=10,(yi)2=0.36+0.04+0.01+0.09+0.16=0.66,(xi)(yi)=2×0.6+1×0.20+1×0.3+2×0.4=2.5,所以r≈0.973>0.75,所以yx的线性相关性很强.(2)=0.25,所以=1.6-0.25×2018=-502.9,所以yx的经验回归方程为=0.25x-502.9.x=2 022时,y=0.25×2 022-502.9=2.6(百个),所以该区域2022年足球特色学校的个数为260个. 类型2 线性回归分析【例2】 已知某种商品的单价x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x/元1416182022y/件1210753y关于x的经验回归方程,并说明回归模型拟合效果的好坏.[解] 由题意可得×(14+16+18+20+22)=18,×(12+10+7+5+3)=7.4,=142+162+182+202+222=1 660,iyi=14×12+16×10+18×7+20×5+22×3=620,所以=-1.15,=7.4+1.15×18=28.1,所以所求经验回归方程是=-1.15x+28.1.列出残差表:y1210753129.77.45.12.8y00.3-0.4-0.10.2所以(yii)2=0.3,又(yi)2=53.2,所以R2=1-≈0.994.故回归模型的拟合效果很好.建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量.(2)画出解释变量和响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选经验回归方程).(4)按一定规则(如最小二乘法)估计回归方程中的参数.(5)得出结果后需进行线性回归分析.①残差平方和越小,模型的拟合效果越好.②决定系数R2取值越大,说明模型的拟合效果越好.需要注意的是:若题中给出了检验回归方程是否理想的条件,则根据题意进行分析检验即可.[跟进训练]2.某项研究发现某地的PM10浓度与车流量之间有线性相关关系.现采集到该地一周内车流量x与PM10浓度y的数据如下表:时间车流量x/万辆PM10浓度y/(μ g/m3)星期一25.435.7星期二24.634.5星期三23.535.2星期四24.433.6星期五25.836.1星期六19.730.9星期日20.329.4(1)在如图所示的坐标系中作出表中数据的散点图;(2)根据表中的统计数据,求出经验回归方程x(精确到0.01);(3)为净化空气,该地决定在工作日(星期一至星期五)限号.假设限号时每个工作日的车流量为表中对应工作日车流量的.试预测开始限号第一周星期三的PM10浓度(精确到0.1).参考数据:≈23.4,≈33.6,(xi)(yi)=34.5,-72=35.5.参考如下公式:b[解] (1)如图所示.(2)≈0.97,=33.6-0.97×23.4≈10.90.所以y关于x的经验回归方程为=0.97x+10.90.(3)开始限号第一周星期三的车流量预计为23.5×=18.8(万辆).PM10浓度预测值=0.97×18.8+10.90≈29.1(μg/m3). 类型3 非线性回归分析【例3】 为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图,根据散点图判断:xyc1ec2x哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)(xi)2(xi)·(yi)(xi)·(zi)3.562.833.5317.5596.50512.04其中zi=ln yii(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.参考公式:[解] (1)作出散点图,如图①所示.图①        图②由散点图看出样本点分布在一条指数型函数yc1ec2x的周围,于是选择yc1ec2x(2)令z=ln y,则xx123456z1.792.483.223.894.555.25相应的散点图如图②.从图②可以看出,变换后的样本点分布在一条直线附近,因此可以用经验回归方程来拟合.≈0.69,=1.115,得=0.69x+1.115,则有=e0.69x+1.115[母题探究](变设问)在本例条件不变的情况下,试估计第7天细菌繁殖个数.[解] =e0.69x+1.115∴当x=7时,≈382(个),即第7天细菌繁殖个数约为382个.解决非线性回归问题的方法及步骤(1)确定变量:确定解释变量为x,响应变量为y(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数、二次函数)作比较,选取拟合效果好的函数模型.(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题.(4)分析拟合效果:通过计算决定系数等来判断拟合效果.(5)写出非线性经验回归方程.[跟进训练]3.下表为收集到的一组数据:x21232527293235y711212466115325(1)作出xy的散点图,并猜测xy之间的关系;(2)通过xy的关系,建立回归模型并计算残差;(3)利用所得模型,预测x=40时y的值.[解] (1)作出散点图如图,从散点图可以看出xy不具有线性相关关系,数形结合可猜测样本点分布在某一指数型函数曲线yc1ec2x的周围,其中c1c2为待定的参数,即xy之间的关系为yc1ec2x(2)对(1)中猜测结果两边取对数把指数关系变为线性关系,令z=ln y,则变换后的样本点应分布在直线zbxa(a=ln c1bc2)的周围,这样就可以利用线性回归模型来建立yx之间的非线性经验回归方程了,数据可以转化为:x21232527293235z1.9462.3983.0453.1784.1904.7455.784求得经验回归方程为=0.272x-3.849,=e0.272x-3.849残差列表:yi711212466115325i6.44311.10119.12532.95056.770128.381290.3250.557-0.1011.875-8.9509.230-13.38134.675(3)当x=40时,=e0.272×40-3.849≈1 131.1.已知xy之间的一组数据:x01234y13579yx的经验回归方程x必过点(  )A.(1,2) B.(5,2)C.(2,5) D.(2.5,5)C [经验回归方程一定过样本点中心().=2,=5.故必过点(2,5).]2.已知xy的取值如下表:x014568y1.31.85.66.17.49.3由所给数据在散点图上的位置分析可知yx线性相关,且经验回归方程为=0.95x,则=(  )A1.45 B.1.55C.1.65 D.1.80A [由题意=4,=5.25.yx线性相关=0.95x,∴5.25=0.95×4+解得=1.45.]3在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了________的热茶销售杯数变化,而随机误差贡献了剩余的________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.85% 15% [由题意知气温解释了85%的热茶销售杯数变化,随机误差贡献了剩余的15%.]4.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到yx的经验回归方程:=0.254x+0.321.由经验回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.0.254 [由于=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.]5.已知经验回归方程为=2x+1,而试验得到的一组数据是(2,4.9),(3,7.1),(4,9.1),求残差平方和.[解] x=2时,=5,当x=3时,=7,当x=4时,=9.1=4.9-5=-0.1,2=7.1-7=0.1,3=9.1-9=0.1.=(-0.1)2+0.12+0.12=0.03.回顾本节知识,自主完成以下问题:1经验回归直线方程一定过哪个点?[提示] 经验回归直线方程一定过样本点中心().2.yx正、负相关的充要条件各是什么?[提示] yx正相关的充要条件是>0,yx负相关的充要条件是<0.3.的实际意义是什么?[提示] x增大一个单位时,增大个单位.

    精品成套资料

    人教A版 (2019)选择性必修 第三册
    • 课件
    • 教案
    • 试卷
    • 学案
    • 其他
    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map