人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用第二课时学案设计
展开在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要运用散点图选择适当的函数模型来拟合观测数据,然后通过适当的变量代换,把非线性问题转化为线性问题,从而确定未知参数,建立相应的线性回归方程.
问题 具有相关关系的两个变量的线性回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)).预测值eq \(y,\s\up6(^))与真实值y一样吗?预测值eq \(y,\s\up6(^))与真实值y之间误差大了好还是小了好?
提示 不一定;越小越好.
1.残差的概念
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的eq \(y,\s\up6(^))称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
2.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和eq \(∑,\s\up10(n),\s\d6(i=1)) (yi-eq \(y,\s\up6(^))i)2,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(3)利用R2刻画回归效果
决定系数R2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客户预报变量的能力.
R2=1-eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2),R2越大,即拟合效果越好,R2越小,模型拟合效果越差.
拓展深化
[微判断]
1.残差平方和越接近0, 线性回归模型的拟合效果越好.(√)
2.在画两个变量的散点图时, 响应变量在x轴上,解释变量在y轴上.(×)
提示 在画两个变量的散点图时, 响应变量在y轴上,解释变量在x轴上.
3.R2越小, 线性回归模型的拟合效果越好.(×)
提示 R2越大, 线性回归模型的拟合效果越好.
[微训练]
1.在残差分析中, 残差图的纵坐标为__________.
答案 残差
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如下表:
哪位同学建立的回归模型拟合效果最好?
解 R2越大,表示回归模型的拟合效果越好,故甲同学建立的回归模型拟合效果最好.
[微思考]
在使用经验回归方程进行预测时,需要注意哪些问题?
提示 (1)经验回归方程只适用于所研究的样本的总体;(2)所建立的经验回归方程一般都有时效性;(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果好,超出这个范围越远,预报的效果越差;(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.
题型一 线性回归分析
【例1】 已知某种商品的价格x(单位:元/件)与需求量y(单位:件)之间的关系有如下一组数据:
求y对x的回归直线方程,并说明回归模型拟合效果的好坏.
解 eq \(x,\s\up6(-))=eq \f(1,5)(14+16+18+20+22)=18,
eq \(y,\s\up6(-))=eq \f(1,5)(12+10+7+5+3)=7.4,
eq \(∑,\s\up6(5),\s\d4(i=1))xeq \\al(2,i)=142+162+182+202+222=1 660,
eq \(∑,\s\up6(5),\s\d4(i=1))xi yi=14×12+16×10+18×7+20×5+22×3=620,
所以eq \(b,\s\up6(^))=eq \f(\(∑,\s\up10(5),\s\d10(i=1))xiyi-5\a\vs4\al(\(x,\s\up6(-)) )\a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up10(5),\s\d10(i=1))xeq \\al(2,i)-5\(x,\s\up6(-))2)=eq \f(620-5×18×7.4,1 660-5×182)=-1.15,
eq \(a,\s\up6(^))=7.4+1.15×18=28.1,
所以所求回归直线方程是eq \(y,\s\up6(^))=-1.15x+28.1.
列出残差表:
所以eq \(∑,\s\up6(5),\s\d4(i=1)) (yi-eq \(y,\s\up6(^))i)2=0.3,
eq \(∑,\s\up6(5),\s\d4(i=1)) (yi-eq \(y,\s\up6(-)))2=53.2,
R2=1-eq \f(\(∑,\s\up10(5),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(5),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)≈0.994,
所以回归模型的拟合效果较好.
规律方法 (1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
(2)刻画回归效果的三种方法
①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.
②残差平方和法:残差平方和eq \(∑,\s\up6(n),\s\d4(i=1)) (yi-eq \(y,\s\up6(^))i)2越小,模型的拟合效果越好.
③决定系数法:R2=1-eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)越接近1,表明回归的效果越好.
【训练1】 某地区2011年到2017年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
(1)求y关于t的线性回归方程;
(2)利用(1)中的回归方程,分析2011年到2017年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为
解 (1)由所给数据计算得
eq \(t,\s\up6(-))=eq \f(1,7)× (1+2+3+4+5+6+7)=4,
eq \(y,\s\up6(-))=eq \f(1,7)×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
eq \(∑,\s\up6(7),\s\d4(i=1)) (ti-eq \(t,\s\up6(-)))2 =9+4+1+0+1+4+9=28,
eq \(∑,\s\up6(7),\s\d4(i=1)) (ti-eq \(t,\s\up6(-))) (yi-eq \(y,\s\up6(-)))=(-3)×(-1.4)+(-2)×(-1)+(-1)×(-0.7)+0×0.1+1×0.5+2×0.9+3×1.6=14,
eq \(b,\s\up6(^))=eq \f(eq \(∑,\s\up10(7),\s\d10(i=1))(ti-eq \(t,\s\up6(-))) (yi-eq \(y,\s\up6(-))),eq \(∑,\s\up10(7),\s\d10(i=1))(ti-eq \(t,\s\up6(-)))2)
=eq \f(14,28)=0.5,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^)) eq \(t,\s\up6(-))=4.3-0.5×4=2.3,
所以所求回归方程为eq \(y,\s\up6(^))=0.5t+2.3.
(2)由(1)知eq \(b,\s\up6(^))=0.5>0,故2011年到2017年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.将2020年的年份代号t=10代入(1)中的回归方程,得eq \(y,\s\up6(^))=0.5×10+2.3=7.3.故预测该地区2020年农村居民家庭人均纯收入为7.3千元.
题型二 残差分析与相关指数的应用
【例2】 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
(1)以x为解释变量,y为预报变量,作出散点图;
(2)求y与x之间的回归方程,对于基本苗数56.7预报有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求R2,并说明(2)中求出的回归模型的拟合程度.
解 (1)散点图如下.
(2)由(1)中散点图看出,样本点大致分布在一条直线的附近,有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系.
设回归方程为eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^)),又eq \(x,\s\up6(-))=30.36,eq \(y,\s\up6(-))=43.5,
eq \(∑,\s\up6(5),\s\d4(i=1))xeq \\al(2,i)=5 101.56,
eq \a\vs4\al(\(x,\s\up6(-)) )eq \a\vs4\al(\(y,\s\up6(-)) )=1 320.66,eq \(x,\s\up6(-))2=921.729 6,
eq \(∑,\s\up6(5),\s\d4(i=1))xiyi=6 746.76.
则eq \(b,\s\up6(^))=eq \f(\(∑,\s\up10(5),\s\d10(i=1))xiyi-5\a\vs4\al(\(x,\s\up6(-)) )\a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up10(5),\s\d10(i=1))xeq \\al(2,i)-5\(x,\s\up6(-))2)≈0.29,eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^)) eq \(x,\s\up6(-))≈34.70.
故所求的回归直线方程为eq \(y,\s\up6(^))=0.29x+34.70.
当x=56.7时,eq \(y,\s\up6(^))=0.29×56.7+34.70=51.143.
故估计成熟期有效穗为51.143.
(3)由eq \(y,\s\up6(^))i=eq \(b,\s\up6(^))xi+eq \(a,\s\up6(^)),可以算得eq \(e,\s\up6(^))i=yi-eq \(y,\s\up6(^))i分别为eq \(e,\s\up6(^))1=0.35,eq \(e,\s\up6(^))2=0.718,eq \(e,\s\up6(^))3=-0.5,eq \(e,\s\up6(^))4=-2.214,eq \(e,\s\up6(^))5=1.624,残差平方和:eq \(∑,\s\up6(5),\s\d4(i=1)) eq \(e,\s\up6(^))eq \\al(2,i)≈8.43.
(4) eq \(∑,\s\up6(5),\s\d4(i=1)) (yi-eq \(y,\s\up6(-)))2=50.18,故R2≈1-eq \f(8.43,50.18)≈0.832.所以(2)中求出的回归模型的效果较好.
规律方法 (1)利用残差分析研究两个变量间的关系时,首先要根据散点图来判断它们是否线性相关,是否可以用线性回归模型来拟合数据,然后通过残差eq \(e,\s\up6(^))1,eq \(e,\s\up6(^))2,…,eq \(e,\s\up6(^))n来判断模型拟合的效果.
(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合度越高,回归方程预报精确度越高.
【训练2】 为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:
(1)作出散点图并求回归直线方程;
(2)求出R2并说明回归模型拟合的程度;
(3)进行残差分析.
解 (1)散点图如图所示.
样本点分布在一条直线附近,y与x具有线性相关关系.
由表中数据,得eq \(x,\s\up6(-))=eq \f(1,6)×(5+10+15+20+25+30)
=17.5,
eq \(y,\s\up6(-))=eq \f(1,6)×(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,
eq \(∑,\s\up6(6),\s\d4(i=1))xeq \\al(2,i)= 2 275,eq \(∑,\s\up6(6),\s\d4(i=1))xiyi=1 076.2.
计算得eq \(b,\s\up6(^))≈0.183,eq \(a,\s\up6(^))≈6.285.
故所求回归直线方程为eq \(y,\s\up6(^))=6.285+0.183x.
(2)列表如下:
可得eq \(∑,\s\up6(6),\s\d4(i=1)) (yi-eq \(y,\s\up6(^))i)2≈0.013 18, eq \(∑,\s\up6(6),\s\d4(i=1)) (yi-eq \(y,\s\up6(-)))2≈14.678 3.
所以R2=1-eq \f(0.013 18,14.678 3)≈0.999 1,回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正错误,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在宽度不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与所挂物体的质量成线性关系.
题型三 非线性回归分析
【例3】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
表中wi=eq \r(xi),eq \(w,\s\up6(-))=eq \f(1,8)eq \(∑,\s\up6(8),\s\d4(i=1))wi.
(1)根据散点图判断,y=a+bx与y=c+deq \r(x)哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为z=0.2y-x.
根据(2)的结果回答下列问题:
①年宣传费x=49时,年销售量及年利润的预报值是多少?
②年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线eq \(v,\s\up6(^))=eq \(α,\s\up6(^))+eq \(β,\s\up6(^))u的斜率和截距的最小二乘估计分别为
eq \(β,\s\up6(^))=eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (ui-\(u,\s\up6(-)))(vi-\(v,\s\up6(-))),\(∑,\s\up10(n),\s\d10(i=1)) (ui-\(u,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(v,\s\up6(-))-eq \(β,\s\up6(^))eq \(u,\s\up6(-)).
解 (1)由散点图可以判断,y=c+deq \r(x)适宜作为年销售量y关于年宣传费x的回归方程类型.
(2)令w=eq \r(x),先建立y关于w的线性回归方程.
由于eq \(d,\s\up6(^))=eq \f(\(∑,\s\up10(8),\s\d10(i=1)) (wi-\(w,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up10(8),\s\d10(i=1)) (wi-\(w,\s\up6(-)))2)=eq \f(108.8,1.6)=68,
eq \(c,\s\up6(^))=eq \(y,\s\up6(-))-eq \(d,\s\up6(^))eq \(w,\s\up6(-))=563-68×6.8=100.6,
所以y关于w的线性回归方程为eq \(y,\s\up6(^))=100.6+68w,
因此y关于x的回归方程为eq \(y,\s\up6(^))=100.6+68eq \r(x).
(3)①由(2)知,当x=49时,
年销售量y的预报值eq \(y,\s\up6(^))=100.6+68eq \r(49)=576.6(t),
年利润z的预报值eq \(z,\s\up6(^))=576.6×0.2-49=66.32(千元).
②根据(2)的结果知,年利润z的预报值
eq \(z,\s\up6(^))=0.2(100.6+68eq \r(x))-x=-x+13.6eq \r(x)+20.12.
所以当eq \r(x)=eq \f(13.6,2)=6.8,
即x=46.24时,eq \(z,\s\up6(^))取得最大值.
故年宣传费为46.24千元时,年利润的预报值最大.
规律方法 求非线性回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性回归方程.
【训练3】 下表为收集到的一组数据:
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系,预报回归模型并计算残差;
(3)利用所得模型,预报x=40时y的值.
解 (1)作出散点图如下图,从散点图可以看出x与y不具有线性相关关系,根据已有知识可以发现样本点分布在某一条指数函数曲线y=c1ec2x的周围,其中c1,c2为待定的参数.
(2)对y=c1ec2x两边取对数,得ln y=ln c1+c2x,令z=ln y,则有变换后的样本点应分布在直线z=bx+a(a=ln c1,b=c2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为
求得回归直线方程为eq \(z,\s\up6(^))=0.272x-3.849,
∴eq \(y,\s\up6(^))=e0.272x-3.849.
残差
(3)当x=40时,eq \(y,\s\up6(^))=e0.272×40-3.849≈1 131.
一、素养落地
1.通过本节课的学习,进一步提升数学运算及数据分析素养.
2.当根据给定的样本数据得到的散点图并不是分布在一条直线附近时,就不能直接求其回归直线方程了,这时可根据得到的散点图,选择一种拟合得最好的函数,常见的函数有幂函数、指数函数、对数函数等,然后进行变量置换,将问题转化为线性回归分析问题.
二、素养训练
1.下列两个变量之间的关系不是函数关系的是( )
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和内角度数和
D.人的年龄和身高
解析 函数关系就是变量之间的一种确定性关系.A,B,C三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cs θ,g(a)=a2,h(n)=(n-2)π.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.
答案 D
2.(多选题)关于残差图的描述正确的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或预报变量
C.残差点分布的带状区域的宽度越窄相关指数越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
解析 残差点分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时,R2的值越大,故描述错误的是C.
答案 ABD
3.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:
由上表可得回归直线方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))=-5,据此模型预测当零售价为14.5元时,每天的销售量为( )
A.51个 B.50个
C.54个 D.48个
解析 由题意知eq \(x,\s\up6(-))=17.5,eq \(y,\s\up6(-))=39,代入回归直线方程得eq \(a,\s\up6(^))=126.5,126.5-14.5×5=54,故选C.
答案 C
4.在研究硝酸钠的溶解度时,观察它在不同温度(x)的水中溶解度(y)的结果如下表:
由此得到回归直线的斜率是__________.
解析 eq \(x,\s\up6(-))=eq \f(1,5)(0+10+20+50+70)=30,
eq \(y,\s\up6(-))=eq \f(1,5)(66.7+76.0+85.0+112.3+128.0)=93.6,
由公式eq \(b,\s\up6(^))=eq \f(\(∑,\s\up10(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up10(5),\s\d10(i=1)) (xi-\(x,\s\up6(-)))2)可得eq \(b,\s\up6(^))≈0.880 9.
答案 0.880 9
5.在一次抽样调查中测得样本的5个样本点,数值如下表:
试建立y与x之间的回归方程.
解 由数值表可作散点图如图,
根据散点图可知y与x近似地呈反比例函数关系,
设eq \(y,\s\up6(^))=eq \f(k,x),令t=eq \f(1,x),则eq \(y,\s\up6(^))=kt,原数据变为:
由置换后的数值表作散点图如下:
由散点图可以看出y与t呈近似的线性相关关系,列表如下:
所以eq \(t,\s\up6(-))=1.55,eq \(y,\s\up6(-))=7.2.
所以eq \(b,\s\up6(^))=eq \f(\(∑,\s\up10(5),\s\d10(i=1))tiyi-5\a\vs4\al(\(t,\s\up6(-)) )\a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up10(5),\s\d10(i=1))teq \\al(2,i)-5\(t,\s\up6(-))2)≈4.134 4,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(t,\s\up6(-))≈0.8.
所以eq \(y,\s\up6(^))=4.134 4t+0.8.
所以y与x之间的回归方程是
eq \(y,\s\up6(^))=eq \f(4.134 4,x)+0.8.
基础达标
一、选择题
1.已知某地财政收入x与支出y满足回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))+ei(单位:亿元)(i=1,2,…),其中eq \(b,\s\up6(^))=0.8,eq \(a,\s\up6(^))=2,|ei|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )
A.10亿元 B.9亿元
C.10.5亿元 D.9.5亿元
解析 eq \(y,\s\up6(^))=0.8×10+2+ei=10+ei,
∵|ei|<0.5,∴9.5<eq \(y,\s\up6(^))<10.5.
答案 C
2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
解析 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
答案 A
3.在回归分析中,R2的值越大,说明残差平方和( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
解析 因为R2=1-eq \f(\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(n),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2),所以当R2越大时,eq \(∑,\s\up10(n),\s\d10(i=1)) (yi-eq \(y,\s\up6(^))i)2越小,即残差平方和越小.
答案 B
4.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的回归直线方程,则需作变换t等于( )
A.sin2 α B.(sin α+1)2
C.eq \b\lc\(\rc\)(\a\vs4\al\c1(sin α+\f(1,2)))eq \s\up12(2) D.以上都不对
解析 因为y是关于t的回归直线方程,实际上即y是关于t的一次函数,又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.
答案 B
5.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和eq \(∑,\s\up10(n),\s\d10(i=1)) (yi-eq \(y,\s\up6(^))i)2如下表:
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高( )
A.甲 B.乙
C.丙 D.丁
解析 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中eq \(∑,\s\up10(n),\s\d10(i=1)) (yi-eq \(y,\s\up6(-)))2为确定的数,则残差平方和越小,R2越大),由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.
答案 D
二、填空题
6.某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:
已知y关于x的线性回归方程为eq \(y,\s\up6(^))=6.5x+17.5,则当广告支出费用为5万元时,残差为__________万元.
解析 当x=5时,eq \(y,\s\up6(^))=6.5×5+17.5=50,表格中对应y=60,于是残差为60-50=10(万元).
答案 10
7.某商场为了了解某品牌羽绒服的月销售量(单位:件)与月平均气温x(单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:
由表中数据算出线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))≈-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月该品牌羽绒服的销售量的件数约为________.
解析 由表格中数据可得eq \(x,\s\up6(-))=eq \f(17+13+8+2,4)=10,
eq \(y,\s\up6(-))=eq \f(24+33+40+55,4)=38.
又∵eq \(b,\s\up6(^))≈-2,∴eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^)) eq \(x,\s\up6(-))≈38+2×10=58,
∴eq \(y,\s\up6(^))=-2x+58.当x=6时,eq \(y,\s\up6(^))=-2×6+58=46.
答案 46
8.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了__________的热茶销售杯数变化,而随机误差贡献了剩余的__________,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
解析 由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.
答案 85% 15%
三、解答题
9.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得eq \(∑,\s\up10(10),\s\d10(i=1))xi=80,eq \(∑,\s\up10(10),\s\d10(i=1))yi=20,eq \(∑,\s\up10(10),\s\d10(i=1))xiyi=184,eq \(∑,\s\up10(10),\s\d10(i=1))xeq \\al(2,i)=720.
(1)求家庭的月储蓄y关于月收入x的线性回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^));
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解 (1)由题意知n=10,eq \(x,\s\up6(-))=eq \f(1,n)eq \(∑,\s\up10(10),\s\d10(i=1))xi=eq \f(1,10)×80=8,
eq \(y,\s\up6(-))=eq \f(1,n)eq \(∑,\s\up10(10),\s\d10(i=1))yi=eq \f(1,10)×20=2,
所以eq \(b,\s\up6(^))=eq \f(\(∑,\s\up10(10),\s\d10(i=1))xiyi-n\a\vs4\al(\(x,\s\up6(-)) )\a\vs4\al(\(y,\s\up6(-)) ),\(∑,\s\up10(10),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2)=eq \f(184-10×8×2,720-10×82)=eq \f(24,80)=0.3,
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=2-0.3×8=-0.4,
故所求线性回归方程为eq \(y,\s\up6(^))=0.3x-0.4.
(2)将x=7代入回归方程,可以预测家庭的月储蓄约为eq \(y,\s\up6(^))=0.3×7-0.4=1.7(千元).
10.为了研究甲型H1N1中的某种细菌随时间x变化的繁殖个数y,收集数据如下:
求y对x的回归方程.
解 作出散点图如图(1)所示.
由散点图看出样本点分布在一条指数型曲线y=cebx的周围,则ln y=bx+ln c.
令z=ln y,a=ln c,则z=bx+a.
相应的散点图如图(2)所示.从图(2)可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.由表中数据得到线性回归方程为eq \(z,\s\up6(^))=0.69x+1.112.因此细菌的繁殖个数对温度的非线性回归方程为eq \(y,\s\up6(^))=e0.69x+1.112.
能力提升
11.若对于变量x,y的10组统计数据的回归模型中,计算R2=0.95,又知残差平方和为120.55,那么eq \(∑,\s\up10(10),\s\d10(i=1)) (yi-eq \(y,\s\up6(-)))2的值为( )
A.241.1 B.245.1
C.2 411 D.2 451
解析 由题意知残差平方和eq \(∑,\s\up10(10),\s\d10(i=1)) (yi-eq \(y,\s\up6(^))i)2=120.55,又R2=1-eq \f(\(∑,\s\up10(10),\s\d10(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up10(10),\s\d10(i=1)) (yi-\(y,\s\up6(-)))2)=0.95,所以eq \(∑,\s\up10(10),\s\d10(i=1)) (yi-eq \(y,\s\up6(-)))2=2 411.
答案 C
12.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式U=Aebt(b<0)表示,现测得时间t(s)时的电压U(V)如下表:
试求:电压U对时间t的回归方程(提示 对公式两边取自然对数,把问题转化为线性回归分析问题).
解 对U=Aebt两边取对数得ln U=ln A+bt,令y=ln U,a=ln A,x=t,则y=a+bx,y与x的对应数据如下表:
根据表中数据画出散点图,如图所示,从图中可以看出,y与x具有较好的线性相关关系,由表中数据求得eq \(x,\s\up6(-))=5,eq \(y,\s\up6(-))≈3.045,由公式计算得eq \(b,\s\up6(^))≈-0.313,eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-))=4.61,所以y对x的线性回归方程为eq \(y,\s\up6(^))=-0.313x+4.61.
所以ln eq \(U,\s\up6(^))=-0.313t+4.61,即eq \(U,\s\up6(^))=e-0.313t+4.61=e-0.313t·e4.61,因此电压U对时间t的回归方程为eq \(U,\s\up6(^))=e-0.313t·e4.61.
创新猜想
13.(多选题)如图四个散点图中,适合用线性回归模型拟合其中两个变量关系的是( )
A.① B.② C.③ D.④
解析 由图易知①③两个图中样本点在一条直线附近,因此适合用线性回归模型.
答案 AC
14.(多选题)下列说法正确的是( )
A.残差的绝对值越小,回归方程的拟合效果越好
B.残差平方和越小,决定系数R2越大
C.决定系数R2可以大于1
D.通过经验回归方程得到的预报值是响应变量的可能取值的平均值,不一定是响应变量的精确值
解析 R2的计算公式,知B正确,C错误;A,D均正确.
答案 ABD课标要求
素养要求
1.进一步掌握一元线性回归模型参数的统计意义,会用相关统计软件.
2.了解非线性回归模型.
3.会通过分析残差和利用R2判断回归模型的拟合效果.
通过学习回归模型的应用,提升数学运算及数据分析素养.
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
x
14
16
18
20
22
y
12
10
7
5
3
yi-eq \(y,\s\up6(^))i
0
0.3
-0.4
-0.1
0.2
yi-eq \(y,\s\up6(-))
4.6
2.6
-0.4
-2.4
-4.4
年份
2011
2012
2013
2014
2015
2016
2017
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
x
15.0
25.8
30.0
36.6
44.4
y
39.4
42.9
42.9
43.1
49.2
x
5
10
15
20
25
30
y
7.25
8.12
8.95
9.90
10.9
11.8
yi-eq \(y,\s\up6(^))i
0.05
0.005
-0.08
-0.045
0.04
0.025
yi-eq \(y,\s\up6(-))
-2.237
-1.367
-0.537
0.413
1.413
2.313
eq \(x,\s\up6(-))
eq \(y,\s\up6(-))
eq \(w,\s\up6(-))
eq \(∑,\s\up6(8),\s\d4(i=1)) (xi-eq \(x,\s\up6(-)))2
eq \(∑,\s\up6(8),\s\d4(i=1)) (wi-eq \(w,\s\up6(-)))2
eq \(∑,\s\up6(8),\s\d4(i=1)) (xi-eq \(x,\s\up6(-)))·(yi-eq \(y,\s\up6(-)))
eq \(∑,\s\up6(8),\s\d4(i=1)) (wi-eq \(w,\s\up6(-)))·(yi-eq \(y,\s\up6(-)))
46.6
563
6.8
289.8
1.6
1 469
108.8
x
21
23
25
27
29
32
35
y
7
11
21
24
66
115
325
x
21
23
25
27
29
32
35
z
1.946
2.398
3.045
3.178
4.190
4.745
5.784
yi
7
11
21
24
66
115
325
eq \(y,\s\up6(^))i
6.443
11.101
19.125
32.950
56.770
128.381
290.325
eq \(e,\s\up6(^))i
0.557
-0.101
1.875
-8.950
9.23
-13.381
34.675
x
16
17
18
19
y
50
34
41
31
温度x
0
10
20
50
70
溶解度y
66.7
76.0
85.0
112.3
128.0
x
0.25
0.5
1
2
4
y
16
12
5
2
1
t
4
2
1
0.5
0.25
y
16
12
5
2
1
I
ti
yi
tiyi
teq \\al(2,i)
1
4
16
64
16
2
2
12
24
4
3
1
5
5
1
4
0.5
2
1
0.25
5
0.25
1
0.25
0.062 5
∑
7.75
36
94.25
21.312 5
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
x
2
4
5
6
8
y
30
40
60
50
70
月平均气温x/℃
17
13
8
2
月销售量y/件
24
33
40
55
天数x
1
2
3
4
5
6
繁殖个数y
6
12
25
49
95
190
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
t/s
0
1
2
3
4
5
6
7
8
9
10
U/V
100
75
55
40
30
20
15
10
10
5
5
x
0
1
2
3
4
5
6
7
8
9
10
y
4.6
4.3
4.0
3.7
3.4
3.0
2.7
2.3
2.3
1.6
1.6
高中数学8.2 一元线性回归模型及其应用优秀导学案: 这是一份高中数学8.2 一元线性回归模型及其应用优秀导学案,文件包含人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用原卷版doc、人教A版高中数学选择性必修第三册同步讲义第27讲82一元线性回归模型及其应用含解析doc等2份学案配套教学资源,其中学案共0页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀导学案: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀导学案,共12页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,参考答案等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用学案: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用学案,文件包含人教A版2019选择性必修三高中数学同步82一元线性回归模型及其应用解析版docx、人教A版2019选择性必修三高中数学同步82一元线性回归模型及其应用原卷版docx等2份学案配套教学资源,其中学案共28页, 欢迎下载使用。