人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用第2课时同步练习题
展开第八章 8.2 8.2.1 8.2.2 第2课时
A级——基础过关练
1.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( )
【答案】A 【解析】 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
2.在回归分析中,R2的值越大,说明残差平方和( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
【答案】B 【解析】因为R2=1-,所以当R2越大时,(yi-i)2越小,即残差平方和越小.
3.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2分别如下表:
学生
甲
乙
丙
丁
R2
0.95
0.50
0.85
0.77
则建立的回归模型拟合效果最好的同学是( )
A.甲 B.乙
C.丙 D.丁
【答案】A 【解析】R2越大,表示回归模型的拟合效果越好.
4.若一函数模型为y=sin2α+2sin α+1,为将y转化为t的回归直线方程,则需作变换t等于( )
A.sin2α B.(sin α+1)2
C.2 D.以上都不对
【答案】B 【解析】 因为y是关于t的回归直线方程,实际上就是y关于t的一次函数,又因为y=(sin α+1)2,若令t=(sin α+1)2,则可得y与t的函数关系式为y=t,此时变量y与变量t是线性相关关系.
5.甲、乙、丙、丁4位同学各自对A,B两变量进行回归分析,分别得到散点图与残差平方和(yi-i)2如下表:
学生
甲
乙
丙
丁
散点图
残差平方和
115
106
124
103
哪位同学的试验结果体现拟合A,B两变量关系的模型拟合精度高( )
A.甲 B.乙
C.丙 D.丁
【答案】D 【解析】 根据线性相关的知识,散点图中各样本点条状分布越均匀,同时保持残差平方和越小,则由回归分析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些.
6.(2022年信宜开学)色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批该产品测得如下数据:
色差x
21
23
25
27
29
31
色度y
15
16
17
21
22
23
已知该产品的色差和色度之间满足线性相关关系,且=0.25x+,现有一对测量数据为(32,21.25),则该组数据的残差(测量值与预测值的差)为( )
A.0.65 B.0.75
C.-0.75 D.0.95
【答案】B 【解析】样本中心点坐标为(26,19),代入回归直线方程得到=12.5,所以=0.25x+12.5,将x=32代入,求解得到对应的预估值为20.5,因而其残差为21.25-20.5=0.75.故选B.
7.(多选)(2022年武安月考)下列说法错误的有( )
A.一组数据的预测值与真实值之间的误差越大,残差越小
B.线性回归方程对应的直线=x+至少经过其样本数据点中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,相关指数R2为0.98的模型比相关指数R2为0.80的模型拟合的效果差
【答案】ABD 【解析】对于A,一组数据的预测值与真实值之间的误差越大,残差越大,所以A错误;对于B,线性回归方程对应的直线=x+可能不过任何一个样本数据点,所以B错误;对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;对于D,回归分析中,相关指数R2为0.98的模型比相关指数R2为0.80的模型拟合的效果好,所以D错误.故选ABD.
8.某连锁经营公司所属5个零售店某月的销售额和利润额资料如下表:
商店名称
A
B
C
D
E
销售额x/千万元
3
5
6
7
9
利润额y/百万元
2
3
3
4
5
已知y关于x的经验回归方程为=0.5x+0.4,则当销售额为5千万元时,残差为________.
【答案】0.1 【解析】当x=5时,=0.5×5+0.4=2.9,表格中对应y=3,于是残差为3-2.9=0.1.
9.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,其变换后得到线性回归方程z=0.3x+4,则c=________.
【答案】e4 【解析】由题意,得ln(cekx)=0.3x+4,所以ln c+kx=0.3x+4,比较两边系数,得ln c=4,所以c=e4.
10.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(单位:万元)和销售量y(单位:万台)的数据如下:
年份
2015
2016
2017
2018
2019
2020
2021
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用y=c+d模型拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好.
解:(1)∵=8,=4.2,iyi=279.4,=708,
∴===0.17,
=-=4.2-0.17×8=2.84,
∴y关于x的线性回归方程为=0.17x+2.84.
(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,
∴选用=1.63+0.99更好.
B级——能力提升练
11.2020年初,新冠肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:
周数x
1
2
3
4
5
治愈人数y
2
17
36
103
142
由表格可得y关于x的非线性经验回归方程为=6x2+,则此回归模型第4周的残差为( )
A.13 B.-13
C.5 D.-5
【答案】A 【解析】因为2=(1+4+9+16+25)=11, =(2+17+36+103+142)=60,所以=60-6×11=-6,则y关于x的非线性经验回归方程为=6x2-6.取x=4,得=6×42-6=90,所以此回归模型第4周的预报值为90,则此回归模型第4周的残差为103-90=13.
12.(多选)(2021年广州期末)某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额y看成以年份序号x(2012年作为第1年)的函数.运用excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如图,则下列说法正确的是( )
A.销售额y与年份序号x呈正相关关系
B.三次函数回归模型的残差平方和大于直线回归模型的残差平方和
C.三次函数回归曲线的拟合效果好于回归直线的拟合效果
D.根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为1 698.719亿元
【答案】AC 【解析】由散点图的变化趋势可知,销售额y与年份序号x呈正相关关系,故选项A正确;由散点图以及直线回归模型和三次函数回归模型的位置关系可知,三次函数回归模型的残差平方和小于直线回归模型的残差平方和,故选项B错误;因为0.999>0.936,所以三次函数回归曲线的拟合效果好于回归直线的拟合效果,故选项C正确;因为三次函数为y=0.168x3+28.141x2-29.027x+6.889,则当x=10时,y=2 698.719亿元,故选项D错误.故选AC.
13.对两个具有非线性相关关系的变量x,y进行回归分析,设μ=ln y,υ=(x-4)2,利用二乘法得到μ关于υ的经验回归方程为=-0.5υ+2,则的最大值是________.
【答案】e2 【解析】将μ=ln y,υ=(x-4)2代入经验回归方程=-0.5υ+2,得=e-0.5(x-4)2+2.
当x=4时,=e-0.5(4-4)2+2=e2,故最大值为e2.
14.(2021年武汉期中)为了研究某种病毒在特定环境下随时间变化的繁殖情况,得到了一些数据,绘制成散点图,发现用模型y=cekx拟合比较合适.令z=ln y,得到=1.3x+,经计算发现x,z满足下表,则k=________,c=________.
天数x
2
3
4
5
6
z
1.5
4.5
5.5
6.5
7
【答案】1.3 e-0.2 【解析】由表知,=×(2+3+4+5+6)=4,=×(1.5+4.5+5.5+6.5+7)=5,
由=1.3x+恒过点,知5=1.3×4+,解得=-0.2,∴=1.3x-0.2,即ln y=1.3x-0.2,∴y=e1.3x-0.2=e-0.2·e1.3x,∴k=1.3,c=e-0.2.
15.(2022年日照期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下所示,用两种模型①y=bx+a,②y=b+a分别进行拟合,得到相应的回归方程1=10.7x+3.4,2=35.5-22.8,进行残差分析得到如表所示的残差值及一些统计量的值:
日期x/天
1
2
3
4
5
6
=3.5
=41
iyi=1 049
=91
用户y/人
13
22
43
45
55
68
模型①的残差值
-1.1
-2.8
7.5
-1.2
-1.9
0.4
模型②的残差值
0.3
-5.4
4.3
-3.2
-1.6
3.8
(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由.
(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.
解:(1)应该选择模型①.模型①的残差值的绝对值之和为1.1+2.8+7.5+1.2+1.9+0.4=14.9;模型②的残差值的绝对值之和为0.3+5.4+4.3+3.2+1.6+3.8=18.6.
∵14.9<18.6,
∴模型①的拟合效果较好,应该选模型①.
(2)剔除异常数据,即剔除第3天的数据后,得=×(3.5×6-3)=3.6,=×(41×6-43)=40.6,
iyi=1 049-3×43=920,=91-32=82.
∴====11,=-=40.6-11×3.6=1.
∴y关于x的回归方程为=11x+1.
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题,共11页。试卷主要包含了3,则=等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用第1课时随堂练习题: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用第1课时随堂练习题,共7页。试卷主要包含了随机误差的主要来源有,已知x与y之间的一组数据等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用当堂达标检测题: 这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用当堂达标检测题,共16页。试卷主要包含了27B,已知x、y的取值如下表所示,4B等内容,欢迎下载使用。