高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用练习题
展开第八章 8.2
A组·素养自测
一、选择题
1.(多选)小明同学在做市场调查时得到如下样本数据:
x
1
3
6
10
y
8
a
4
2
他由此得到经验回归方程为=-2.1x+15.5,则下列说法正确的是( ABC )
A.变量x与y负线性相关
B.当x=2时,=11.3
C.a=6
D.变量x与y之间是函数关系
[解析] A.因为=-2.1,所以变量x与y负线性相关,正确;B.将x=2代入经验回归方程,得=11.3,正确;C.将(,)代入经验回归方程,得a=6,正确;D.变量x与y之间是相关关系,不是函数关系,错误.
2.甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的相关指数R2分别如表:
甲
乙
丙
丁
R2
0.98
0.78
0.50
0.85
哪位同学建立的回归模型拟合效果最好( A )
A.甲 B.乙
C.丙 D.丁
[解析] 相关指数R2越大,表示回归模型的效果越好.
3.2020年初,新型冠状病毒引起的肺炎疫情暴发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如表所示:
周数(x)
1
2
3
4
5
治愈人数(Y)
2
17
36
103
142
由表格可得Y关于x的非线性经验回归方程为=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为( C )
A.5 B.-13
C.13 D.0
[解析] 因为=(1+4+9+16+25)=11,=(2+17+36+103+142)=60,所以a=60-6×11=-6,则Y关于x的非线性经验回归方程为=6x2-6.取x=4,得=6×42-6=90,
所以此回归模型第4周的预报值为90,
则此回归模型第4周的残差为 103-90=13.
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x/万元
8.2
8.6
10.0
11.3
11.9
支出y/万元
6.2
7.5
8.0
8.5
9.8
根据上表可得经验回归方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元的家庭的年支出为( B )
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
[解析] 由题意可得=×(8.2+8.6+10.0+11.3+11.9)=10,
=×(6.2+7.5+8.0+8.5+9.8)=8,
所以=8-0.76×10=0.4,
所以线性经验回归方程为=0.76x+0.4,把x=15代入,可得=0.76×15+0.4=11.8(万元).
5.已知x与Y之间的几组数据如表:
x
1
2
3
4
5
6
Y
0
2
1
3
3
4
假设根据上表数据所得经验回归方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′ B.>b′, C.<b′,>a′ D.<b′,<a′
[解析] 过(1,0)和(2,2)的直线方程为y′=2x-2,画出六点的散点图,回归直线的大概位置如图所示,
显然,b′>,>a′.
二、填空题
6.已知经验回归方程=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.2),则残差平方和是_0.06__.
[解析] 因为=2x+1,所以当x=2时,=5,e1=-0.1;x=3时,=7,e2=0.1;x=4时,=9,e3=0.2.
所以残差平方和为e+e+e=0.01+0.01+0.04=0.06.
7.如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为=x+1,则=_0.8__.
[解析] 由题图知==2,
==2.6,
将(2,2.6)代入=x+1中,解得=0.8.
8.期中考试后,某校高二(9)班对全班65名学生的成绩进行分析,得到数学成绩y对总成绩x的经验回归方程为=6+0.4x.由此可以估计:若两个同学的总成绩相差50分,则他们的数学成绩大约相差_20__分.
[解析] 令两人的总成绩分别为x1,x2.则对应的数学成绩估计为1=6+0.4x1,2=6+0.4x2,
所以|1-2|=|0.4(x1-x2)|=0.4×50=20.
三、解答题
9.(2022·山东潍坊高二月考)某人计划购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:
月份编号t
1
2
3
4
5
销量y(万辆)
0.5
0.6
1
1.4
1.7
经分析发现,可用线性回归模型拟合该品牌新能源汽车的实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的经验回归方程=t+,并预测月份编号t为6时,该品牌新能源汽车的销量.
[解析] 易知==3,
==1.04,
=12+22+32+42+52=55,
iyi=1×0.5+2×0.6+3×1+4×1.4+5×1.7=18.8,
==
==0.32,
=-=1.04-0.32×3=0.08.
则y关于t的经验回归方程为=0.32t+0.08,
当t=6时,=2,即月份编号为6时,当地该品牌新能源汽车的销量约为2万辆.
10.在一段时间内,某淘宝网店一种商品的销售价格x(元)和日销售量Y(件)之间的一组数据为:
价格x(元)
22
20
18
16
14
日销售量Y(件)
37
41
43
50
56
求出Y关于x的经验回归方程,并说明该方程拟合效果的好坏.
参考数据:iyi=3 992,=1 660.
[解析] 作出散点图(此处略),观察散点图,可知这些点散布在一条直线的附近,故可用线性回归模型来拟合数据.
因为==18,
==45.4.
所以==-2.35,
=45.4-(-2.35)×18=87.7.
所以经验回归方程为=-2.35x+87.7.
yi-i与yi-的值如表:
yi-
1
0.3
-2.4
-0.1
1.2
yi-
-8.4
-4.4
-2.4
4.6
10.6
计算得(yi-i)2=8.3,(yi-)2=229.2,所以R2=1-≈0.964.
因为0.964很接近于1,
所以该模型的拟合效果比较好.
B组·素养提升
一、选择题
1.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x
2
4
5
6
8
y
▲
40
60
50
70
工作人员不慎将表格中y的第一个数据丢失,已知y对x呈线性相关关系,且经验回归方程为=6.5x+17.5,则下列说法正确的有( AB )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
[解析] 由回归方程=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把点代入经验回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;若该公司下月广告费支出为8万元,则销售额约为y=6.5×8+17.5=69.5(万元),所以D不正确,故选AB.
2.(多选)某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为l1:y=0.68x+,计算其相关系数为r1.经过分析确定点F为“离群点”,把它去掉后,再利用剩下的5组数据计算得到经验回归直线的方程为l2:y=x+0.68,相关系数为r2,以下结论中,正确的是( ACD )
A.r1>0,r2>0 B.r1>r2
C.=0.12 D.0<<0.68
[解析] 由图可知两变量呈现正相关,故r1>0,r2>0,且r1
A.经验回归直线至少过(x1,y1),(x2,y2),…,(xn,yn)中的一个点
B.若=,=,则经验回归直线过点(,)
C.若父母的平均身高增加1 cm,则儿子的身高估计增加0.516 cm
D.若样本数据(xi,yi)(i=1,2,…,n)所构成的点都在经验回归直线上,则线性相关系数r=1
[解析] 对于选项A,经验回归直线不一定经过(x1,y1),(x2,y2),…,(xn,yn)中的一个点,故A不正确;对于选项B,经验回归直线过样本点中心(,),故B正确;对于选项C,因为=85.67+0.516x,所以若父母的平均身高增加1 cm,则儿子的身高估计增加0.516 cm,故C正确;对于选项D,若样本数据(xi,yi)(i=1,2,…,n)所构成的点都在经验回归直线上,则线性相关系数r=1,故D正确.故选BCD.
4.已知变量y关于x的经验回归方程为=ebx-0.5,其一组数据如下表所示:
x
1
2
3
4
y
e
e3
e4
e6
若x=5,则预测y的值可能为( D )
A.e5 B.e
C.e7 D.e
[解析] 将式子两边取对数,得到ln=bx-0.5,令z=ln,得到z=bx-0.5,列出x,z的取值对应的表格,
x
1
2
3
4
z
1
3
4
6
则==2.5,==3.5,
∵(,)满足z=bx-0.5,∴3.5=b×2.5-0.5,
解得b=1.6,∴z=1.6x-0.5,∴y=e1.6x-0.5,当x=5时,=e1.6×5-0.5=e,故选D.
二、填空题
5.对某台机器购置后的运行年限x(x=1,2,3,…)与当年利润y的统计分析知x,y具备线性相关关系,经验回归方程为=10.47-1.3x,估计该台机器最为划算的使用年限为_8__年.
[解析] 当年利润小于或等于零时应该报废该机器,当y=0时,令10.47-1.3x=0,解得x≈8,故估计该台机器最为划算的使用年限为8年.
6.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,其变换后得到线性经验回归方程z=0.3x+4,则c=_e4__.
[解析] 由题意,得ln(cekx)=0.3x+4,所以ln c+kx=0.3x+4,
所以lnc=4,所以c=e4.
7.(一题两空)某品牌服装专卖店为了解保暖衬衣的销售量(y件)与平均气温x(℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如表.
时间
二月上旬
二月中旬
二月下旬
三月上旬
旬平均气温x(℃)
3
8
12
17
旬销售量y(件)
55
m
33
24
由表中数据算出线性经验回归方程=bx+a中的b=-2,样本中心点为(10,38).
(1)表中数据m=_40__;
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为_14__件.
[解析] (1)由=38,得m=40.
(2)由=-得=58,故=-2x+58,
当x=22时,=14,
故三月中旬的销售量约为14件.
三、解答题
8.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得x=0.038,y=1.615 8,xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.
已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数
r=,≈1.377.
[解析] (1)估计该林区这种树木平均一棵的根部横截面积===0.06,
估计该林区这种树木平均一棵的材积量===0.39.
(2) (xi-)(yi-)=xiyi-10 =0.013 4,
(xi-)2=x-10()2=0.002,
(yi-)2=y-10()2=0.094 8,
所以==≈0.01×1.377=0.013 77,
所以样本相关系数r=≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,
所以Y==1 209,
即该林区这种树木的总材积量的估计值为1 209 m3.
9.如图是某企业2016年至2022年的污水净化量(单位:吨)的折线图.
注:年份代码1—7分别对应年份2016—2022.
(1)由折线图看出,可用线性经验回归模型拟合y和t的关系,请用相关系数加以说明;
(2)建立y关于t的经验回归方程,预测2023年该企业的污水净化量.
[解析] (1)由折线图中的数据得,
=4, (ti-)2=28, (yi-)2=18, (ti-)(yi-)=21,所以r=≈0.94.
因为y与t的相关系数近似为0.94,说明y与t的线性相关程度相当大,所以可以用线性经验回归模型拟合y与t的关系.
(2)因为=54,===,
所以=-=54-×4=51,
所以y关于t的线性经验回归方程为=t+=t+51,将2023年对应的t=8代入上式,得=×8+51=57,
所以预测2023年该企业污水净化量约为57吨.
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用巩固练习: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用巩固练习,共8页。试卷主要包含了4,eq \i\sui=13,41≈0,5,等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题: 这是一份人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步训练题,共11页。试卷主要包含了3,则=等内容,欢迎下载使用。
选择性必修 第三册8.2 一元线性回归模型及其应用练习题: 这是一份选择性必修 第三册8.2 一元线性回归模型及其应用练习题,共7页。试卷主要包含了2x+0,5元时,每天的销售量为,关于x与y有如下数据等内容,欢迎下载使用。