数学人教B版 (2019)4.3.1 一元线性回归模型精练
展开课后篇巩固提升
基础达标练
1.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线方程的回归系数为b^,回归截距是a^,那么必有( )
A.b^与r的符号相同
B.a^与r的符号相同
C.b^与r的符号相反
D.a^与r的符号相反
解析由公式可知b^与r的符号相同.
答案A
2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则Y对x的线性回归方程为( )
A.y^=x-1
B.y^=x+1
C.y^=88+12x
D.y^=176
解析设Y对x的线性回归方程为y^=a^+b^x,
因为b^=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22=12,a^=y-b^x=176-12×176=88,所以Y对x的回归直线方程为y^=88+12x.
答案C
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为( )
A.-1B.0
C.12D.1
解析因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
答案D
4.从某高中随机选取5名高三男生,其身高和体重的数据如表所示:
根据上表可得回归直线方程y^=0.56x+a^,据此模型预报身高为172 cm的高三男生的体重约为( )
kg
kg
kg
kg
解析x=160+165+170+175+1805=170,
y=63+66+70+72+745=69.
因为回归直线过点(x,y),
所以将点(170,69)代入y^=0.56x+a^中得a^=-26.2,所以回归直线方程为y^=0.56x-26.2,
代入x=172,则其体重约为70.12 kg.
答案B
5.某商店为了了解热饮销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热饮的杯数与当天气温,并制作了表格:
由表中数据算得线性回归方程y^=b^x+a^中的b^≈-2,预测当气温为-5 ℃时,热饮销售量大约为 杯. 已知回归系数b^=∑i=1nxiyi-nx y∑i=1nxi2-nx2,a^=y-b^x
解析根据表格中的数据可求得
x=14×(18+13+10-1)=10,
y=14×(24+34+38+64)=40.
所以a^=y-b^x=40-(-2)×10=60.
所以y^=-2x+60.当x=-5时,
y^=-2×(-5)+60=70(杯).
答案70
6.若回归直线方程中的回归系数b^=0,则相关系数r= .
解析相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2与b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2的分子相同,故r=0.
答案0
7.已知x,Y的取值如下表:
从散点图分析,Y与x线性相关,且回归直线方程为y^=1.42x+a,则a的取值为 .
解析由已知得x=144=3.5,y=4.5.
又因为回归直线过(x,y),
所以4.5=3.5×1.42+a,
所以a=-0.47.
答案-0.47
8.(2018全国Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
y^=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
y^=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,答出其中任意一种或其他合理理由均可)
能力提升练
1.(2019山东莒县第二中学高考模拟)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y^=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程y^=b2x+a2,相关系数为r2.则( )
A.0
2.(2019北京人大附中高考模拟)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( )
A.DB.E
C.FD.A
解析因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.该图所表示的两个变量是正相关,又因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.
答案B
3.(2019河南高二月考)某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟定的价格进行试销,得到如下数据.
由表中数据求得线性回归方程y^=-4x+a,则a= ,当x=10元时预测销量为 件.
解析由题得:
x=16(4+5+6+7+8+9)=132,
y=16(90+84+83+80+75+68)=80,
∴a=80+4×132=106,
∴x=10⇒y^=106-40=66.
答案106 66
4.(2019内蒙古杭锦后旗奋斗中学高二月考)在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得回归直线方程z^=0.25x-2.58,则该模型的回归方程为 .
解析由回归直线方程z^=0.25x-2.58得ln y=0.25x-2.58,整理得y=e0.25x-2.58,
所以该模型的回归方程为y^=e0.25x-2.58.
答案y^=e0.25x-2.58
5.(2020山东沂水模拟)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大.某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如表:
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出是正相关还是负相关;
(2)①求出y关于x的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回归方程预测该市一个月内购买该流量包的人数能否超过20万人.
参考数据:25 000≈158,26 000≈161,27 000≈164.
参考公式:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,回归直线方程y^=b^x+a^,其中b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
解(1)根据题意,得x=15(30+35+40+45+50)=40,y=15(18+14+10+8+5)=11.
可列表如下
根据表格和参考数据,得∑i=15(xi-x)(yi-y)=-160,∑i=15(xi-x)2∑i=15(yi-y)2=250×104=26 000≈161.
因而相关系数r=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2∑i=15(yi-y)2=-160161≈-0.99.
由于|r|≈0.99很接近1,因而可以用线性回归方程模型拟合y与x的关系.
由于r<0,故其关系为负相关.
(2)①b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=-160250=-0.64,a^=11+0.64×40=36.6,
因而y关于x的回归方程为y^=-0.64x+36.6.
②由①知,若x=25,则y^=-0.64×25+36.6=20.6,故若将流量包的价格定为25元/月,可预测该市一个月内购买该流量包的人数会超过20万人.
素养培优练
(2020山东蒙阴实验中学高三期末)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,经统计得到如下数据:
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+bx和指数函数模型y=cedx分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为y^=96.54e-0.2x,ln y与x的相关系数r1=-0.94.参考数据其中ui=1xi:
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.
参考公式:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),其回归直线υ=α+βu的斜率和截距的最小二乘估计分别为β^=∑i=1nuiυi-nu υ∑i=1nui2-nu2,a^=υ-β^u,相关系数r=∑i=1nuiυi-nu υ(∑i=1nui2-nu2)(∑i=1nυi2-nυ2).
解(1)令u=1x,则y=a+bx可转化为y=a+bu,
因为y=3608=45,
所以b^=∑i=18uiyi-8u y∑i=18ui2-8u2=183.4-8×0.34×451.53-8×0.115=610.61=100,
则a^=y-b^u=45-100×0.34=11,
所以y^=11+100u,
所以y关于x的回归方程为y^=11+100x.
(2)y与1x的相关系数为
r2=∑i=18uiyi-nu y(∑i=18ui2-8u2)(∑i=18yi2-8y2)=610.61×6 185.5
=6161.4≈0.99,
因为|r1|<|r2|,
所以用反比例函数模型拟合效果更好,
当x=10时,y=10010+11=21(元),
所以当产量为10千件时,每件产品的非原料成本为21元.
(3)(ⅰ)若产品单价为100元,记企业利润为X(千元),订单为9千件时,每件产品的成本为2899元,企业的利润为611(千元),
订单为10千件时,每件产品的成本为31元,企业的利润为690(千元),
企业利润X(千元)的分布列为
所以E(X)=611×0.8+690×0.2=626.8(千元).
(ⅱ)若产品单价为90元,记企业利润为Y(千元),
订单为10千件时,每件产品的成本为31元,企业的利润为590(千元),
订单为11千件时,每件产品的成本为33111元,企业的利润为659(千元),
企业利润Y(千元)的分布列为
所以E(Y)=590×0.3+649×0.7=638.3(千元),
因为626.8<638.3,故企业要想获得更高利润,产品单价应选择90元.
父亲身高x/cm
174
176
176
176
178
儿子身高Y/cm
175
175
176
177
177
身高x/cm
160
165
170
175
180
体重y/kg
63
66
70
72
74
气温/℃
18
13
10
-1
销售量/杯
24
34
38
64
x
2
3
4
5
Y
2.2
3.8
5.5
6.5
单价x/元
4
5
6
7
8
9
销量y/件
90
84
83
80
75
68
流量包的定价/(元/月)
30
35
40
45
50
购买人数/万人
18
14
10
8
5
i
1
2
3
4
5
xi-x
-10
-5
0
5
10
yi-y
7
3
-1
-3
-6
(xi-x)(yi-y)
-70
-15
0
-15
-60
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
∑i=18uiyi
u
u2
∑i=18ui2
∑i=18yi
∑i=18yi2
0.61×6 185.5
e-2
183.4
0.34
0.115
1.53
360
22 385.5
61.4
0.135
X
611
690
P
0.8
0.2
Y
590
659
P
0.3
0.7
数学4.3.1 一元线性回归模型课后练习题: 这是一份数学4.3.1 一元线性回归模型课后练习题,共6页。试卷主要包含了5B等内容,欢迎下载使用。
数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题: 这是一份数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题,共4页。试卷主要包含了3统计模型,54元 D,4X+2,[多选题]设某大学的女生体重Y等内容,欢迎下载使用。
2020-2021学年第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型第2课时精练: 这是一份2020-2021学年第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型第2课时精练,共7页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。