高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型同步练习题
展开4.3 统计模型
4.3.1 一元线性回归模型
课后篇巩固提升
基础达标练
1.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线方程的回归系数为,回归截距是,那么必有( )
A.与r的符号相同
B.与r的符号相同
C.与r的符号相反
D.与r的符号相反
解析由公式可知与r的符号相同.
答案A
2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x/cm | 174 | 176 | 176 | 176 | 178 |
儿子身高Y/cm | 175 | 175 | 176 | 177 | 177 |
则Y对x的线性回归方程为( )
A.=x-1
B.=x+1
C.=88+x
D.=176
解析设Y对x的线性回归方程为x,
因为=176-×176=88,所以Y对x的回归直线方程为=88+x.
答案C
3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.0
C. D.1
解析因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.
答案D
4.从某高中随机选取5名高三男生,其身高和体重的数据如表所示:
身高x/cm | 160 | 165 | 170 | 175 | 180 |
体重y/kg | 63 | 66 | 70 | 72 | 74 |
根据上表可得回归直线方程=0.56x+,据此模型预报身高为172 cm的高三男生的体重约为( )
A.70.09 kg
B.70.12 kg
C.70.55 kg
D.71.05 kg
解析=170,
=69.
因为回归直线过点(),
所以将点(170,69)代入=0.56x+中得=-26.2,所以回归直线方程为=0.56x-26.2,
代入x=172,则其体重约为70.12 kg.
答案B
5.某商店为了了解热饮销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天卖出的热饮的杯数与当天气温,并制作了表格:
气温/℃ | 18 | 13 | 10 | -1 |
销售量/杯 | 24 | 34 | 38 | 64 |
由表中数据算得线性回归方程x+中的≈-2,预测当气温为-5 ℃时,热饮销售量大约为 杯.
解析根据表格中的数据可求得
×(18+13+10-1)=10,
×(24+34+38+64)=40.
所以=40-(-2)×10=60.
所以=-2x+60.当x=-5时,
=-2×(-5)+60=70(杯).
答案70
6.若回归直线方程中的回归系数=0,则相关系数r= .
解析相关系数r=的分子相同,故r=0.
答案0
7.已知x,Y的取值如下表:
x | 2 | 3 | 4 | 5 |
Y | 2.2 | 3.8 | 5.5 | 6.5 |
从散点图分析,Y与x线性相关,且回归直线方程为=1.42x+a,则a的取值为 .
解析由已知得=3.5,=4.5.
又因为回归直线过(),
所以4.5=3.5×1.42+a,
所以a=-0.47.
答案-0.47
8.(2018全国Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
解(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=-30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,答出其中任意一种或其他合理理由均可)
能力提升练
1.(2019山东莒县第二中学高考模拟)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程=b2x+a2,相关系数为r2.则( )
A.0<r1<r2<1
B.0<r2<r1<1
C.-1<r1<r2<0
D.-1<r2<r1<0
解析由散点图得负相关,所以r1,r2<0.因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r|更接近1,所以-1<r2<r1<0.
答案D
2.(2019北京人大附中高考模拟)如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是( )
A.D B.E
C.F D.A
解析因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强.该图所表示的两个变量是正相关,又因为点E到直线的距离最远,所以去掉点E,余下的5个点所对应的数据的相关系数最大.
答案B
3.(2019河南高二月考)某工厂为了对新研发的一种产品进行合理定价,将该产品事先拟定的价格进行试销,得到如下数据.
单价x/元 | 4 | 5 | 6 | 7 | 8 | 9 |
销量y/件 | 90 | 84 | 83 | 80 | 75 | 68 |
由表中数据求得线性回归方程=-4x+a,则a= ,当x=10元时预测销量为 件.
解析由题得:
(4+5+6+7+8+9)=,
(90+84+83+80+75+68)=80,
∴a=80+4×=106,
∴x=10⇒=106-40=66.
答案106 66
4.(2019内蒙古杭锦后旗奋斗中学高二月考)在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得回归直线方程=0.25x-2.58,则该模型的回归方程为 .
解析由回归直线方程=0.25x-2.58得ln y=0.25x-2.58,整理得y=e0.25x-2.58,
所以该模型的回归方程为=e0.25x-2.58.
答案=e0.25x-2.58
5.(2020山东沂水模拟)随着智能手机的普及,使用手机上网成为人们日常生活的一部分,很多消费者对手机流量的需求越来越大.某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价x(单位:元/月)和购买人数y(单位:万人)的关系如表:
流量包的定价/(元/月) | 30 | 35 | 40 | 45 | 50 |
购买人数/万人 | 18 | 14 | 10 | 8 | 5 |
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合y与x的关系?并指出是正相关还是负相关;
(2)①求出y关于x的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定为25元/月,请用所求回归方程预测该市一个月内购买该流量包的人数能否超过20万人.
参考数据:≈158,≈161,≈164.
参考公式:相关系数r=,回归直线方程x+,其中.
解(1)根据题意,得(30+35+40+45+50)=40,(18+14+10+8+5)=11.
可列表如下
i | 1 | 2 | 3 | 4 | 5 |
xi- | -10 | -5 | 0 | 5 | 10 |
yi- | 7 | 3 | -1 | -3 | -6 |
(xi-)(yi-) | -70 | -15 | 0 | -15 | -60 |
根据表格和参考数据,得(xi-)(yi-)=-160,≈161.
因而相关系数r=≈-0.99.
由于|r|≈0.99很接近1,因而可以用线性回归方程模型拟合y与x的关系.
由于r<0,故其关系为负相关.
(2)①=-0.64,=11+0.64×40=36.6,
因而y关于x的回归方程为=-0.64x+36.6.
②由①知,若x=25,则=-0.64×25+36.6=20.6,故若将流量包的价格定为25元/月,可预测该市一个月内购买该流量包的人数会超过20万人.
素养培优练
(2020山东蒙阴实验中学高三期末)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,经统计得到如下数据:
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
y | 112 | 61 | 44.5 | 35 | 30.5 | 28 | 25 | 24 |
根据以上数据,绘制了散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+和指数函数模型y=cedx分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为=96.54e-0.2x,ln y与x的相关系数r1=-0.94.参考数据其中ui=:
uiyi | yi | e-2 | |||||
183.4 | 0.34 | 0.115 | 1.53 | 360 | 22 385.5 | 61.4 | 0.135 |
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由.
参考公式:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),其回归直线υ=α+βu的斜率和截距的最小二乘估计分别为,相关系数r=.
解(1)令u=,则y=a+可转化为y=a+bu,
因为=45,
所以=100,
则=45-100×0.34=11,
所以=11+100u,
所以y关于x的回归方程为=11+.
(2)y与的相关系数为
r2=
=≈0.99,
因为|r1|<|r2|,
所以用反比例函数模型拟合效果更好,
当x=10时,y=+11=21(元),
所以当产量为10千件时,每件产品的非原料成本为21元.
(3)(ⅰ)若产品单价为100元,记企业利润为X(千元),订单为9千件时,每件产品的成本为元,企业的利润为611(千元),
订单为10千件时,每件产品的成本为31元,企业的利润为690(千元),
企业利润X(千元)的分布列为
X | 611 | 690 |
P | 0.8 | 0.2 |
所以E(X)=611×0.8+690×0.2=626.8(千元).
(ⅱ)若产品单价为90元,记企业利润为Y(千元),
订单为10千件时,每件产品的成本为31元,企业的利润为590(千元),
订单为11千件时,每件产品的成本为元,企业的利润为659(千元),
企业利润Y(千元)的分布列为
Y | 590 | 659 |
P | 0.3 | 0.7 |
所以E(Y)=590×0.3+649×0.7=638.3(千元),
因为626.8<638.3,故企业要想获得更高利润,产品单价应选择90元.
数学4.3.1 一元线性回归模型课后练习题: 这是一份数学4.3.1 一元线性回归模型课后练习题,共6页。试卷主要包含了5B等内容,欢迎下载使用。
数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题: 这是一份数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题,共4页。试卷主要包含了3统计模型,54元 D,4X+2,[多选题]设某大学的女生体重Y等内容,欢迎下载使用。
2020-2021学年第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型第2课时精练: 这是一份2020-2021学年第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型第2课时精练,共7页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。