数学人教B版 (2019)4.3.1 一元线性回归模型精练
展开www.ks5u.com课时素养检测十七 一元线性回归模型
(20分钟 40分)
一、选择题(每小题5分,共20分,多选题全部选对得5分,选对但不全的得3分,有选错的得0分)
1.(多选题)下列选项中正确的是 ( )
A.回归直线方程=x+必经过(,)
B.相关系数r的绝对值越接近1,表明两个变量的线性相关性越强
C.标准差越大,表明样本数据越稳定
D.相关系数r>0,表明两个变量正相关,r<0,表明两个变量负相关
【解析】选ABD.因为回归直线方程必过样本中心点(,),所以A正确;线性相关系数r的绝对值越接近1时,两个随机变量线性相关性越强,因此B正确;标准差越大,数据的离散程度越大,越不稳定,故C错误;相关系数r>0,表明两个变量正相关,r<0,表明两个变量负相关,故D正确.
2.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到回归直线方程=1x+1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到回归直线方程:=2x+2,相关系数为r2.则
A.0<r1<r2<1 B.0<r2<r1<1
C.-1<r1<r2<0 D.-1<r2<r1<0
【解析】选D.由题干中散点图得负相关,
所以r1<0,r2<0,
因为剔除点(10,21)后,剩下数据更具有线性相关性,|r|更接近1,所以-1<r2<r1<0.
3.新中国成立70多年来,在中国共产党的领导下,全国各族人民团结一心,迎难而上,开拓进取,奋力前行,创造了一个又一个人类发展史上的伟大奇迹,中华民族迎来了从站起来、富起来到强起来的伟大飞跃.某公司统计了第x年(2013年是第一年)的经济效益为y(千万元),得到如下表格:
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | 4.5 |
若由表中数据得到y关于x的回归直线方程是=mx+0.35,则可预测2020年经济效益大约是 ( )
A.5.95千万元 B.5.25千万元
C.5.2千万元 D.5千万元
【解析】选A.由表格中的数据得==4.5,==3.5.
所以样本中心点的坐标为(4.5,3.5),代入=mx+0.35,得3.5=4.5m+0.35,解得m=0.7.
所以回归直线方程为=0.7x+0.35,取x=8,得=5.95.
4.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到回归直线方程=0.2x+3,则c,k的值分别是 ( )
A.e2,0.6 B.e2,0.3
C.e3,0.2 D.e4,0.6
【解析】选C.因为y=cekx,等式两边同时取对数可得ln y=ln(cekx)
=ln c+ln ekx=kx+ln c,
设z=ln y,则上式可化为z=kx+ln c,
因为z=0.2x+3,则k=0.2,ln c=3,
所以c=e3,k=0.2.
二、填空题(每小题5分,共10分)
5.已知x与y之间的一组数据:
x | 2 | 5 | 7 | 10 |
y | 1 | 3 | 5 | 7 |
则y与x的回归直线=x+必过点________.
【解析】由数据可知=(2+5+7+10)=6;=(1+3+5+7)=4,故回归直线必过点(6,4).
答案:(6,4)
6.某设备的使用年限x与所支出的维修费用y的统计数据如表:
使用年限x(单位:年) | 2 | 3 | 4 | 5 | 6 |
维修费用y(单位:万元) | 1.5 | 4.5 | 5.5 | 6.5 | 7.0 |
根据上表可得回归直线方程为=1.3x+,据此模型预测,若使用年限为14年,估计维修费约为________万元.
【解析】==4,
==5,
则样本中心点为(4,5),代入回归直线方程可得=5-1.3×4=-0.2,=1.3x-0.2.
当x=14时,=1.3×14-0.2=18(万元),
即使用14年时,估计维修费用是18万元.
答案:18
三、解答题
7.(10分)百年大计,教育为本.某校积极响应教育部号召,不断加大拔尖人才的培养力度,为清华、北大等排名前十的名校输送更多的人才.该校成立特长班进行专项培训.据统计有如下表格.(其中x表示通过自主招生获得降分资格的学生人数,y表示被清华、北大等名校录取的学生人数)
年份(届) | 2014 | 2015 | 2016 | 2017 | 2018 |
x | 41 | 49 | 55 | 57 | 63 |
y | 82 | 96 | 108 | 106 | 123 |
(1)通过画散点图发现x与y之间具有线性相关关系,求y关于x的回归直线方程;(保留两位有效数字)
(2)若已知该校2019年通过自主招生获得降分资格的学生人数为61人,预测2019年高考该校考入名校的人数;
(3)若从2014年和2018年考入名校的学生中采用分层抽样的方式抽取出5个人回校宣传,在选取的5个人中再选取2人进行演讲,求进行演讲的两人是2018年毕业的人数ξ的分布列和期望.
参考公式:=,=-;
参考数据:=53,=103,xiyi=27 797,=14 325.
【解析】(1)===≈1.79,=103-×53≈7.98,
所以回归直线方程为=1.79x+7.98.
(2)当x=61时,=1.79×61+7.98≈117,
所以预测2019年高考该校考入名校的人数约为117.
(3)从2014年和2018年考入名校的学生中分别选取2人和3人,进行演讲的两人中是2018年毕业的人数ξ的所有可能取值为0,1,2,P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,ξ的分布列为
ξ | 0 | 1 | 2 |
P |
E(ξ)=0×+1×+2×=.
(30分钟 60分)
一、选择题(每小题5分,共20分,多选题全部选对的得5分,选对但不全的得3分,有选错的得0分)
1.已知一组样本点(xi,yi),其中i=1,2,3,…,30.根据最小二乘法求得的回归直线方程是=x+,则下列说法正确的是( )
A.若所有样本点都在=x+上,则变量间的相关系数为1
B.至少有一个样本点落在回归直线=x+上
C.对所有的预报变量xi(i=1,2,3,…,30)对应的估计值xi+的值一定与yi有误差
D.若=x+斜率>0,则变量x与y正相关
【解析】选D.选项A:若所有样本点都在=x+上,则变量间的相关系数|r|=1,相关系数r=±1,故A错误.选项B:回归直线必过样本中心点,但样本点可能都不在回归直线上,故B错误.
选项C:样本点可能在直线=x+上,即可以存在预报变量xi对应的估计值xi+与yi没有误差,故C错误.
选项D:相关系数r与符号相同,若=x+斜率>0,则r>0,样本点分布从左至右上升,变量x与y正相关,故D正确.
2.已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 50 | 60 | 70 |
根据上表可得回归直线方程=x+,计算得=7,则当投入10万元广告费时,销售额的预报值为 ( )
A.75万元 B.85万元
C.99万元 D.105万元
【解析】选B.由题意得=(2+4+5+6+8)=5,=(30+40+50+60+70)=50,
所以样本中心点为(5,50).
因为回归直线过样本中心点(5,50),
所以50=7×5+,解得=15,
所以回归直线方程为=7x+15.当x=10时,=7×10+15=85,故当投入10万元广告费时,销售额的预报值为85万元.
3.(多选题)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(i=1,2,…,n),用最小二乘法建立的回归直线方程为=0.85x-85.71,则下列结论中正确的是 ( )
A.y与x具有正的线性相关关系
B.回归直线过样本中心点(,)
C.若该大学某女生身高增加2 cm,则其体重约增加1.70 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
【解析】选ABC.根据y与x的回归直线方程为=0.85x-85.71,其中0.85>0说明y与x具有正的线性相关关系,A正确;
回归直线过样本中心点(,),B正确;
由回归直线方程知,若该大学某女生身高增加1 cm,则其体重约增加0.85 kg,那么若该大学某女生身高增加2 cm,则其体重约增加1.70 kg,故C正确;
若该大学某女生身高为170 cm,
则可预测其体重为58.79 kg,不可断定其体重必为58.79 kg,D错误.
4.已知5个学生的数学和英语成绩如下表:
学生 | A | B | C | D | E |
数学 | 80 | 75 | 70 | 65 | 60 |
英语 | 70 | 66 | 68 | 64 | 62 |
则数学与英语成绩之间 ( )
A.是函数关系
B.是相关关系,但相关性很弱
C.具有较好的相关关系,且是正相关
D.具有较好的相关关系,且是负相关
【解析】选C.由题意,设数学成绩和英语成绩分别为x,y,画出散点图,如图所示,
从散点图上可以看出数学成绩和英语成绩具有较好的相关关系,且是正相关.
二、填空题(每小题5分,共20分)
5.用线性回归模型求得甲、乙、丙3组不同数据的线性相关系数分别为0.81,-0.98,0.63,其中________(填甲、乙、丙中的一个)组数据的线性相关性最强.
【解析】当数据的相关系数的绝对值越趋向于1,则相关性越强.
因为甲、乙、丙3组不同数据的线性相关系数分别为0.81,-0.98,0.63,
所以乙线性相关系数的绝对值最接近1,
所以乙组数据的线性相关性最强.
答案:乙
6.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下:
零件数x(个) | 10 | 20 | 30 | 40 | 50 |
加工时间y(分钟) | 64 | 69 | 75 | 82 | 90 |
由表中数据,求得回归直线方程=0.65x+,根据回归直线方程,预测加工70个零件所花费的时间为________分钟.
【解析】由题意可得==30,==76,由回归直线过样本点中心,
所以有76=0.65×30+,故=56.5,所以=0.65x+56.5;
当x=70时,=0.65×70+56.5=102.
答案:102
7.某公司调查了商品A的广告投入费用x(万元)与销售利润y(万元)的统计数据,如下表:
广告费用x(万元) | 2 | 3 | 5 | 6 |
销售利润y(万元) | 5 | 7 | 9 | 11 |
由表中的数据得回归直线方程为=x+,则当x=7时销售利润y的估值为________万元.
其中:=
【解析】由题表中数据可得:==4,==8,所以=
==1.4,
所以=-=8-1.4×4=2.4,
故回归直线方程为=1.4x+2.4,
所以当x=7时,=1.4×7+2.4=12.2.
答案:12.2
8.在研究两个变量的相关关系时,观察散点图,发现样本点集中于某一条曲线y=ebx+a的周围,令z=ln y,求得回归直线方程=0.25x-2.58,则该模型的回归方程为________ .
【解析】由回归直线方程=0.25x-2.58得:ln =0.25x-2.58,
整理得:=e0.25x-2.58,
所以该模型的回归方程为=e0.25x-2.58.
答案:=e0.25x-2.58
三、解答题(每小题10分,共20分)
9.某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:
月份代码t | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
销售量y(万件) | y1 | y2 | y3 | y4 | y5 | y6 | y7 |
但其中数据污损不清,经查证yi=9.32,tiyi=40.17,=0.55.
(1)请用相关系数说明销售量y与月份代码t有很强的线性相关关系;
(2)求y关于t的回归直线方程(系数精确到0.01);
(3)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:≈2.646,相关系数r=,当|r|>0.75时认为两个变量有很强的线性相关关系,回归直线=t+中斜率和截距的最小二乘估计公式分别为=,=-.
【解析】(1)由表中的数据和附注中的参考数据得=4,
=28,=0.55,
=tiyi-yi=40.17-4×9.32=2.89,
所以r=≈≈0.99,
因为0.99>0.75,所以销售量y与月份代码t有很强的线性相关关系.
(2)由=≈1.331及(1)得==≈0.103≈0.10,
=-=1.331-0.103×4≈0.92,
所以y关于t的回归直线方程为=0.10t+0.92.
(3)不能.当t=8时,代入回归直线方程得=0.10×8+0.92=1.72(万件),
第8个月的毛利润为z=10×1.72-≈14.372,
14.372<15,预测第8个月的毛利润不能突破15万元.
10.某农场经过观测得到水稻产量y和施化肥量x的统计数据如下:
施化肥量x | 15 | 20 | 25 | 30 | 35 | 40 | 45 |
水稻产量y | 330 | 345 | 365 | 405 | 445 | 450 | 455 |
求:(1)水稻产量y与施化肥量x的相关系数,并判断相关性的强弱;
(2)y关于x的回归直线方程.
附:①相关系数及线性回归直线方程系数公式:r=,
②参考数据:=7 000,=1 132 725,xiyi=87 175.
【解析】(1)==30,
==,
故r=
=
≈0.97,故具有很强的相关性.
(2)==
=4.75,
故=-4.75×30≈257,
故回归直线方程为=4.75x+257.
数学4.3.1 一元线性回归模型课后练习题: 这是一份数学4.3.1 一元线性回归模型课后练习题,共6页。试卷主要包含了5B等内容,欢迎下载使用。
数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题: 这是一份数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题,共4页。试卷主要包含了3统计模型,54元 D,4X+2,[多选题]设某大学的女生体重Y等内容,欢迎下载使用。
课时跟踪检测(十九) 一元线性回归模型及其应用: 这是一份课时跟踪检测(十九) 一元线性回归模型及其应用,共8页。试卷主要包含了已知x与y之间的一组数据,根据如表所示的样本数据,关于x与y有以下数据等内容,欢迎下载使用。