数学选择性必修 第三册8.2 一元线性回归模型及其应用优秀第2课时课时练习
展开【夯实基础】
题型1 线性回归分析
1.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:
由样本中样本数据求得回归直线方程为,则点与直线的位置关系是
A.B.
C.D.与的大小无法确定
【答案】B
【详解】分析:由样本数据可得,利用公式,求出b,a,点(a,b)代入x+18y,求出值与100比较即可得到选项.
详解:由题意,(15+16+18+19+22)=18,(102+98+115+115+120)=110,
,5=9900,=1650,n=5•324=1620,
∴b==3.1,
∴a=110﹣3.1×18=54.2,
∵点(a,b)代入x+18y,
∴54.2+18×3.1=110>100.
即a+18b>100.故答案为B
点睛:本题主要考查回归直线方程的求法,意在考查学生对该基础知识的掌握能力和运算能力.
2.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )
A.B.
C.D.
【答案】AC
【分析】根据线性回归模型的特点进行求解即可.
【详解】四个选项中只有选项AC中的点分布在一条直线附近,适合线性回归模型,
故选:AC
3.小明同学根据下表记录的产量(吨)与能耗(吨标准煤)对应的四组数据,用最小二乘法求出了关于的线性回归方程,据此模型预报产量为7万吨时能耗为( )
A.5B.5.25C.5.5D.5.75
【答案】B
【分析】由图表中的数据求出样本中心点的坐标,代入回归方程求出的值,再把预报产量代入求解即可.
【详解】由图表可知,.
所以样本中心点为.
把样本中心点代入,得,.
所以线性回归方程为.
则预报产量为7万吨时能耗为(万吨).
故选:.
【点睛】本题考查了最小二乘法,考查了线性回归方程,解答的关键是知道回归直线一定经过样本中心点,是基础题.
4.根据一组样本数据,,…,,求得经验回归方程为,且.现发现这组样本数据中有两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除两个误差较大的样本点后,重新求得的经验回归方程为
C.去除两个误差较大的样本点后,y的估计值增加速度变快
D.去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为0.05
【答案】A
【分析】对A:根据经验回归方程为,,即可求解;对B:由线性回归方程的性质,即可求解;对C:比较原线性回归方程的斜率和新回归方程的斜率,即可求解;对D:利用残差公式,即可求解.
【详解】解:对A:经验回归方程为,,
变量与具有正相关关系,故选项A正确;
对B:当时,,所以样本中心为,
去掉两个样本点为和,,,
样本中心不变,
去除后重新求得的经验回归直线的斜率为1.2,
,解得,
故去除两个误差较大的样本点后,重新求得的回归方程为,故选项B错误;
对C:,
去除两个误差较大的样本点后,的估计值增加速度变慢,故选项C错误;
对D:,
,
去除两个误差较大的样本点后,相应于样本点(2,3.75)的残差为,故选项D错误.
故选:A.
5.为研究变量的相关关系,收集得到如下数据:
若由最小二乘法求得关于的经验回归方程为,则据此计算残差为0的样本点是( )
A.B.C.D.
【答案】C
【分析】先求出回归方程的样本中心点,从而可求得,再根据残差的定义可判断.
【详解】由题意可得:,
即样本中心点为,可得,解得,
所以,可得
所以残差为0的样本点是.
故选:C.
题型2 残差分析与相关指数的应用
1.一组成对数据样本中心点为,由这组数据拟合的线性回归方程为,用最小二乘法求回归方程是为了使( )最小.
A.总偏差平方和B.残差平方和
C.回归平方和D.竖直距离和
【答案】B
【分析】使用最小二乘法的定义进行求解.
【详解】最小二乘法求回归方程,是为了使残差平方和最小,B正确;其他选项错误.
故选:B
2.下列说法正确的是( )
①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②已知随机变量,若,则;
③在线性回归模型中,计算,则可以理解为解释变量对预报变量的贡献率约为;
④在残差图中,残差点分布的带状区域的宽带越窄,其模型拟合精度越高.
A.①②③B.②③④C.②④D.①②③④
【答案】B
【解析】根据相关性定义和基本统计,概率知识进行判断即可.
【详解】①错,越大,线性相关性越强;
,,②正确;
根据定义可知③④对.
故选:B
3.下列说法错误的是( )
A.在回归分析中,回归直线始终过样本点( x1,y1 ),( x2,y2 ),…,( xn,yn ) 的中心()
B.若两个具有线性相关关系的变量的相关性越强,则线性相关系数r的值越接近于0
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,相关指数R2越接近于1,说明回归的效果越好
【答案】B
【分析】根据回归直线方程及回归分析的相关知识判断即可;
【详解】解:回归直线一定经过样本点的中心,故对;
若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1或,错;
在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故对;
在线性回归模型中,相关指数越接近于1,说明回归的效果越好,故对,
故选:B.
【点睛】本题考查回归方程的性质,属于基础题.
4.有如下几个结论: ①相关指数R2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:,一定过样本点的中心:③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个.
A.1B.2C.3D.4
【答案】D
【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真.
【详解】相关指数R2越大,则残差平方和越小,模型的拟合效果越好;
回归直线方程:,一定过点;
若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适;
在独立性检验中,若公式,中的|ad-bc|的值越大,则越大, “两个分类变量有关系”的可能性越强.选D.
【点睛】相关指数R2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若回归直线方程:,一定过点.
5.在一组样本数据,,…,(,,…不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为
A.-3B.0C.-1D.1
【答案】C
【详解】因为所有样本点都在直线上,所以回归直线方程是,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点,都在直线上,则有相关系数,故选C.
题型3 非线性回归分析
1.杂交水稻之父袁隆平,推进粮食安全,消除贫困,造福民生做出杰出贡献,他在杂交水稻育种的某试验中,第1个周期到第5个周期育种频数如下
由表格可得关于的二次回归方程为,则此回归模型第2周期的残差(实际值与预报值之差)为( )
A.0B.1C.4D.5
【答案】B
【分析】令则回归方程为,符合线性回归,计算中心点代入方程求得,继而得到回归方程,算出预估值,即可求出残差.
【详解】令则回归方程为,符合线性回归,
周期数的平均数,
频数的平均数,
则中心点为,代入,
可得,则,
所以,
当时的预估值为,
则第2周期的残差为,
故选:B.
2.已知变量关于的回归方程为,若对两边取自然对数,可以发现与线性相关,现有一组数据如下表所示:
则当时,预测的值为( )
A.9B.8C.D.
【答案】C
【分析】对两边取对数,得 ,令则,利用样本中心点在函数图象上即得,进而确定解析式,求出预测值.
【详解】对两边取对数,得,令,则.
,,
代入得故.
故,.
当时,.
故选:C.
3.若一函数模型为,将转化为的线性回归方程,需做变换=
A.B.C.D.以上都不对
【答案】C
【分析】先对二次函数进行配方,然后根据线性回归方程是一次函数,从而可知需做变换使之成为一次函数,从而得到结论.
【详解】
根据线性回归方程是一次函数可知
令则为的线性回归方程,
故选:C
4.给出下列命题中,其中正确的命题是( )
A.随机变量,则
B.已知,,则
C.随机变量,若,则,
D.以模型拟合一组数据时,为了求回归方程,设,将其变换后得到线性方程,则,的值分别是和0.2.
【答案】AC
【分析】A选项,根据二项分布的均值公式易判断;B选项,根据条件概率的计算公式可判断;C选项,根据正态分布的概念以及随机变量间均值方差公式易判断;D选项,代入运算对比可判断.
【详解】A选项,,,故A正确;
B选项,由条件概率的计算公式,,
故B错误;
C选项,,,,又
,,,故C正确;
D选项,,又,
,即,,故D错误.
故选:AC.
5.2020年东京奥运会于北京时间2021年7月23日到8月8日在东京奥林匹克体育场举行.某公司为推销某种运动饮料,拟在奥运会期间进行广告宣传,经市场调查,广告支出费用x(单位:万元)与销售量y(单位:万件)的数据如下表所示:
根据表中的数据可得y关于x的回归直线方程为,则下列说法正确的是( )
A.
B.相应于点的残差为0.16
C.当广告支出费用为7万元时,销售量约为15.32万件
D.回归直线经过点
【答案】ABC
【分析】A:回归直线经过样本点的中心(,);
B:残差为实际值减去用回归方程算出来的值:,=10.6,;
C:将x=7代入可得;
D:将x=6代入验算是否等于13.4.
【详解】由表可知,,,将代入回归直线方程,得,解得,选项A正确;
相应于点的残差,选项B正确;
广告支出费用为7万元时,销售量约为(万件),选项C正确;
∵,∴回归直线不经过点,选项D错误.
故选:ABC.
【能力提升】
单选题
1.已知与之间的一组数据:则与的线性回归方程必过( )
A.B.C.D.
【答案】C
【分析】根据回归直线必过样本中心点求解即可.
【详解】根据表格数据得:,,
根据回归直线必过样本中心点,
所以与的线性回归方程必过.
故选:C
【点睛】回归直线必过样本中心点是解决本题的关键,需要熟记.
2.最小二乘法的原理是( ).
A.使得最小B.使得最小
C.使得最小D.使得最小
【答案】C
【分析】由最小二乘法的原理即可判断.
【详解】解:因为最小二乘法的原理是使样本数据的点到回归直线的距离的平方和最小,即使得最小,
故选:C.
3.下列说法正确的是
A.在统计学中,回归分析是检验两个分类变量是否有关系的一种统计方法
B.线性回归方程对应的直线至少经过其样本数据点中的,,
一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,相关指数为的模型比相关指数为的模型拟合的效果差
【答案】C
【详解】分析:首先对每个选项一一进行分析,需要明确独立性检验是检验两个分类变量是否有关系的一种统计方法,回归直线可能不过任何一个样本数据点,残差图中,残差点分布的带状区域的宽度越狭窄,其模拟精度越高,相关指数越大,拟合效果越好的结论,就可以正确选出结果.
详解:对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,所以A错;
对于B,线性回归方程对应的直线可能不过任何一个样本数据点,所以B错误;
对于C,残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高,所以C正确;
对于D,回归分析中,相关指数为的模型比相关指数为的模型拟合的效果好,所以D错误.
故选C.
点睛:根据概率统计中变量间的相关关系,线性回归方程以及残差图与相关指数的概念,对选项中的命题进行分析、判断正误即可.
4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
用水量与月份之间有较好的线性相关关系,其线性回归方程是,则等于( )
A.B.C.D.
【答案】D
【分析】根据由于回归直线必经过点可求.
【详解】由于回归直线必经过点,而,,
,∴.
故选:D.
5.节能降耗是企业的生存之本,树立一种“点点滴滴降成本,分分秒秒增效益”的节能意识,以最好的管理,来实现节能效益的最大化,为此某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:
预测第10年该国企的生产利润约为( )
(参考公式)
A.1.85B.2.02C.2.19D.2.36
【答案】C
【分析】根据已知数据求得,可得线性回归方程,再令即可得解.
【详解】,
则,
,
故,
,
所以国企的生产利润与年份的回归方程为,
当时,,
即预测第10年该国企的生产利润约为.
故选:C.
6.“关注夕阳,爱老敬老”,某商会从2016年开始向晚晴山庄养老院捐赠物资和现金.下表记录了第年(2016年为第一年)捐赠现金(万元)的数据情况.由表中数据得到了关于的线性回归方程为,预测2021年该商会捐赠现金( )万元.
A.B.C.D.
【答案】D
【分析】先求得的值,令求得预测值.
【详解】,
所以,
所以,
当时,(万元).
故选:D
7.某同学用收集到的6组数据对制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为,相关系数为r.现给出以下3个结论:
① ;
②直线l恰好过点D;
③;
其中正确结论是( )
A.①②B.①③C.②③D.①②③
【答案】A
【分析】根据散点图斜率是正,则相关系数为正.根据回归直线必过样本中心和 ,通过计算即可得出答案.
【详解】对于①,结合图像知,从左到右各点是上升排列的,是正相关,,故①正确;
对于②, ,
则直线过点 ,故②正确;
对于③,
故③错误;
综上所述:正确的有①②.
故选:A.
【点睛】本题主要考查了线性回归直线方程的相关知识,其中解答中熟记线性回归直线方程的基本特征是解答的关键.
8.广告投入对商品的销售额有较大影响,某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如下表(单位:万元)
由上表可得回归方程为,据此模型, 预测广告费为10万元时销售额约为
A.118.2万元B.111.2万元C.108.8万元D.101.2万元
【答案】B
【详解】分析:平均数公式可求出与的值,从而可得样本中心点的坐标,代入回归方程求出,再将代入回归方程得出结论.
详解:由表格中数据可得,,
,解得,
回归方程为,
当时,,
即预测广告费为10万元时销售额约为,故选B.
点睛:本题考查了线性回归方程的性质与数值估计,属于基础题. 回归直线过样本点中心是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.
多选题
9.经研究,变量与变量具有线性相关关系,数据统计如下表,并且根据表中数据,求得关于的线性回归方程为,下列正确的是( )
A.变量与呈正相关B.样本点的中心为
C.D.当时,的估计值为13.2
【答案】AB
【分析】根据样本中心即可求解,由此即可代入求解.
【详解】由于
所以样本中心为,将其代入得,
故,当时,,
故AB正确,CD错误,
故选:AB
10.下列关于成对样本数据的统计分析的判断中正确的有( )
A.若样本相关系数,则说明成对样本数据没有相关性
B.样本相关系数r越大,成对样本数据的线性相关性越强
C.用最小二乘法求得的一元线性回归模型的残差和一定是0
D.决定系数越大,残差平方和越小,模型的拟合效果越好
【答案】CD
【分析】根据样本相关系数判断A和B,根据一元线性回归模型的最小二乘估计判断C和D.
【详解】对于选项A:当时,只表明成对样本数据间没有线性相关关系,但是不排除它们之间有其他相关关系. 故A错误;
对于选项B:样本相关系数越大,成对样本数据的线性相关性越强. 故B错误;
对于选项C:残差和为. 故C正确;
对于选项D:决定系数越大,表示残差平方和越小,即模型的拟合效果越好. 故D正确.
故选:CD.
11.5G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.目前,我国加速了5G技术的融合与创新,前景美好!某手机商城统计了5个月的5G手机销量,如下表所示:
若y与x线性相关,由上表数据求得线性回归方程为,则下列说法正确的是( )
A.a=152
B.5G手机的销量逐月增加,平均每个月增加约30台
C.y与x正相关
D.预计12月份该手机商城的5G手机销量约为318部
【答案】CD
【分析】求出样本中心点坐标,代入回归方程中可求出的值,可判断A,由回归方程可判BC,把代入回归方程中可求出的值,判断D
【详解】由表中数据可知,
又因为回归方程为,
代入回归方程,解得,
所以,
得a=151,所以A错误
由此知5G手机的销量逐月增加,平均每个月增加约40台左右,所以B错误,
将x=7代入回归方程得,所以D正确
因为44>0,所以y与x正相关,所以C正确
故选:CD
12.已知与之间的几组数据如下表:
假设根据上表数据所得线性回归直线方程为,若某同学根据上表中的前两组数据和求得的直线方程为,则以下结论正确的是( )
参考公式,.
A.B.C.D.
【答案】ABD
【解析】根据题意,结合回归方程的公式计算相关数据比较大小即可得答案.
【详解】解:因为某同学根据上表中的前两组数据和求得的直线方程为,
所以,
根据题意得:,,
,,
所以,,
所以,.
故选:ABD.
【点睛】本题考查线性回归方程的求解,考查运算求解能力,是中档题.解题的关键在于熟练应用,进行运算求解,同时熟记回归直线必过样本中心点.
填空题
13.某种细胞的存活率与存放温度之间具有线性相关关系,其样本数据如下表所示:
计算得,,,,并求得回归直线为.但实验人员发现表中数据的对应值录入有误,更正为.则更正后的回归直线方程为 .
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
【答案】
【分析】由已知分别求出更正后的、、,的值,然后利用最小二乘法公式可求回归直线方程.
【详解】由题意,更正后,,,
,,
,,
因此,更正后的回归直线方程为.
故答案为:.
【点睛】本题考查回归方程的求法,考查最小二乘法公式的应用,考查计算能力,是基础题.
14.为了建设社会主义新农村,近年来某城关镇积极招商引资,加快经济建设,使居民收入得到了较大的提高.已知该城关镇2016年至2020年(用,2,3,4,5表示年份)的居民人均收入y(万元)的数据如下表:
由此得到y关于x的经验回归方程为,则可以预测2021年该城关镇居民人均收入为 万元.
【答案】35.6
【分析】计算出样本中心点,代入方程中,求出,从而求出时,,得到答案.
【详解】因为,,所以,解得,
所以当时,,故可以预测2021年该城关镇居民人均收入为35.6万元.
故答案为:35.6.
15.已知回归直线的斜率估计值为1,样本点的中心为,则回归直线的方程为:
【答案】
【分析】由已知斜率估计值及样本中心在回归直线上求参数,即可得回归直线方程.
【详解】设回归直线方程为,斜率估计值为1,则;
样本点中心为,则,可得,
所以直线方程为.
故答案为:
16.某单位为了了解用电量y度与气温之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表
由表中数据得回归直线方程中,预测当气温为时,用电量约为 度.
【答案】69.4
【分析】由题意求,,根据回归直线方程过样本中心,代入求解得,再把代入回归直线方程运算求解.
【详解】根据题意得:气温的平均数(℃),用电量的平均数(度)
∵回归直线方程过样本中心,即,则
∴
当时,则
故答案为:69.4.
解答题
17.某销售公司通过市场调查,得到某种商品的广告费x(万元)与销售收入y(万元)之间的数据如下:
(1)求销售收入y关于广告费x的线性回归方程;
(2)当广告费为6万元时,估计该销售公司的销售收入约为多少万元?
参考公式:,
【答案】(1);(2)58.2万元.
【分析】(1)对照参考公式算出每一个量即可;
(2)将代入(1)中的线性回归方程即可算出.
【详解】解:(1),,
,
.
故销售收入y关于广告费x的线性回归方程为
(2)当时,
所以,当广告费为6万元时,估计销售收入为58.2万元.
18.电动化是汽车工业未来发展的大趋势,在国家的节能减排、排放法规等硬性要求之下,新能源汽车乘势而起,来自中国汽车工业协会的统计数据显示,2018年新能源汽车累计销量已经超过100万台,意味着我国的新能源汽车市场的正式兴起.某人计划购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到2018年1月到5月的实际销量如下表:
(1)经分析发现,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(辆)与月份x之间的相关关系.请用最小二乘法求y关于x的线性回归方程,并据此预测2018年10月份当地该品牌新能源汽车的销量;
(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程对购车补贴进行新一轮调整.如图为2018年执行的补贴政策.
已知该品牌的新能源汽车的最大续航里程不小于250 km,某地的月销量为3 000辆,其中50%最大续航里程在[250,300)内.问购车补贴能否达到12000万元?如果不能,请说明理由;如果能,请求出最大续航里程在[300,400)内的销售量范围.
参考公式:回归方程,其中,参考数据.
【答案】(1);3280辆;(2)当最大续航里程在[300,400)内的销售量不高于1200辆时,购车补贴能达到12000万元.
【解析】(1)利用回归直线的方程求出,即可.
(2)求出购车补贴后解不等式.
【详解】(1) ,,,
所以,,
所以y关于x的线性回归方程为,
当时,,
所以预测2018年10月份当地该品牌新能源汽车的销量约为3280辆.
(2) 设最大续航里程在内的新能源汽车销售辆,则购车补贴
.
由,即,解得,所以.
故当最大续航里程在[300,400)内的销售量不高于1200辆时,购车补贴能达到12000万元.
19.某单位为了了解用电量y度与气温之间的关系随机统计了某4天的用电量与当天气温
(1)求用电量y与气温x的线性回归方程;
(2)由(1)的方程预测气温为时,用电量的度数.
参考公式:
【答案】(1);(2)当气温是时,预计用电量是40度.
【分析】(1)根据题中已给的公式,代入数据就可以运算求解得,即可得线性回归方程;(2)在(1)中求出回归方程,取x=5代入回归方程即可得到预测值.
【详解】由题意值样本值n=4,则
,
所以线性回归方程为.
(2)预测气温为时,令(1)中的回归方程中x=5,代入方程得到
所以当气温是时,预计用电量是40度.
20.为得到某种作物种子的发芽率,立德中学生物兴趣小组的同学进行了如下研究:在不同的昼夜温差下统计每100颗种子的发芽数,得到了以下数据:
通过画散点图,同学们认为x和y之间存在线性相关关系,经讨论大家制定了如下规则:从这5组数据中选取3组数据求线性回归方程,再用剩下的2组数据进行检验,检验方法如下:用求得的线性回归方程分别计算剩余两组数据中昼夜温差数所对应的发芽数,再求与实际发芽数y的差值,若差值的绝对值都不超过2,则认为所求方程是“合适的回归方程”.
(1)请根据表中的后三组数据,求y关于x的线性回归方程;
(2)按照题目中的检验方法判断(1)中得到的方程是否是“合适的回归方程”;
(3)若100颗该作物种子的发芽率为n颗,则记为的发芽率,当发芽率为时,农户种植该种作物平均每亩地的收益为元,某农户有10亩土地,全部种植这种植物,种植期间昼夜温差大约为9℃,根据(1)中得到的线性回归方程估计该农户种植此种作物所获得的收益.(参考公式:线性回归方程中,的最小二乘估计分别为:.)
【答案】(1);(2)是;(3)7950元.
【解析】(1)先进行数据处理:每个温差值减去12,每个发芽数减去86,得到新的数据表格,求出的值,最后求出关于的线性回归方程;
(2)根据线回归方程,分别计算当时,当时,它们的估计值,然后判断(1)中得到的线性回归方程是否可靠;
(3)当时,根据线性回归方程计算出的值,然后计算出发芽率以及收益.
【详解】解:(1),
∴
∴
∴线性回归方程为
(2)当时,,;
当时,,;
所以(1)中得到的线性回归方程是“合适的回归方程”.
(3)因为,所以当时,,即每亩地的收益大约为795元,所以该农户此种作物所获得的收益大约为7950元
【点睛】本题考查了求线性回归方程,以及用数据检验线性回归方程是否可靠,考查了应用线性回归方程估计收益问题,考查了数学应用能力.
21.受社会对高素质人才不断扩大的需求和就业形势等多方面因素的影响,我国本科毕业生中考研人数在不断攀升,2021年考研人数是377万人,2022年考研人数为457万人,比上年增加80万人,有关机构估计2023年研究生报名人数将突破500万人.某省统计了该省五所大学2022年的本(专)科大学毕业生人数及考研人数(单位:千人),得到如下表格:
(1)已知与具有较强的线性相关关系,求关于的线性回归方程;
(2)假设该省对选择考研的大学生每人发放0.6万元的补贴.若A大学的2022年的毕业生中小常、小郭选择考研的概率分别为p、,该省对小常、小郭两人的考研补贴总金额的期望不超过0.96万元,求p的取值范围.
参考公式:,.
【答案】(1)
(2)
【分析】(1)根据回归方程的公式计算即可得答案;
(2)设小常、小郭两人中选择考研的人数为,补贴为万元,则,进而计算其数学期望,解不等式即可得答案.
【详解】(1)解:由题意得,
,
又,
,
所以,,
所以,
所以,
故得y关于x的线性回归方程为.
(2)解:设小常、小郭两人中选择考研的人数为,则的可能值为0、1、2,
,
,
,
所以.
设补贴为万元,则,
所以,
所以,
又因为,解得,
所以,p的取值范围为.
22.《环境空气质量指标()技术规定(试行)》如表1:
表1:空气质量指标分组表
表2是某市某气象观测点在某连续天里的记录,指数与当天的空气水平可见度()的情况.
表2:空气质量指标分组表
表3是某气象观测点记录的该市年月日至月日指数频数统计表.
表3:
(1)设,根据表2的数据,求出关于的回归方程;
(2)小李在该市开了一家小洗车店,经小李统计:指数不高于时,洗车店平均每天亏损约元;指数在至时,洗车店平均每天收入约元;指数大于时,洗车店平均每天收入约元.计算小李的洗车店在当年月份每天收入的数学期望.
(用最小二乘法求线性回归方程系数公式,)
【答案】(1);(2)550元.
【解析】(1)根据题意,分别求得,将数据代入公式,即可求得,代入公式,即可求得,即可得答案;
(2)设“洗车店每天亏损约元”为事件,“洗车店每天收入约元”为事件,“洗车店每天收入约元”为事件,由表3可可得,列出分布列,根据期望公式,即可求得答案.
【详解】(1),,
,
,
所以关于的回归方程是;
(2)由表3知指数不高于的频率为,指数在至的频率为,指数大于的频率为,
设“洗车店每天亏损约元”为事件,“洗车店每天收入约元”为事件,“洗车店每天收入约元”为事件,
则、、,
设洗车店每天收入为元,则的分布列为:
则的数学期望(元).
产量(吨)
3
4
5
6
能耗(吨标准煤)
2.5
3
4
4.5
5
6
7
8
9
9
8
6
4
3
5
6
7
8
9
9
8
6
4
3
9.2
7.6
6
4.4
2.8
0
周期数(x)
1
2
3
4
5
频数(y)
2
17
36
93
142
1
2
3
4
5
x
1
2
3
4
5
y
e
z
1
3
4
6
7
广告支出费用x
2
3
4
5
6
销售量y
4
5
7
10.6
13.4
月份
用水量
年号
1
2
3
4
5
年生产利润y(单位千万元)
0.7
0.8
1
1.1
1.4
广告费
2
3
4
5
6
销售额
29
41
50
59
71
2
4
7
10
15
22
8.4
9.1
10
14.5
18.4
26
月份
2020年6月
2020年7月
2020年8月
2020年9月
2020年10月
月份编号x
1
2
3
4
5
销量y(部)
52
95
a
185
227
x
1
2
3
4
5
6
y
0
2
1
3
3
4
存放温度
存活率
x
1
2
3
4
5
y
12
15
19
24
30
气温(℃)
18
13
10
-1
用电量(度)
24
34
38
64
广告费x(万元)
1
2
4
5
销售收入y(万元)
10
22
40
48
月份(x)
1
2
3
4
5
销量(y,单位:辆)
500
600
1 000
1 400
1 700
最大续航里程R(单位:km)
补贴金额(单位:万元)
150≤R<200
1.50
200≤R<250
2.40
250≤R<300
3.40
300≤R<400
4.50
R≥400
5.00
气温()
14
12
8
6
用电量(度)
22
26
34
38
昼夜温差x(℃)
8
10
11
12
13
发芽数y(颗)
79
81
85
86
90
A大学
B大学
C大学
D大学
E大学
2022年毕业人数x(千人)
7.8
6.2
4.6
3.4
3
2022年考研人数y(千人)
0.5
0.4
0.3
0.2
0.2
级别
Ⅰ级
Ⅱ级
Ⅲ级
Ⅳ级
Ⅴ级
Ⅵ级
类别
优
良
轻度污染
中度污染
重度污染
严重污染
指数
空气水平可见度(千米)
指数
频数
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀综合训练题: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">8.2 一元线性回归模型及其应用优秀综合训练题</a>,文件包含人教A版高中数学选择性必修三同步讲义第20讲82一元线性回归模型及其应用821一元线性回归模型+822一元线性回归模型参数的最小二乘法估计原卷版doc、人教A版高中数学选择性必修三同步讲义第20讲82一元线性回归模型及其应用821一元线性回归模型+822一元线性回归模型参数的最小二乘法估计教师版doc等2份试卷配套教学资源,其中试卷共64页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用课堂检测: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">第八章 成对数据的统计分析8.2 一元线性回归模型及其应用课堂检测</a>,共8页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用第1课时课后练习题: 这是一份高中数学人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000364_t7/?tag_id=28" target="_blank">8.2 一元线性回归模型及其应用第1课时课后练习题</a>,共7页。试卷主要包含了随机误差的主要来源有,已知x与y之间的一组数据等内容,欢迎下载使用。