所属成套资源:2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019)
- 专题12 四大分布:两点分布、超几何分布、二项分布、正态分布——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019) 学案 0 次下载
- 专题13 概率综合问题——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019) 学案 0 次下载
- 专题15 独立性检验——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019).1 学案 0 次下载
- 期末模拟卷01——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019) 学案 3 次下载
- 期末模拟卷02——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019) 学案 2 次下载
专题14 线性回归直线与非线性回归直线方程——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019).1
展开
这是一份专题14 线性回归直线与非线性回归直线方程——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019).1,文件包含专题14线性回归直线与非线性回归直线方程解析版docx、专题14线性回归直线与非线性回归直线方程原卷版docx等2份学案配套教学资源,其中学案共54页, 欢迎下载使用。
专题14 线性回归直线与非线性回归直线方程
【考点预测】
1、两个变量线性相关
(1)散点图:将样本中个数据点(i=1,2,…,)描在平面直角坐标系中得到的图形.
(2)正相关与负相关
①正相关:散点图中的点散布在从左下角到右上角的区域.
②负相关:散点图中的点散布在从左上角到右下角的区域.
2、回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.
(3)回归方程的推导过程:
①假设已经得到两个具有线性相关关系的变量的一组数据,,.
②设所求回归方程为,其中是待定参数.
③由最小二乘法得
其中,是回归方程的斜率,是截距.
3、当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:
曲线方程
变换公式
变换后的线性关系式
建立非线性经验回归模型的基本步骤
(1)确定研究对象,明确哪个是解释变量,哪个是响应变量;
(2)由经验确定非线性经验回归方程的模型;
(3)通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);
(4)按照公式计算经验回归方程中的参数,得到经验回归方程;
(5)消去新元,得到非线性经验回归方程;
(6)得出结果后分析残差图是否有异常 .
【典型例题】
例1.(2023·安徽滁州·高二统考期末)下列命题中正确的为( )
散点图可以直观的判断两个变量是否具有线性相关关系;
经验回归直线就是散点图中经过样本数据点最多的那条直线;
线性相关系数的绝对值越接近于,表明两个变量线性相关性越弱;
同一组样本数据中,决定系数越大的模型拟合效果越好
A. B. C. D.
【答案】C
【解析】对于,散点图可以直观的判断两个变量是否具有线性相关关系,故正确;
对于,回归直线也可能不过任何一个点,故错误;
对于,线性相关系数的绝对值越接近于,表明两个变量线性相关性越强,故错误;
对于,同一组样本数据中,决定系数越大的模型拟合效果越好,故正确.
故选:C.
例2.(2023·黑龙江双鸭山·高二双鸭山一中校考期末)已知数据的三对观测值为,用“最小二乘法”判断下列直线的拟合程度,则效果最好的是( )
A. B. C. D.
【答案】A
【解析】当拟合直线为时,预报值与实际值的差的平方和,
当拟合直线为时,预报值与实际值的差的平方和,
当拟合直线为时,预报值与实际值的差的平方和,
当拟合直线为时,预报值与实际值的差的平方和,
故最小,即效果最好的是.
故选:A.
例3.(2023·山东青岛·高二校考期中)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图. 对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
【答案】D
【解析】根据一元线性回归模型中对随机误差的假定,残差应是均值为、方差为的随机变量的观测值.
对于A选项,残差与有线性关系,故A错误;
对于B选项,残差的方差不是一个常数,随着观测时间变大而变小,故B错;
对于C选项,残差与有非线性关系,故C错;
对于D选项,残差比较均匀地分布在以取值为的横轴为对称轴的水平带状区域内,故D正确.
故选:D.
例4.(2023·山东滨州·高二统考期中)有一散点图如图所示,在5个数据 中去掉后,下列说法正确的是( )
A.相关系数r变小 B.残差平方和变小
C.变量x,y负相关 D.解释变量x与预报变量y的相关性变弱
【答案】B
【解析】对于A, 去掉后,相关性变强,相关系数r变大,
对于B,残差平方和变小,故B正确,
对于C,散点的分布是从左下到右上,故变量x,y正相关,故C错误,
对于D,解释变量x与预报变量y的相关性变强,故D错误,
故选:B
例5.(2023·江西抚州·高二金溪一中校联考期中)在两个变量与的回归模型中,分别选择了4个不同的模型,它们的样本相关系数如表所示,其中线性相关性最强的模型是( )
模型
模型1
模型2
模型3
模型4
相关系数
0.48
0.15
0.96
0.30
A.模型1 B.模型2 C.模型3 D.模型4
【答案】C
【解析】样本相关系数的绝对值越接近1,说明与的线性相关性越强.
故选:C.
例6.(2023·陕西渭南·高二统考期末)2021年2月25日,中国自豪地向全世界宣布已经消除绝对贫困.在现行标准下,9899万农村贫困人口全部脱贫,832个贫困县全部摘帽,12.8万个贫困村全部出列,区域性整体贫困得到解决,完成了消除绝对贫困的艰巨任务.某地区2014年至2020年农村居民家庭人均纯收入(单位:千元)的数据如下表:
年份
2014
2015
2016
2017
2018
2019
2020
年份代号
1
2
3
4
5
6
7
人均纯收入
6.9
7.3
7.6
8.4
8.8
9.2
9.9
(1)通过绘制散点图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;(结果保留2位小数)
(2)求关于的线性回归方程;
(3)利用(2)中的回归方程,预测该地区2023年农村居民家庭人均纯收入.
附:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为,.
参考数据:,,.
【解析】(1),
则,
所以,
由于相关系数非常接近于1,故可用线性回归模型拟合与的关系;
(2),
,
,
故线性回归方程为:
(3)2023年,即当时,(千元),
故预测该地区2023年农村居民家庭人均纯收入为千元.
例7.(2023·陕西渭南·高二统考期末)某高中生参加社会实践活动,对某公司1月份至5月份销售的某种配件的销售量及销售单价进行了调查,销售单价和销售量之间的一组数据如下表所示:
月份
1
2
3
4
5
销售单价元
9
9.5
10
10.5
11
销售量件
11
10
8
6
5
(1)由上表数据知,可用线性回归模型拟合与的关系,请用相关系数加以说明;(精确到0.01)
(2)求出关于的线性回归方程;
(3)预计在今后的销售中,销售量与销售单价仍然服从(2)中的关系,如果该种配件的成本是2.5元/件,那么该种配件的销售单价应定为多少元才能获得最大利润?(注:利润销售收入成本)
参考公式:相关系数,线性回归方程的斜率和截距的最小二乘法估计分别为.
参考数据:
【解析】(1) ,,,
由于与的相关系数近似为,说明与的线性相关程度相当高,
从而可以用线性回归模型拟合与的关系.
(2),,
又,,
关于的线性回归方程为.
(3)设销售利润为,则,
整理得,
所以当时,故该配件的销售单价应定为元才能获得最大利润.
例8.(2023·重庆沙坪坝·高二重庆八中校考期末)有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
【解析】(1)令,设,
由条件知,,
所以,
,从而,
故所求的回归方程为.
所以,估计当时,,即抽取轮才“成功”的人数约为人.
(2)由条件知,游戏要进行三轮,即前两轮均失败.
设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立.
因为,,
所以,前两轮均失败的概率为.
故游戏要进行三轮的概率为.
例9.(2023·吉林·高二吉林一中校考期中)根据党的“扶贫同扶志、扶智相结合”精准扶贫、精准脱贫政策,中国儿童少年基金会为了丰富留守儿童的课余文化生活,培养良好的阅读习惯,在农村留守儿童聚居地区捐建“小候鸟爱心图书角”.2016年某村在寒假和暑假组织开展“小候鸟爱心图书角读书活动”,号召全村少年儿童积极读书,养成良好的阅读习惯,下表是对2016年以来近5年该村庄100位少年儿童的假期周人均读书时间的统计:
年份
2016
2017
2018
2019
2020
年份代码
1
2
3
4
5
每周人均读书时间(小时)
1.3
2.8
5.7
8.9
13.8
现要建立关于的回归方程,有两个不同回归模型可以选择,模型一:;模型二:,即使画出关于的散点图,也无法确定哪个模型拟合效果更好,现用最小二乘法原理,已经求得模型一的方程为.
(1)请你用最小二乘法原理,结合下面的参考数据及参考公式求出模型二的方程(计算结果保留到小数点后一位);
(2)用计算残差平方和的方法比较哪个模型拟合效果更好,已经计算出模型一的残差平方和为.
附:参考数据:,其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计公式分别为,.
【解析】(1)令,则模型二可化为关于的线性回归问题,则
,,
则由参考数据可得,
,
则模型二的方程为;
(2)由模型二的回归方程可得,,
,,,
,
∴,
故模型二的拟合效果更好.
例10.(2023·浙江宁波·高二宁波市北仑中学校考期中)经观测,某种昆虫的产卵数y与温度x有关,现将收集到的温度和产卵数()的10组观测数据作了初步处理,得到如下图的散点图及一些统计量表.
275
731.1
21.7
150
2368.36
30
表中,.
(1)根据散点图判断,,与哪一个适宜作为y与x之间的回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,试求y关于x的回归方程.
【解析】(1)适宜作为y与x之间的回归方程模型;
理由如下:
回归方程模型适用于散点图呈直线型;
回归方程模型适用于散点图上升,且上升趋势越来越慢;
回归方程模型适用于散点图上升,且上升趋势越来越快,呈指数型变化;
根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为y与x之间的回归方程模型.
(2)令,则,
由表中数据可得,;
,∴;
∴y关于x的回归方程为.
例11.(2023·福建三明·高二统考期末)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长. 已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
年份(年)
2014
2015
2016
2017
2018
2019
2020
2021
年份代码x
1
2
3
4
5
6
7
8
保有量y/千辆
1.95
2.92
4.38
6.58
9.87
15.00
22.50
33.70
参考数据:,,其中
(1)根据统计表中的数据画出散点图(如图),请判断与哪一个更适合作为y关于x的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的经验回归方程:
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考公式:对于一组数据,v1),),…,,其经验回归直线的斜率和截距的最小二乘估计公式分别为,;
【解析】(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是,令,则
因为,
所以,,
,所以;
(2)设传统能源汽车保有量每年下降的百分比为r,依题意得,),解得,设从2021年底起经过x年后的传统能源汽车保有量为y千辆,则有x,设从2021年底起经过x年后新能源汽车的数量将超过传统能源汽车,则有
,所以,
解得,故从2021年底起经过7年后,即2028年底新能源汽车的数量将超过传统能源汽车.
【过关测试】
一、单选题
1.(2023·福建三明·高二三明一中校考期中)下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,且,则
C.线性回归直线一定经过样本点的中心
D.随机变量,若,则
【答案】B
【解析】根据相关系数的意义可知,两个随机变量的线性相关性越强,
相关系数的绝对值越接近于,
故A正确;
由,知,
即概率密度函数的图像关于直线对称,
所以,
则,
故B错误;
根据线性回归直线的性质可知,
线性回归直线一定经过样本点的中心,
故C正确;
随机变量,若,
则,
故D正确;
故选:B.
2.(2023·河南南阳·高二校联考期中)观察变量x与y的散点图发现可以用指数型模型拟合其关系,为了求出回归方程,设,求得z关于x的线性回归方程为,则a与k的值分别为( )
A.3,2 B.2,3 C.,2 D.,3
【答案】D
【解析】因为,且z关于x的线性回归方程为,
所以,则,
故选:D
3.(2023·四川成都·高二统考期中)某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是( )
A. B.
C. D.
【答案】D
【解析】由散点图可见,数据分布成递增趋势,但是呈现上凸效果,即增加缓慢.
A中,是直线型,均匀增长,不符合要求;
B中,是二次函数型,函数对称轴为轴,
当时,图象呈现下凸,增长也较快,不符合要求;
当时,图象呈现上凸,呈递减趋势,不符合要求;
C中,是指数型,爆炸式增长,增长快,不符合要求;
D中,是对数型,增长缓慢,符合要求.
故对数型最适宜该回归模型.
故选:D.
4.(2023·山西大同·高二山西省浑源中学校考期中)营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:
拟合曲线
直线
指数曲线
抛物线
三次曲线
与的回归方程
相关指数
0.893
0.986
0.931
0.312
则这组数据模型的回归方程的最好选择应是( )
A. B.
C. D.
【答案】B
【解析】相关指数的值越大,说明模型的拟合效果越好,观察可知,指数曲线的最大,故回归方程的最好选择应是,
故选:B.
5.(2023·陕西咸阳·高二统考期中)如图所示的散点图,现选用两种回归模型,模型A:用线性回归模型,计算出相关系数;模型B:用指数回归模型,计算出转化为线性回归方程所对应的相关系数,则一定有( )
A. B. C. D.无法确定
【答案】B
【解析】根据散点图可知,利用指数回归模型模拟效果好于线性回归模型,
所以.
故选:B
6.(2023·四川遂宁·高二统考期末)从非洲蔓延到东南亚的蝗虫灾害严重威胁了国际农业生产,影响了人民生活.世界性与区域性温度的异常、旱涝频繁发生给蝗灾发生创造了机会.已知蝗虫的产卵量y与温度x的关系可以用模型(其中e为自然对数的底数)拟合,设,其变换后得到一组数据:
x
20
23
25
27
30
z
2
2.4
3
3
4.6
由上表可得经验回归方程,则当x=35时,蝗虫的产卵量y的估计值为( )
A. B. C.8 D.
【答案】A
【解析】由表格数据知:,,
因为数对满足,得,
∴,即,∴,∴x=35时,.
故当x=35时,蝗虫的产卵量y的估计值为.
故选:A.
二、多选题
7.(2023·山东滨州·高二统考期中)下列关于变量间的线性相关系数说法正确的是( )
A.相关系数的取值范围为
B.| r |=1的充要条件是成对数据构成的点都在回归直线上
C.两个变量正相关的充要条件是
D.相关系数r越小,则变量间的线性相关性越弱
【答案】ABC
【解析】选项A:相关系数的取值范围为.判断正确;
选项B:| r |=1的充要条件是成对数据构成的点都在回归直线上.判断正确;
选项C:两个变量正相关的充要条件是.判断正确;
选项D:相关系数r的绝对值越小,则变量间的线性相关性越弱.判断错误.
故选:ABC
8.(2023·山西太原·高二统考期中)对于样本相关系数,下列说法正确的是( )
A.的取值范围是
B.越大,相关程度越弱
C.越接近于0,成对样本数据的线性相关程度越强
D.越接近于1,成对样本数据的线性相关程度越强
【答案】AD
【解析】对于样本相关系数,取值范围是,越大,越接近于1,成对样本数据的线性相关程度越强;越小,越接近于0,成对样本数据的线性相关程度越弱.
故选:AD
9.(2023·广西钦州·高二钦州一中校考期中)下列命题中,正确的命题( )
A.回归直线恒过样本点的中心,且至少过一个样本点
B.将一组数据的每个数据都加一个相同的常数后,方差不变
C.用相关系数来刻画回归效果,越接近,说明模型的拟合效果越好
D.若随机变量,且,则
【答案】BD
【解析】对于A,回归直线恒过样本点的中心,不一定过样本点,A错误;
对于B,将一组数据的每个数据都加一个相同的常数后,数据的波动性不变,方差不变,B正确;
对于C,用相关系数来刻画回归效果,越接近,说明模型的拟合效果越好,C错误;
对于D,随机变量,则, D正确.
故选:BD
10.(2023·湖南张家界·高二慈利县第一中学校考期中)对具有相关关系的两个变量x和y进行回归分析时,经过随机抽样获得成对的样本点数据,则下列结论正确的是( )
A.若两变量x,y具有线性相关关系,则回归直线至少经过一个样本点
B.若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心
C.若以模型拟合该组数据,为了求出回归方程,设,将其变换后得到线性方程,则a,h的估计值分别是3和6
D.回归分析中常用残差平方和来刻画拟合效果好坏,残差平方和越小,拟合效果越好
【答案】BCD
【解析】对于A,若两变量x,y具有线性相关关系,则所有样本点都可能不在回归直线上,A错误;
对于B,若两变量x,y具有线性相关关系,则回归直线一定经过样本点中心,B正确;
对于C,因为,所以,即,又,所以a,h的估计值分别是3和6,C正确;
对于D,残差平方和越小,拟合效果越好,D正确;
故选:BCD.
11.(2023·辽宁辽阳·高二校联考期末)已知关于变量x,y的4组数据如表所示:
x
6
8
10
12
y
a
10
6
4
根据表中数据计算得到x,y之间的线性回归方程为,x,y之间的相关系数为r(参考公式:),则( )
A. B.变量x,y正相关 C. D.
【答案】AC
【解析】回归直线必过点,,,解得,所以选项A正确;
由回归方程和表格可知,变量x,y负相关,所以选项B错误;
,所以选项C正确,选项D错误.
故选:AC
三、填空题
12.(2023·山西太原·高二统考期中)已知回归方程,而试验中的一组数据是,,,则其残差平方和是______.
【答案】0.03
【解析】残差,当时,,当时,,当时,,
残差平方和为
故答案为:0.03.
13.(2023·广西桂林·高二校考期中)某种产品的广告费支出与销售额(单位:万元)之间的关系如表.与的线性回归方程为.当广告支出万元时,随机误差的残差为________.
【答案】
【解析】当时.得,
∴当广告费支出为万元时,随机误差的残差为.
故答案为:.
14.(2023·辽宁·高二辽河油田第二高级中学校考期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:
x
3
4
5
6
y
2
3
5
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为,则表中m的值为__________.
【答案】/
【解析】因为回归方程为,在样本处的残差为,
所以,得,
故回归方程为,
因为,,
所以,解得,
故m的值为.
故答案为:.
15.(2023·吉林·高二校联考期末)以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.
【答案】
【解析】,即,
∴,.
故答案为:
16.(2023·广东广州·高二统考期末)已知变量与相对应的一组数据为,变量与相对应的一组数据为表示变量与之间的线性相关系数,表示变量与之间的线性相关系数,则和0三者之间的大小关系是___________.(用符号“
相关学案
这是一份期末模拟卷03——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019),文件包含期末押题预测卷03解析版docx、期末押题预测卷03原卷版docx等2份学案配套教学资源,其中学案共23页, 欢迎下载使用。
这是一份期末模拟卷02——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019),文件包含期末押题预测卷02解析版docx、期末押题预测卷02原卷版docx等2份学案配套教学资源,其中学案共24页, 欢迎下载使用。
这是一份期末模拟卷01——2022-2023学年高二数学下学期期末专题复习学案+期末模拟卷(人教A版2019),文件包含期末押题预测卷01解析版docx、期末押题预测卷01原卷版docx等2份学案配套教学资源,其中学案共24页, 欢迎下载使用。