高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀习题
展开一、线性回归方程
1、随机误差
具有线性相关关系的两个变量的取值,,的值不能由完全确定,它们之间是统计相关关系,可将,之间的关系表示为,其中是确定性函数,称为随机误差。
2、随机误差产生的主要原因
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差。
3、线性回归模型中,的求法
称为线性回归模型,,,的估计值为,,则
其中,
4、回归直线和线性回归方程
直线称为回归直线,此直线方程称为线性回归方程,称为回归截距,称为回归斜率,称为回归值。
二、常见的非线性函数转换方法
1、幂型函数y=axm(a为正数,x,y取正值)
对y=axm两边取常用对数,有lg y=lg a+mlg x,
令u=lg y,v=lg x,则原式可变为u=mv+lg a,其中m,lg a为常数,
该式表示u,v的线性函数.
2、指数型函数y=c·ax(a,c>0,且a≠1):
对y=cax两边取常用对数,则有lg y=lg c+xlg a,
令u=lg y,则原式可变为u=xlg a+lg c,其中lg a和lg c为常数,
该式表示u,x的线性函数.与幂函数不同的是x保持不变,用y的对数lg y代替了y.
3、反比例函数y= (k>0):令u=,则y=ku,该式表示y,u的线性函数.
4、二次函数y=ax2+c:令u=x2,则原函数可变为y=au+c,该式表示y,u的线性函数.
5、对数型函数y=clgax:令x=au,则原函数可变为y=cu,该式表示y,u的线性函数.
题型一 线性回归方程的意义
【例1】(2023·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
【答案】C
【解析】记三条回归直线分别为,,,
画出这三条回归直线的大致图象,如图所示,
由图可知这三条回归直线的斜率大小关系为,
截距大小关系为.故选:C.
【变式1-1】(2023·高二课时练习)根据如下样本数据,得到的线性回归方程为,则( )
A., B., C., D.,
【答案】B
【解析】由表格可以得出随增大而减小,故,
又
故过点,代入可得.故选:B.
【变式1-2】(2023·高二课时练习)根据如下样本数据,得到线性回归方程为,若样本点的中心为,则当X每增加1个单位时,Y平均( )
A.增加1.4个单位 B.减少1.4个单位
C.增加7.9个单位 D.减少7.9个单位
【答案】B
【解析】样本点的中心为,则,
故,且,解得,,则,
可知当X每增加1个单位时,Y平均减少1.4个单位.故选:B.
【变式1-3】(2023·高二课时练习)(多选)关于回归分析,下列说法正确的是( )
A.回归分析是研究两个具有相关关系的变量的方法
B.运用最小二乘法求得的回归直线一定经过样本中心
C.回归模型中一定存在随机误差
D.散点图能明确反映变量问的关系
【答案】ABC
【解析】对于A,回归分析是研究两个具有相关关系的变量的方法,所以A正确,
对于B,运用最小二乘法求得的回归直线一定经过样本中心,所以B正确,
对于C,因为相关关系是一种非确定关系,所以回归模型中一定存在随机误差,
所以C正确,
对于D,散点图反映的是两个变量间的关系,存在误差,所以D错误,故选:ABC
【变式1-4】(2023·高二课时练习)已知由样本数据点集合,求得的回归直线方程为,且,现发现两个数据点和的误差较大,去除后重新求得的回归直线 l 的斜率为1.2,则下列说法正确的是______.
①变量x与y呈正相关关系;
②去除后y的估计值增加速度变快;
③去除后与去除前样本点的中心不变;
④去除后的回归直线方程为.
【答案】①③④
【解析】因为回归直线方程为,
所以变量 x 与 y 呈正相关关系,故①正确;
因为,所以去除后y的估计值增加速度变慢,故②错误;
当时,,所以去除前样本点的中心为,
又因为,,
所以去掉两个数据点和后,样本点的中心还是,故③正确;
因为去除后重新求得的回归直线的斜率为1.2,所以可设,
将点代入直线,得,解得,
所以去除后的回归直线方程为,故④正确.
故答案为:①③④.
题型二 样本中心点的应用
【例2】(2022春·江苏·高二校联考阶段练习)某产品的营销费用(万元)与净利润额(万元)的统计数据如下表:
根据上表可得回归方程中的为,据此预预营销费用为7万元时的净利润额为( )万元.
A.52 B. C.53 D.
【答案】D
【解析】,
因为回归直线过数据中心点,
所以,解得.
回归方程,
当时,.故选:D.
【变式2-1】(2023春·广西钦州·高二钦州一中校考期中)根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为( )
A.60 B.55 C.50 D.45
【答案】A
【解析】由表中数据,计算,
,
因为回归直线方程过样本中心,
,解得,故选:A
【变式2-2】(2023春·河南南阳·高二校考阶段练习)某单位为了了解办公楼用电量y(度)与气温x()之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:由表中数据得到线性回归方程,当气温为时,预测用电量为( )
A.68度 B.66度 C.28度 D.12度
【答案】B
【解析】由表中数据可知,,
所以回归方程过,得,即,
则回归方程为,
当时,,故选:B.
【变式2-3】(2023春·高二课时练习)由变量与相对应的一组数据得到的线性回归方程为,根据样本中心满足线性回归方程,则( )
A.45 B.51 C.67 D.63
【答案】B
【解析】由题意得,
因为线性回归方程为,所以,故选:B.
题型三 求线性回归方程
【例3】(2023春·四川德阳·高二德阳五中校考阶段练习)某学校为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明、小红分别进行了为期一周的封闭强化训练,下表记录了两人在封闭强化训练期问每天加工模具成功的次数,其中小明第7天的成功次数忘了记录,但知道,.
(1)求这7天内小明成功的总次数不少于小红成功的总次数的概率;
(2)根据小明这7天内前6天的成功次数,求其成功次数关于序号的线性回归方程,并估计小明第七天成功次数的值.
参考公式:回归方程中斜率与截距的最小二乘估计公式分别为
参考数据:.
【答案】(1);(2),小明第七天成功次数为
【解析】(1)因为,且,所以的取值共有25种情况,
、分别表示小明、小红第i天成功次数,
又当小明成功的总次数不少于小红成功的总次数时,在,
即,得,
所以小明成功的总次数不少于小红成功的总次数时,的取值共有17情况,
所以这7天内小明成功的总次数不少于小红成功的总次数的概率为;
(2)由题设可知
,
,
所以,
所以关于序号的线性回旧方程为.
当时,,
估计小明第7天成功次数的值为38.
【变式3-1】(2023春·吉林长春·高二长春市第十七中学校考阶段练习)对于数据组:
(1)你能直观上得到什么结论,两个变量之间是否呈现线性关系?如果能,求线性回归方程.
(2)当时,求y的预测值.
参考公式:,
【答案】(1)呈现线性关系,;(2)10.
【解析】(1)在坐标平面内作出点,
观察散点图得,两个变量之间呈现线性关系,
,
,,
,,
所以y关于x的线性回归方程为.
(2)由(1)知,,当时,,
所以y的预测值是10.
【变式3-2】(2023春·宁夏固原·高二校考阶段练习)某种产品的广告费用支出(万元)与销售额(万元)之间有如下的对应数据:
(1)求回归直线方程;(参考公式:)
(2)据此估计广告费用为10万元时,销售收入的值.
【答案】(1);(2)万元
【解析】(1)因为,
,,
所以,,
故回归方程为
(2)由(1)知,
所以当时,代入得到,
即销售收入的值为万元.
【变式3-3】(2023春·河南焦作·高二统考期中)研究表明,过量的碳排放会导致全球气候变暖等环境问题,减少碳排放具有深远的意义.中国明确提出节能减排的目标与各项措施,工业和信息化部在2022年新能源汽车推广应用中提出了财政补贴政策后,某新能源汽车公司的销售量逐步提高,如图是该新能源汽车公司在2022年1~5月份的销售量y(单位:万辆)与月份x的折线图.
(1)依据折线图计算x,y的相关系数r,并据此说明可用线性回归模型拟合y与x的关系;(若,则线性相关程度很强,可用线性回归模型拟合)
(2)请建立y关于x的线性回归方程,并预测2022年8月份的销售量.
参考数据及公式:,相关系数,
在线性回归方程中,.
【答案】(1),说明见解析;(2),9.25万辆
【解析】(1)由该新能源汽车公司在2022年1~5月份的
销售量y与月份x的折线图中的数据,
可得,,
,,
所以,
故可用线性回归模型拟合y与x的关系.
(2)由(1)中的数据,可得,
则,
故y关于x的线性回归方程为,
当时,.
故可以预测2022年8月份的销售量为万辆.
【变式3-4】(2023春·山东潍坊·高二山东省昌乐第一中学校考阶段练习)近年来,新能源产业蓬勃发展,已成为一大支柱产业.据统计,某市一家新能源企业近5个月的产值如下表,由散点图知,该企业产值(亿元)与月份代码线性相关.
(1)求出关于的线性回归方程;
(2)根据(1)中的结果,预测明年2月份该企业的产值.
参考公式:.
参考数据:.
【答案】(1);(2)57.2亿元.
【解析】(1)因为,所以,
所以,
所以关于的线性回归方程为,
(2)明年2月份的月份代码为9,
当时,,
所以明年2月份该企业的产值约为57.2亿元.
题型四 非线性回归分析
【例4】(2023春·江苏连云港·高二校考期中)设两个相关变量和分别满足下表:
若相关变量和可拟合为非线性回归方程,则当时,的估计值为( )
(参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;)
A. B. C. D.
【答案】B
【解析】因为非线性回归方程为:,则有,
令,即,列出相关变量关系如下:
所以,,
,,
所以,
所以,所以,
即,即,因为,所以,
当时,.故选:B
【变式4-1】(2023·高二课时练习)某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
可求得y关于x的回归方程为( )
A. B. C. D.
【答案】A
【解析】由得,两边同时取对数,得;
由表中数据可知,
的平均数=.
对于A,化简变形可得,
两边同时取对数可得,
将代入可得,,
与题中数据吻合;故选项A正确;
对于B,化简变形可得,
两边同时取对数可得,,
将代入可得,所以选项B错误;
对于C,,两边同时取对数可得,
而表中所给数据为的相关量,所以C错误;
对于D,,两边同时取对数可得,
而表中所给数据为的相关量,所以D错误.故选:A.
【变式4-2】(2023·江苏·高二专题练习)有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
【答案】(1)人;(2)
【解析】(1)令,设,
由条件知,,
所以,
,从而,
故所求的回归方程为.
所以,估计当时,,即抽取轮才“成功”的人数约为人.
(2)由条件知,游戏要进行三轮,即前两轮均失败.
设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立.
因为,,
所以,前两轮均失败的概率为.
故游戏要进行三轮的概率为.
【变式4-3】(2023春·高二单元测试)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长. 已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
参考数据:,,其中
(1)根据统计表中的数据画出散点图(如图),请判断与哪一个更适合作为y关于x的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立y关于x的经验回归方程:
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考公式:对于一组数据,v1),),…,,其经验回归直线的斜率和截距的最小二乘估计公式分别为,;
【答案】(1)作图见解析,选择的函数模型是,;(2)2028年.
【解析】(1)根据该地区新能源汽车保有量的增长趋势知,
应选择的函数模型是,令,则
因为,
所以,,
,所以;
(2)设传统能源汽车保有量每年下降的百分比为r,
依题意得,),解得,
设从2021年底起经过x年后的传统能源汽车保有量为y千辆,
则有x,
设从2021年底起经过x年后新能源汽车的数量将超过传统能源汽车,
则有,
所以,解得,
故从2021年底起经过7年后,
即2028年底新能源汽车的数量将超过传统能源汽车.x
2
3
4
5
6
y
4
2.5
X
3
4
5
6
7
Y
4.0
-0.5
0.5
3
4
5
6
40
42
45
51
2
4
5
6
8
30
40
50
70
气温x()
18
13
10
-1
用电量y(度)
24
34
38
64
第一天
第二天
第三天
第四天
第五天
第六天
第七天
序号
1
2
3
4
5
6
7
小明成功次数
16
20
20
25
30
36
小红成功次数
16
22
25
26
32
35
35
x
2
3
4
5
y
1.9
4.1
6.1
7.9
2
4
5
6
8
10
20
40
30
50
月份
6月
7月
8月
9月
10月
月份代码
1
2
3
4
5
产值(亿元
16
20
27
30
37
0
1
3
3
4
营养成分含量x/克
1
2
3
4
5
4.34
4.36
4.44
4.45
4.51
年份(年)
2014
2015
2016
2017
2018
2019
2020
2021
年份代码x
1
2
3
4
5
6
7
8
保有量y/千辆
1.95
2.92
4.38
6.58
9.87
15.00
22.50
33.70
数学选择性必修第二册9.2独立性检验精品同步测试题: 这是一份数学选择性必修第二册9.2独立性检验精品同步测试题试卷主要包含了列联表,独立性检验等内容,欢迎下载使用。
苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题: 这是一份苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题,文件包含911变量的相关性原卷版docx、911变量的相关性解析版docx等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。
高中数学苏教版 (2019)选择性必修第二册8.3 正态分布精品当堂达标检测题: 这是一份高中数学苏教版 (2019)选择性必修第二册8.3 正态分布精品当堂达标检测题,文件包含83正态分布原卷版docx、83正态分布解析版docx等2份试卷配套教学资源,其中试卷共21页, 欢迎下载使用。