![9.1 线性回归分析(十大题型)(原卷版)第1页](http://img-preview.51jiaoxi.com/3/3/14226537/0/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![9.1 线性回归分析(十大题型)(原卷版)第2页](http://img-preview.51jiaoxi.com/3/3/14226537/0/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![9.1 线性回归分析(十大题型)(原卷版)第3页](http://img-preview.51jiaoxi.com/3/3/14226537/0/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![9.1 线性回归分析(十大题型)(解析版)第1页](http://img-preview.51jiaoxi.com/3/3/14226537/1/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![9.1 线性回归分析(十大题型)(解析版)第2页](http://img-preview.51jiaoxi.com/3/3/14226537/1/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![9.1 线性回归分析(十大题型)(解析版)第3页](http://img-preview.51jiaoxi.com/3/3/14226537/1/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:高二数学新教材同步配套教学讲义(苏教版选择性必修第二册)
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀巩固练习
展开
这是一份高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀巩固练习,文件包含91线性回归分析十大题型解析版docx、91线性回归分析十大题型原卷版docx等2份试卷配套教学资源,其中试卷共70页, 欢迎下载使用。
9.1 线性回归分析
【题型归纳目录】
题型一:相关关系的理解
题型二:散点图与相关性
题型三:散点图及其应用
题型四:线性相关性的检验
题型五:判断线性相关的强弱
题型六:求回归直线方程
题型七:利用回归直线方程对总体进行估计
题型八:线性回归分析
题型九:非线性回归分析
【知识点梳理】
1、相关关系
两个变量间的关系有函数关系,相关关系和不相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2、正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果一个变量值增加时,另一个变量的相应值呈现减少的趋势,则称这个两个变量负相关.
3、线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条线附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
4、相关系数的计算
注意:相关系数是研究变量之间线性相关程度的量
假设两个随机变量的数据分别为,对数据作进一步的“标准化处理”处理,,分别除和(和分别为,和的均值),得,为简单起见,把上述“标准化”处理后的成对数据分别记为,则变量和变量的样本相关系数的计算公式如下:.
5、一元线性回归模型
我们称为关于的一元线性回归模型,其中称为因变量或响应变量,称为自变量或解释变量;和为模型的末知参数,称为截距参数,称为斜率参数;是与之间的随机误差.
6、线性回归方程与最小二乘法
回归直线方程过样本点的中心,是回归直线方程最常用的一个特征
我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计(leastsquaresestimate),
其中
7、残差的概念
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
8、刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(2)残差平方和法
残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
【典型例题】
题型一:相关关系的理解
【方法技巧与总结】
函数关系是一种确定的关系,而相关关系是非随机变量与随机变量的关系.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
例1.(2023·全国·高二专题练习)下列说法正确的是( )
A.中的x,y是具有相关关系的两个变量
B.正四面体的体积与棱长具有相关关系
C.电脑的销售量与电脑的价格之间是一种确定性的关系
D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量
例2.(2023·全国·高二专题练习)下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
例3.(2023·全国·高二专题练习)对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系叫做( )
A.函数关系 B.线性关系
C.相关关系 D.回归关系
变式1.(2023·全国·高二专题练习)下列两个变量之间的关系是相关关系的是( ).
A.正方体的棱长和体积
B.单位圆中圆心角的度数和所对弧长
C.学生的学籍号与学生的数学成绩
D.日照时间与水稻的亩产量
题型二:散点图与相关性
【方法技巧与总结】
判断两个变量x和y间是否具有线性相关关系,常用的简便方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
例4.(2023·高二课时练习)已知变量和满足关系,变量与正相关,则下列结论中正确的是( ).
A.与正相关,与负相关 B.与正相关,与正相关
C.与负相关,与负相关 D.与负相关,与正相关
例5.(2023·全国·高三专题练习)相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析.方案一:根据图中所有数据,得到回归直线方程,相关系数为;方案二:剔除点,根据剩下的数据得到回归直线方程,相关系数为.则( )
A. B.
C. D.
例6.(2023·高三课时练习)变量X与Y相对应的一组数据为,,,,;变量U与V相对应的一组数据为,,,,.表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( ).
A. B.
C. D.
变式2.(2023·全国·高二专题练习)如下四个散点图中,正相关的是( )
A. B.
C. D.
变式3.(2023·高二课时练习)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额成正相关关系
B.利润率与人均销售额成负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
题型三:散点图及其应用
【方法技巧与总结】
1、画散点图时应注意合理选择单位长度,避免图形过大或偏小,或者是点的坐标在坐标系中画不准,使图形失真,导致得出错误结论.
2、在这里利用散点图直观感知事物的形态与变化,理解事物间的关联及变化规律,是数学核心素养直观想象的具体体现.
例7.(2023·全国·高二课时练习)两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A
26
18
13
10
4
B
20
24
34
38
50
64
表2
C
0
5
10
15
20
25
30
35
D
541.67
602.66
672.09
704.99
806.71
908.59
975.42
1034.75
题型四:线性相关性的检验
【方法技巧与总结】
当相关系数越接近1时,两个变量的相关关系越强,当相关系数越接近0时,两个变量的相关关系越弱.
例8.(2023·全国·高二专题练习)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如下表:
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
计算这10个学生的两次数学考试成绩的样本相关系数r,并判断两者是否具有线性相关关系.
例9.(2023·全国·高二专题练习)为研究鲈鱼身长与体重的关系,芬兰某渔业公司记录了如下表所示的鲈鱼身长X(单位:cm)与体重Y(单位:)的数据:
身长X/cm
30.0
31.2
31.1
33.5
34.0
34.7
34.5
35.0
35.1
36.2
体重Y/g
242.0
290.0
340.0
363.0
430.0
450.0
500.0
390.0
450.0
500.0
身长X/cm
36.2
36.2
36.4
37.2
37.2
38.3
38.5
38.6
38.7
体重Y/g
475.0
500.0
500.0
600.0
600.0
700.0
700.0
610.0
650.0
请画出散点图,并求鲈鱼身长X与体重Y间的样本相关系数.
例10.(2023·全国·高二课时练习)两对变量A和B,C和D的取值分别对应如表1和表2,画出散点图,分别判断它们是否具有相关关系;若具有相关关系,说出它们相关关系的区别.
表1
A
26
18
13
10
4
-1
B
20
24
34
38
50
64
表2
C
0
5
10
15
20
25
30
35
D
541.67
602.66
672.09
704.99
806.71
908.59
975.42
1034.75
变式4.(2023·全国·高二课时练习)某个男孩的年龄与身高的统计数据如下表所示.
年龄x(岁)
1
2
3
4
5
6
身高y(cm)
78
87
98
108
115
120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
题型五:判断线性相关的强弱
例11.(2023·河南·校联考模拟预测)某学校组织学生观看了“天宫课堂”第二课的直播后,极大地激发了学生学习科学知识的兴趣,提高了学生学习的积极性,特别是对实验操作的研究与探究.现有某化学兴趣小组的同学在老师的指导下,开展了某项化学实验操作,为了解实验效度与实验中原料的消耗量(单位:)的关系,该校实验员随机选取了10个小组的实验数据如下表.
小组编号
1
2
3
4
5
6
7
8
9
10
总计
实验效度
6
原料的消耗量
15
并计算得.
(1)求这10个小组的实验效度与实验中原料的消耗量的平均值;
(2)求这10个小组的实验效度与实验中原料的消耗量的相关系数(精确到);
(3)经该校实验员统计,以往一个学年各种实验中需用到原料的实验有200次左右.假设在一定的范围内,每次实验中原料的消耗量与实验效度近似成正比,其比例系数可近似为样本中相应的平均值的比值.根据要求,实验效度平均值需达到.请根据上述数据信息,估计该校本学年原料的消耗量.
附:相关系数
例12.(2023·全国·高三专题练习)某沙漠地区经过治理,生态环境得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的个地块,从这些地块中用简单随机抽样的方法抽取个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得:,,,,.
(1)求该地区这种野生动物数量的估计值;
(2)求样本的相关系数(精确到);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
例13.(2023·全国·高三专题练习)为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:)做好记录.下表是检验员在一天内依次抽取的个零件的尺寸:
抽取次序
零件尺寸()
抽取次序
9
10
11
12
13
14
15
16
零件尺寸()
经计算得,,,,其中为抽取的第个零件的尺寸().
(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)
题型六:求回归直线方程
例14.(2023·四川成都·高二校考期末)某城市2017年到2021年人口总数与年份的关系如表所示,据此估计2022年该城市人口总数______(单位十万).(参考数据和公式:,)
年份(年)
0
1
2
3
4
人口数(十万)
5
7
8
11
19
例15.(2023·高三课时练习)某实验室对小白鼠体内x、y两项指标进行研究,连续五次实验所测得的这两项指标数据如下表:
x
120
110
125
130
115
y
92
83
90
96
89
已知y与x具有线性相关关系,利用上表中的五组数据求得回归直线方程为.若下一次实验中,利用该回归直线方程预测得,则的值为______.
例16.(2023·上海·高三专题练习)已知由样本数据组成的一个样本,得到回归直线方程为,且,其中发现两个歧义点和偏差过大,去除这两点后,得到新的回归直线的斜率为3,则新的回归直线方程为______________.
变式5.(2023·高三课时练习)某研究机构对高三学生的记忆力和判断力进行统计分析,得表数据,
6
8
10
12
2
3
5
6
请根据表提供的数据,求出关于的线性回归方程:__.
变式6.(2023·广西北海·高二统考期末)某工厂节能降耗技术改造后,在生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据如下表,现发现表中有个数据看不清,已知回归直线方程为,则看不清的数据★的值为__________.
x
2
3
4
5
6
y
19
25
★
40
44
题型七:利用回归直线方程对总体进行估计
【方法技巧与总结】
求线性回归方程的一般步骤
(1)收集样本数据,设为(数据一般由题目给出).
(2)作出散点图,确定x,y具有线性相关关系.
(3)把数据制成表格.
(4)计算.
(5)代入公式计算,公式为
(6)写出线性回归方程.
例17.(2023春·陕西咸阳·高二校考阶段练习)下表是某校高一(2)班学生每周用于数学学习的时间(单位:)与数学成绩(单位:分)之间的数据:
25
15
20
10
12
92
80
85
50
60
某同学每周用于数学学习的时间为18小时,试预测该生数学成绩(保留到整数位).
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.
例18.(2023春·陕西咸阳·高二校考阶段练习)某药品公司有6名产品推销员,其工作年限与月均销售金额的数据如下表:
推销员编号
1
2
3
4
5
工作年限/年
3
5
6
7
9
月均销售金额/万元
2
3
3
4
5
(1)以工作年限为自变量,月均销售金额为因变量,作出散点图;
(2)求月均销售金额关于工作年限的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的月均销售金额.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.
例19.(2023春·安徽宿州·高二安徽省泗县第一中学校考开学考试)某企业年研发费用x(百万元)与企业年利润y(百万元)之间具有线性相关关系,该企业近5年的年研发费用和年利润的具体数据如下表:
年研发费用x(百万元)
1
2
3
4
5
年利润y(百万元)
2
3
4
4
7
(1)求y关于x的线性回归方程;
(2)如果该企业某年研发费用投入10百万元,预测该企业获得的年利润为多少?
参考公式:线性回归方程的斜率和截距的最小二乘法估计公式分别为:.
变式7.(2023·全国·高二专题练习)目前手机已经成为人们生活中的必需品,国内市场已经进入成熟期,下表是2016—2021年某市手机总体出货量(单位:万部)统计表.
年份
2016年
2017年
2018年
2019年
2020年
2021年
年份代码
1
2
3
4
5
6
手机总体出货量/万部
5.6
4.9
4.1
3.9
3.2
3.5
(1)已知该市手机总体出货量y与年份代码x之间可用线性回归模型拟合,求y关于x的线性回归方程(系数精确到0.01);
(2)预测2022年该市手机总体出货量.
附:线性回归方程中斜率与截距的最小二乘估计公式分别为,.
变式8.(2023秋·宁夏吴忠·高二吴忠中学校考期末)第24届冬奥会于2022年2月4日在北京市和张家口市联合举行,此项赛事大大激发了国人冰雪运动的热情,某滑雪场在冬奥会期间开业,下表统计了该滑雪场开业第天的滑雪人数(单位:百人)的数据
(1)根据表中的数据,求出关于的线性回归方程;
(2)经过测算,若一天中滑雪人数超过3500人时,当天滑雪场可实现盈利,请根据关于的线性回归方程,预测该滑雪场开业的第几天开始盈利.
天数代码
1
2
3
4
5
滑雪人数(百人)
9
11
14
26
20
参考公式:线性回归方程的斜率和截距的最小二乘法估计分别为:,
题型八:线性回归分析
【方法技巧与总结】
(1)解答线性回归问题,应通过散点图来分析两变量间的关系是否线性相关,然后再利用求回归方程的公式求解回归方程,并利用残差图或相关指数R2来分析函数模型的拟合效果,在此基础上,借助回归方程对实际问题进行分析.
(2)刻画回归效果的三种方法
①残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适.
②残差平方和法:残差平方和越小,模型的拟合效果越好.
例20.(2023·山东·日照青山学校高二期末)共享单车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点6天的使用单车用户的数据如下,用两种模型①;②分别进行拟合,得到相应的回归方程,,进行残差分析得到如表所示的残差值及一些统计量的值:
日期x(天)
1
2
3
4
5
6
用户y(人)
13
22
43
45
55
68
模型①的残差值
-1.1
-2.8
7.5
-1.2
-1.9
0.4
模型②的残差值
0.3
-5.4
4.3
-3.2
-1.6
3.8
(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;
(2)残差绝对值大于3的数据认为是异常数据,需要剔除,剔除异常数据后,重新求出(1)中所选模型的回归方程.
(参考公式:,)
例21.(2023·河南·南阳中学高三阶段练习(文))2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号
1
2
3
4
5
6
7
8
9
10
11
12
x
2
3
4
6
8
10
13
21
22
23
24
25
y
15
22
27
40
48
54
60
68.5
68
67.5
66
65
当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.
(1)根据下列表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;
回归模型
模型①
模型②
回归方程
79.13
20.2
(2)为鼓励科技创新,当应用改造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.
附: 刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好.用最小二乘法求线性回归方程的截距:.
题型九:非线性回归分析
【方法技巧与总结】
求非线性回归方程的步骤
(1)确定变量,作出散点图.
(2)根据散点图,选择恰当的拟合函数.
(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
(4)分析拟合效果:通过计算决定系数或画残差图来判断拟合效果.
(5)根据相应的变换,写出非线性回归方程.
例22.(2023·辽宁·校联考一模)一所中学组织学生对某线下某实体店2022年部分月份的月利润情况进行调查统计,得到的数据如下:
月份
2
4
6
8
10
12
净利润(万元)
0.9
2.0
4.2
3.9
5.2
5.1
0.7
1.4
1.8
2.1
2.3
2.5
1.4
2.0
2.4
2.8
3.2
3.5
根据散点图,准备用①或②建立关于的回归方程.
(1)用线性相关系数说明上面的两种模型哪种适宜作为关于的回归方程?
(2)由参考数据,根据(1)的判断结果,求关于的回归方程(精确到0.1).
附:对于一组数据(,2,3,⋯,n),其回归直线的斜率和截距的最小二乘估计分别为,.相关系数.
参考数据:,,,,,
,,,
,.
例23.(2023·江苏南通·统考模拟预测)随着科技的发展,手机的功能已经非常强大,各类APP让用户的生活质量得到极大的提升,但是大量的青少年却沉迷于手机游戏,极大地毒害了青少年的身心健康.为了引导青少年抵制不良游戏,适度参与益脑游戏,某游戏公司开发了一款益脑游戏APP,在内测时收集了玩家对每一关的平均过关时间,如下表:
关卡x
1
2
3
4
5
6
平均过关时间y(单位:秒)
50
78
124
121
137
352
(1)通过散点图分析,可用模型拟合y与x的关系,试求y与x的经验回归方程;
(2)甲和乙约定举行对战赛,每局比赛通关用时少的人获胜(假设甲、乙都能通关),两人约定先胜4局者赢得比赛.已知甲每局获胜的概率为,乙每局获胜的概率为,若前3局中甲已胜2局,乙胜1局,求甲最终赢得比赛的概率.
参考公式:对于一组数据(xi,yi)(i=1,2,3,…,n),其经验回归直线ŷ=x+的斜率和截距的最小二乘估计公式分别为.
参考数据:,其中.
例24.(2023秋·辽宁阜新·高二校考期末)某县依托种植特色农产品,推进产业园区建设,致富一方百姓.已知该县近年人均可支配收入如下表所示,记年为,年为,…以此类推.
年份
年份代号
人均可支配收入(万元)
(1)使用两种模型:①;②的相关指数分别约为,,请选择一个拟合效果更好的模型,并说明理由;
(2)根据(1)中选择的模型,试建立关于的回归方程.(保留位小数)
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,令,.
变式9.(2023·全国·高三专题练习)为了研究某种细菌随天数变化的繁殖个数,收集数据如下:
天数
1
2
3
4
5
6
繁殖个数
6
12
25
49
95
190
(1)在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(为常数)与(为常数,且)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(为常数,且),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
3.50
62.83
3.53
17.50
596.57
12.09
(ⅰ)证明:“对于非线性回归方程,令,可以得到繁殖个数的对数关于天数具有线性关系(即为常数)”;
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立关于的回归方程(系数保留2位小数).
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.
变式10.(2023·全国·高三专题练习)发展扶贫产业,找准路子是关键,重庆市石柱土家族自治县中益乡华溪村不仅找准了路,还将当地打造成了种植中药材黄精的产业示范基地.通过种植黄精,华溪村村民的收入逐年递增.以下是2014年至2020年华溪村村民每户平均可支配收入的统计数据:
年份
2014
2015
2016
2017
2018
2019
2020
年份代码
1
2
3
4
5
6
7
每户平均可支配收入(千元)
4
15
22
26
29
31
32
根据以上数据,绘制如图所示的散点图:
(1)根据散点图判断,与哪一个更适宜作为每户平均可支配收入(千元)关于年份代码的回归方程模型(给出判断即可,不必说明理由),并建立关于的回归方程(结果保留1位小数);
(2)根据(1)建立的回归方程,试预测要到哪一年华溪村的每户平均可支配收入才能超过35(千元);
参考数据:
22.7
1.2
759
235.1
13.2
8.2
其中,.
参考公式:线性回归方程中,,.
【同步练习】
一、单选题
1.(2023春·陕西汉中·高一统考期中)下列图形中具有相关关系的是( )
A. B.
C. D.
2.(2023春·上海徐汇·高二统考阶段练习)下列关于散点图的说法中,正确的是( )
A.任意给定统计数据,都可以绘制散点图 B.从散点图中可以看出两个量是否具有一定的关系
C.从散点图中可以看出两个量的因果关系 D.从散点图中无法看出数据的分布情况
3.(2023·陕西西安·统考三模)党的十九大报告中指出:从2020年到2035年,在全面建成小康社会的基础上,再奋斗15年,基本实现社会主义现代化.若到2035年底我国人日数量增长至14.4亿,由2013年到2019年的统计数据可得国内生产总值(GDP)y(单位:万亿元)关于年份代号x的回归方程为,由回归方程预测我国在2035年底人均国内生产总值(单位:万元)约为( ).
A.202.2 B.195.6 C.15.6 D.14.0
4.(2023春·陕西延安·高二子长市中学校考期末)2020年初以来,技术在我国已经进入高速发展的阶段,手机的销量也逐渐上升,某手机商城统计了手机5个月的实际销量,结果如下表所示:
月份
2020年10月
2020年11月
2020年12月
2021年1月
2021年2月
月份编号
1
2
3
4
5
销量部
50
96
185
227
若与线性相关,且求得线性回归方程为,则下列结论错误的是( )A.与正相关
B.与的相关系数为负数
C.表中
D.预计2021年7月份该手机商城手机的销量约为450部
5.(2023春·陕西咸阳·高二校考阶段练习)在变量与x的回归模型中,根据下面四个的相关系数,判断拟合效果最好的是( )
A.模型1的相关系数为0.2 B.模型2的相关系数为0.3
C.模型3的相关系数为0.9 D.模型4的相关系数为0.8
6.(2023春·山西大同·高二山西省浑源中学校考期中)营养学家对某地区居民的身高与营养摄入量的几组数据进行研究后发现两个变量存在相关关系,该营养学家按照不同的曲线拟合与之间的回归方程,并算出相关指数如下表所示:
拟合曲线
直线
指数曲线
抛物线
三次曲线
与的回归方程
相关指数
0.893
0.986
0.931
0.312
则这组数据模型的回归方程的最好选择应是( )A. B.
C. D.
7.(2023·全国·高三专题练习)在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
8.(2023·全国·高二专题练习)为了解某种产品与原材料之间的关系,随机调查了该产品5个不同时段的产品与原材料的价格,得到如下统计数据表:
原材料价格(万元/吨)
产品价格(万元/件
但是统计员不小心丢失了一个数据(用代替),在数据丢失之前得到回归直线方程为,则的值等于( )A. B. C. D.
二、多选题
9.(2023·广东湛江·统考一模)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:
编号
1
2
3
4
5
6
7
8
9
10
身高/cm
165
168
170
172
173
174
175
177
179
182
体重/kg
55
89
61
65
67
70
75
75
78
80
由表中数据制作成如下所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有( )A. B.
C. D.
10.(2023·湖北·统考模拟预测)下列命题中正确的是( )
A.若样本数据,,,的样本方差为3,则数据,,,的方差为7
B.经验回归方程为时,变量x和y负相关
C.对于随机事件A与B,,,若,则事件A与B相互独立
D.若,则取最大值时
11.(2023·辽宁·辽宁实验中学校考模拟预测)随着我国碳减排行动的逐步推进,我国新能源汽车市场快速发展,新能源汽车产销量大幅上升,2017-2021年全国新能源汽车保有量y(单位:万辆)统计数据如下表所示:
年份
2017年
2018年
2019年
2020年
2021年
年份代码x
1
2
3
4
5
保有量y/万辆
153.4
260.8
380.2
492
784
由表格中数据可知y关于x的经验回归方程为,则( )A.
B.预测2023年底我国新能源汽车保有量高于1000万辆
C.2017-2021年全国新能源汽车保有量呈增长趋势
D.2021年新能源汽车保有量的残差(观测值与预测值之差)为71.44
12.(2023·全国·高二专题练习)为了研究汽车减重对降低油耗的作用,对一组样本数据进行分析,其中表示减重质量(单位:千克),表示每行驶一百千米降低的油耗(单位:升),,由此得到的线性回归方程为.下列说法正确的是( )
A.的值一定为0
B.越大,减重对降低油耗的作用越大
C.残差的平方和越小,回归效果越好
D.至少有一个数据点在回归直线上
三、填空题
13.(2023春·陕西西安·高二校联考阶段练习)已知某个样本点中的变量x、y线性相关,相关系数,则在以为坐标原点的坐标系下的散点图中,大多数的点都落在第________象限.
14.(2023·全国·高二专题练习)某单位做了一项统计,了解办公楼日用电量(度)与当天平均气温之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了如下对照表:
日平均气温
18
13
10
日用电量度
24
34
38
64
由表中数据得到线性回归方程,则当日平均气温为时,预测日用电量为___________度.
15.(2023·高二课时练习)已知下表是某品牌的研发投入x(单位:万元)与销售额y(单位:万元)的一组数据:
x(万元)
4
5
6
7
8
9
y(万元)
68
75
80
83
84
90
由散点图可知,销售额y与研发投入x间有较强的线性相关关系,其线性回归直线方程是,则可以预测,当时,y的值为______.
16.(2023·全国·高三专题练习)用模型拟合一组数据,若,,设,得变换后的线性回归方程为,则ak=___________.
四、解答题
17.(2023·陕西榆林·陕西省神木中学校考模拟预测)某医疗机构承担了某城镇的新冠疫苗接种任务,现统计了前8天每天(用表示)的接种人数y(单位:百人)的相关数据,并制作成如图所示的散点图.
(1)由散点图看出,可用线性回归模型拟合y与t的关系,求y关于t的线性回归方程;(系数用分数表示)
(2)预测哪一天的接种人数会首次突破2500人.(结果保留整数)
参考数据:,,,.
参考公式:对于一组数据,,…,,其线性回归方程的斜率和截距的最小二乘法估计分别为,.
18.(2023春·陕西西安·高二校联考阶段练习)“俯卧撑”是日常体能训练的一项基本训练,坚持做可以锻炼上肢、腰部及腹部的肌肉.某同学对其“俯卧撑”情况作了记录,得到如表数据.分析发现他能完成“俯卧撑”的个数y(个)与坚持的时间x(周)线性相关.
x
1
2
4
5
y
5
15
25
35
参考公式:,
(1)求y关于x的线性回归方程
(2)预测该同学坚持10周后能完成的“俯卧撑”个数
19.(2023春·陕西咸阳·高二校考阶段练习)某收费(手机应用程序)自上架以来,凭借简洁的界面设计、方便的操作方式和强大的实用功能深得用户的喜爱.该所在的公司统计了用户一个月月租减免的费用(单位:元)及该月对应的用户数量(单位:万人),得到如下数据表格:
用户一个月月租减免的费用(元)
3
4
5
6
7
用户数量(万人)
1
1.1
1.5
1.9
2.2
已知与线性相关.
(1)求关于的线性回归方程(,,);
(2)求与的相关系数(精确到0.01).
参考公式:相关系数,对于一组具有线性相关关系的数据(,2,,n),其回归直线的斜率和截距的最小二乘估计公式分别为,,.
20.(2023·山西·统考模拟预测)某农科所对冬季大棚内的昼夜温差与某反季节大豆新品种发芽率之间的关系进行分析研究,记录了2023年1月1日至1月12日大棚内的昼夜温差与每天每100颗种子的发芽数,得到如下资料:
日期
1日
2日
3日
4日
5日
6日
7日
8日
9日
10日
11日
12日
温差/℃
10
11
13
12
8
10
9
11
13
10
12
9
发芽数/颗
21
24
28
28
15
22
17
22
30
18
27
18
;;;
已知发芽数与温差之间线性相关,该农科所确定的研究方案是:先从这12组数据中选取2组,用剩下的10组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)求选取的2组数据恰好是相邻2天的数据的概率;
(2)若选取的是1日与6日的两组数据,试根据除这两日之外的其他数据,求出关于的线性回归方程;(精确到1)
(3)若由线性回归方程得到的估计数据与所选取的检验数据的误差均不超过2颗,则认为求得的线性回归方程是可靠的,试问:(2)中所得的线性回归方程是否可靠.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
21.(2023春·辽宁本溪·高三校考阶段练习)受社会对高素质人才不断扩大的需求和就业形势等多方面因素的影响,我国本科毕业生中考研人数在不断攀升,2021年考研人数是377万人,2022年考研人数为457万人,比上年增加80万人,有关机构估计2023年研究生报名人数将突破500万人.某省统计了该省五所大学2022年的本(专)科大学毕业生人数及考研人数(单位:千人),得到如下表格:
A大学
B大学
C大学
D大学
E大学
2022年毕业人数x(千人)
7.8
6.2
4.6
3.4
3
2022年考研人数y(千人)
0.5
0.4
0.3
0.2
0.2
(1)已知与具有较强的线性相关关系,求关于的线性回归方程;
(2)假设该省对选择考研的大学生每人发放0.6万元的补贴.若A大学的2022年的毕业生中小常、小郭选择考研的概率分别为p、,该省对小常、小郭两人的考研补贴总金额的期望不超过0.96万元,求p的取值范围.
参考公式:,.
22.(2023春·陕西渭南·高一校考阶段练习)某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
年份
2016
2017
2018
2019
2020
储蓄存款(千亿元)
5
6
7
8
10
表1
为了研究计算的方便,工作人员将上表的数据进行了处理,令,得到下表2:
年份代号
1
2
3
4
5
0
1
2
3
5
表2
(1)求关于的线性回归方程;
(2)通过(1)中的方程,求出关于的回归方程;
(3)用所求回归方程预测到2022年年底,该建设银行储蓄存款额可达多少?
附:对于一组数据,,…,的线性回归方程的斜率和截距的最小二法估计分别为,.
相关试卷
这是一份高中数学苏教版 (2019)选择性必修第二册9.2独立性检验精品当堂达标检测题,文件包含92独立性检验五大题型解析版docx、92独立性检验五大题型原卷版docx等2份试卷配套教学资源,其中试卷共52页, 欢迎下载使用。
这是一份数学选择性必修第二册8.3 正态分布精品一课一练,文件包含83正态分布四大题型解析版docx、83正态分布四大题型原卷版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
这是一份苏教版 (2019)选择性必修第二册8.1条件概率优秀同步测试题,文件包含81条件概率五大题型解析版docx、81条件概率五大题型原卷版docx等2份试卷配套教学资源,其中试卷共34页, 欢迎下载使用。
![文档详情页底部广告位](http://img.51jiaoxi.com/images/257d7bc79dd514896def3dc0b2e3f598.jpg)