![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)01](http://img-preview.51jiaoxi.com/3/3/15093832/0-1702869154096/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)02](http://img-preview.51jiaoxi.com/3/3/15093832/0-1702869154192/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)03](http://img-preview.51jiaoxi.com/3/3/15093832/0-1702869154232/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)01](http://img-preview.51jiaoxi.com/3/3/15093832/1-1702869157879/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)02](http://img-preview.51jiaoxi.com/3/3/15093832/1-1702869157911/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![人教A版高中数学(选择性必修三)同步培优讲义专题8.3 一元线性回归模型及其应用(重难点题型精讲)(2份打包,原卷版+教师版)03](http://img-preview.51jiaoxi.com/3/3/15093832/1-1702869157951/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
- 人教A版高中数学(选择性必修三)同步培优讲义专题7.13 随机变量及其分布全章综合测试卷(提高篇)(2份打包,原卷版+教师版) 试卷 3 次下载
- 人教A版高中数学(选择性必修三)同步培优讲义专题8.1 成对数据的统计相关性(重难点题型精讲)(2份打包,原卷版+教师版) 试卷 3 次下载
- 人教A版高中数学(选择性必修三)同步培优讲义专题8.7 独立性检验的综合应用大题专项训练(30道)(2份打包,原卷版+教师版) 试卷 2 次下载
- 人教A版高中数学(选择性必修三)同步培优讲义专题8.8 成对数据的统计分析全章综合测试卷(基础篇)(2份打包,原卷版+教师版) 试卷 3 次下载
- 人教A版高中数学(选择性必修三)同步培优讲义专题8.9 成对数据的统计分析全章综合测试卷(提高篇)(2份打包,原卷版+教师版) 试卷 2 次下载
数学选择性必修 第三册8.2 一元线性回归模型及其应用精品综合训练题
展开1.一元线性回归模型
把式子 SKIPIF 1 < 0 为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称
为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
2.线性经验回归方程与最小二乘法
设满足一元线性回归模型的两个变量的n对样本数据为( SKIPIF 1 < 0 , SKIPIF 1 < 0 ),( SKIPIF 1 < 0 , SKIPIF 1 < 0 ), SKIPIF 1 < 0 ,( SKIPIF 1 < 0 , SKIPIF 1 < 0 ),由 SKIPIF 1 < 0 = SKIPIF 1 < 0 +a+ SKIPIF 1 < 0
(i=1,2, SKIPIF 1 < 0 ,n),得| SKIPIF 1 < 0 -( SKIPIF 1 < 0 +a)|= | SKIPIF 1 < 0 |,显然| SKIPIF 1 < 0 |越小,表示样本数据点离直线y=bx+a的竖直距离越小.
通常用各散点到直线的竖直距离的平方之和Q= SKIPIF 1 < 0 来刻画各样本观测数据与直线
y=bx+a的“整体接近程度”.
当a,b的取值为 SKIPIF 1 < 0 时,Q达到最小.将 SKIPIF 1 < 0 = SKIPIF 1 < 0 x+ SKIPIF 1 < 0 称为Y关于x的经验回归方
程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二
乘法,求得的 SKIPIF 1 < 0 , SKIPIF 1 < 0 叫做b,a的最小二乘估计.
经验回归直线一定过点( SKIPIF 1 < 0 , SKIPIF 1 < 0 ).
3.残差分析
对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的 SKIPIF 1 < 0 称为预测值,观测值减
去预测值称为残差.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称
为残差图.在残差图中,残差点比较均匀地落在以取值为0的横轴为对称轴的水平带状区域内,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为 SKIPIF 1 < 0 ,残差平方和越小,模型拟合效果越好.
(3)利用 SKIPIF 1 < 0 刻画拟合效果
SKIPIF 1 < 0 = SKIPIF 1 < 0 .
SKIPIF 1 < 0 越大,模型的拟合效果越好, SKIPIF 1 < 0 越小,模型的拟合效果越差.
(1)对于变量x和变量y,设经过随机抽样获得的成对样本数据为( SKIPIF 1 < 0 , SKIPIF 1 < 0 ),( SKIPIF 1 < 0 , SKIPIF 1 < 0 ), SKIPIF 1 < 0 ,( SKIPIF 1 < 0 , SKIPIF 1 < 0 ),利用
相关系数r来衡量两个变量之间线性关系的强弱,相关系数r的计算公式:
SKIPIF 1 < 0 (其中 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 和 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 的均值分别为 SKIPIF 1 < 0 和 SKIPIF 1 < 0 ).
①当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;
当其中一个数据的值变大时,另一个数据的值通常也变大.
②当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;
当其中一个数据的值变大时,另一个数据的值通常会变小.
【题型1 一元线性回归模型】
【方法点拨】
根据一元线性回归模型的定义,结合具体题目条件,进行求解即可.
【例1】(2022·高二单元测试)根据如下样本数据,得到线性回归方程为,若样本点的中心为,则当X每增加1个单位时,Y平均( )
A.增加1.4个单位B.减少1.4个单位C.增加7.9个单位D.减少7.9个单位
【变式1-1】(2022春·黑龙江大庆·高二期末)给出下列说法中错误的是( )
A.回归直线恒过样本点的中心
B.两个变量相关性越强,则相关系数就越接近1
C.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变
D.在回归直线方程中,当变量x增加一个单位时,平均减少0.5个单位
【变式1-2】(2022春·河南南阳·高二期中)已知变量x和y的回归直线方程为,变量y与z负相关.下列结论中正确的是( )
A.x与y正相关,x与z正相关B.x与y正相关,x与z负相关
C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关
【变式1-3】(2022春·陕西渭南·高一期末)根据如下样本数据:
得到线性回归方程为,则( )
A.B.C.D.
【题型2 残差的计算】
【方法点拨】
根据题目条件,得出经验回归方程,再进行残差的计算.
【例2】(2022春·湖北·高二期末)某城市选用一种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为ycm,测得一些数据如下表所示:
由表格中数据可得y关于x的经验回归方程为,则第7天的残差为( )
A.1.12B.2.12C.D.
【变式2-1】(2023春·河南开封·高三开学考试)某部门统计了某地区今年前7个月在线外卖的规模如下表:
其中4、6两个月的在线外卖规模数据模糊,但这7个月的平均值为23.若利用回归直线方程来拟合预测,且7月相应于点的残差为,则( )
A.1.0B.2.0C.3.0D.4.0
【变式2-2】(2022春·河南许昌·高二期末)为研究变量x,y的相关关系,收集得到下面五个样本点(x,y):
若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为1.1的样本点是( )A.(5.5,9)B.(6.5,8)C.(7,6)D.(7.5,4)
【变式2-3】(2022春·江苏宿迁·高二阶段练习)在对具有线性相关的两个变量和进行统计分析时,得到如下数据:
由表中数据求得关于的回归方程为,则,,这三个样本数据中,残差的绝对值最小的是( )
A.B.C.D.和
【题型3 刻画回归效果的方式】
【方法点拨】
根据刻画回归效果的三种方式,结合具体题目条件,选取适当的方式来刻画模型的拟合效果,即可得解.
【例3】(2022秋·宁夏银川·高三开学考试)下列说法正确的个数是( )
(1)在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差
(2)某地气象局预报:6月9日本地降水概率为90%,结果这天没下雨,这表明天气预报并不科学
(3)回归分析模型中,残差平方和越小,说明模型的拟合效果越好
(4)在回归直线方程,当解释变量每增加1个单位时,预报变量多增加0.1个单位
A.2B.3C.4D.1
【变式3-1】(2022春·山东菏泽·高二期末)关于线性回归的描述,下列命题错误的是( )
A.回归直线一定经过样本点的中心B.残差平方和越小,拟合效果越好
C.决定系数越接近1,拟合效果越好D.残差平方和越小,决定系数越小
【变式3-2】(2022秋·广东广州·高三阶段练习)对两个变量和进行回归分析,得到一组样本数据,,…,则下列说法不正确的是( )
A.若变量和之间的相关系数为,则变量和之间具有较强的线性相关关系
B.残差平方和越小的模型,拟合的效果越好
C.用决定系数来刻画回归效果,越小说明拟合效果越好
D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
【变式3-3】(2022春·甘肃天水·高二阶段练习)关于线性回归的描述,有下列命题:
①回归直线一定经过样本中心点;
②相关系数的绝对值越大,拟合效果越好;
③相关指数越接近1拟合效果越好;
④残差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1B.2C.3D.4
【题型4 代入法求线性经验回归方程】
【方法点拨】
经验回归直线一定经过样本点的中心( SKIPIF 1 < 0 , SKIPIF 1 < 0 ),求出样本点的中心后代入线性回归方程求解相应字母.
【例4】(2023秋·四川广安·高二阶段练习)已知两个变量和之间存在线性相关关系,某兴趣小组收集了一组,的样本数据如下表所示:
根据表中数据利用最小二乘法得到的回归方程是( )
A.B.
C.D.
【变式4-1】(2022秋·陕西榆林·高二期中)已知,的取值如下表所示:
若与线性相关,且,则( )
A.2.2B.2.9C.2.8D.2.6
【变式4-2】(2023秋·河南焦作·高二期末)某产品的广告费用x与销售额y的统计数据如表:
根据如表可得回归方程中的为7.根据此模型预测广告费用为10万元时销售额为( )万元A.63.6B.75.5C.73.5D.72.0
【变式4-3】(2023秋·四川宜宾·高二期末)某小区流感大爆发,当地医疗机构使用中西医结合的方法取得了不错的成效,每周治愈的患者人数如表所示,由表格可得y关于x的线性经验回归方程为,则测此回归模型第4周的治愈人数为( )
A.B.C.D.
【题型5 经验回归模型的应用】
【方法点拨】
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是响应变量;
(2)画出解释变量和响应变量的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)确定经验回归方程的类型(如我们观察到数据呈线性关系,则选用线性经验回归方程);
(4)按一定规则(如最小二乘法)估计经验回归方程中的参数;
(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,残差呈现不随机的规律性等),若存在异
常,则检查数据是否有误,或模型是否合适等.
【例5】(2023秋·四川雅安·高二期末)某连锁经营公司所属5个零售店某月的销售额和利润额资料如表.
(1)若销售额和利润额具有相关关系,用最小二乘法计算利润额y对销售额x的回归直线方程.
(参考公式,)
(2)若该公司计划再开一个店想达到预期利润为8百万,请预估销售额需要达到多少?
【变式5-1】(2023·全国·模拟预测)目前手机已经成为人们生活中的必需品,国内市场已经进入成熟期,下表是2016—2021年某市手机总体出货量(单位:万部)统计表.
(1)已知该市手机总体出货量y与年份代码x之间可用线性回归模型拟合,求y关于x的线性回归方程(系数精确到0.01);
(2)预测2022年该市手机总体出货量.
附:线性回归方程中斜率与截距的最小二乘估计公式分别为,.
【变式5-2】(2023秋·四川成都·高二期末)某工厂统计2022年销售网点数量与售卖出的产品件数的数据如下表:
假定该工厂销售网点的个数与售卖出的产品件数呈线性相关关系,
(1)求2022年售卖出的产品件数y(单位:万件)关于销售网点数x(单位:个)的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测2022年该工厂建立40个销售网点时售卖出的产品件数.
参考公式:,.
【变式5-3】(2023·山东·模拟预测)我国技术给直播行业带来了很多发展空间,加上受疫情影响,直播这种成本较低的获客渠道备受商家青睐,某商场统计了2022年1~5月某商品的线上月销售量y(单位:千件)与售价x(单位:元/件)的情况如下表示.
(1)求相关系数,并说明是否可以用线性回归模型拟合与的关系(当时,可以认为两个变量有很强的线性相关性;否则,没有很强的线性相关性)(精确到0.01);
(2)建立关于的线性回归方程,并估计当售价为元/件时,该商品的线上月销售量估计为多少千件?
(3)若每件商品的购进价格为元/件,如果不考虑其他费用,由(2)中结论,当商品售价为多少时,可使得该商品的月利润最大?(该结果保留整数)
参考公式:对于一组数据,相关系数,其回归直线的斜率和截距的最小二乘估计分别为:.参考数据:.
【题型6 非线性经验回归方程的求法】
【方法点拨】
(1)作散点图确定曲线模型:曲线所对应的函数种类繁多,这就要求我们充分想象,大胆猜测拟合函数类型,
粗略估计使用哪个函数拟合.
(2)非线性转化为线性:先通过适当变换化非线性关系为线性关系,然后按照线性检验回归方程的求解步骤
进行求解.
(3)分析模型的拟合效果,得出结论.
【例6】(2023·陕西西安·统考一模)为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:
(1)判断(为常数)与(为常数,且)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(为常数,且),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值,
(ⅰ)证明:对于非线性回归方程,令,可以得到繁殖个数的对数z关于天数x具有线性关系(即为常数);
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).
附:对于一组数据其回归直线方程的斜率和截距的最小二乘估计分别为.
【变式6-1】(2023·云南·高三阶段练习)近年来,云南省保山市龙陵县紧紧围绕打造“中国石斛之乡”的发展定位,大力发展石斛产业,该产业带动龙陵县近四分之一人口脱贫致富.2022年8月,龙陵紫皮石斛获国家地理标志运用促进工程重点项目,并被评为优秀等次.在政府的大力扶持下,龙陵紫皮石斛产量逐年增长,2017年底到2022年底龙陵县石斛产量统计如下及散点图如图.
(1)根据散点图判断,与(a,b,c,d均为常数)哪一个更适合作为龙陵县紫皮石斛产量y关于年份代码x的回归方程类型?(给出判断即可,不必说明理由)
(2)经计算得下表中数据,根据(1)中结果,求出y关于x的回归方程;
其中.
(3)龙陵县计划到2025年底实现紫皮石斛年产量达1.5万吨,根据(2)所求得的回归方程,预测该目标是否能完成?(参考数据:)
附:,.
【变式6-2】(2023·江西抚州·高三开学考试)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022年中国车载音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1—5.
(1)由上表数据知,可用指数函数模型拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);
(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.
参考数据:
其中,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
【变式6-3】(2023·全国·高三专题练习)某企业为改进生产,现 某产品及成本相关数据进行统计.现收集了该产品的成本费y(单位:万元/吨)及同批次产品生产数量x(单位:吨)的20组数据.现分别用两种模型①,②进行拟合,据收集到的数据,计算得到如下值:
表中,.
若用刻画回归效果,得到模型①、②的值分别为,.
(1)利用和比较模型①、②的拟合效果,应选择哪个模型?并说明理由;
(2)根据(1)中所选择的模型,求y关于x的回归方程;并求同批次产品生产数量为25(吨)时y的预报值.
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计分别为,.X
3
4
5
6
7
Y
4.0
-0.5
0.5
第x天
1
2
3
4
5
6
7
高度y/cm
1
4
6
9
11
12
13
月份代号x
1
2
3
4
5
6
7
在线外卖规模y(百万元)
11
13
18
★
28
★
35
x
5.5
6.5
7
7.5
8.5
y
9
8
6
4
3
4
8
10
12
1
2
3
5
6
1
2
3
4
5
0.5
0.6
1
1.4
1.5
x
0
1
3
4
y
2.2
4.3
4.8
6.7
广告费用x(万元)
3
4
5
6
销售额y(万元)
25
30
40
45
周数(x)
1
2
3
4
5
治愈人数(y)
5
15
35
?
140
商店名称
A
B
C
D
E
销售额x(千万元)
3
5
6
7
9
利润额y(千万元)
2
3
3
4
5
年份
2016年
2017年
2018年
2019年
2020年
2021年
年份代码
1
2
3
4
5
6
手机总体出货量/万部
5.6
4.9
4.1
3.9
3.2
3.5
销售网点数x(单位:个)
17
19
20
21
23
售卖出的产品件数y(单位:万件)
21
22
25
27
30
月份
1
2
3
4
5
售价x(元/件)
60
56
58
57
54
月销售量y(千件)
5
9
7
10
9
天数x
1
2
3
4
5
6
繁殖个数y
3
6
13
25
45
100
3.50
32
2.85
17.5
307
12.12
年份
2017
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
6
紫皮石斛产量y(吨)
3200
3400
3600
4200
7500
9000
3.5
5150
8.46
17.5
20950
3.85
年份代码x
1
2
3
4
5
车载音乐市场规模y
2.8
3.9
7.3
12.0
17.0
1.94
33.82
1.7
1.6
14.5
0.08
665
0.04
-450
4
人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.1 成对数据的相关关系练习: 这是一份人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.1 成对数据的相关关系练习,文件包含人教A版高中数学选择性必修三同步培优讲义专题81成对数据的统计相关性重难点题型精讲教师版doc、人教A版高中数学选择性必修三同步培优讲义专题81成对数据的统计相关性重难点题型精讲原卷版doc等2份试卷配套教学资源,其中试卷共21页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册7.2 离散型随机变量及其分布列精品达标测试: 这是一份高中数学人教A版 (2019)选择性必修 第三册7.2 离散型随机变量及其分布列精品达标测试,文件包含人教A版高中数学选择性必修三同步培优讲义专题73离散型随机变量及其分布列重难点题型精讲教师版doc、人教A版高中数学选择性必修三同步培优讲义专题73离散型随机变量及其分布列重难点题型精讲原卷版doc等2份试卷配套教学资源,其中试卷共32页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第二册5.3 导数在研究函数中的应用优秀课时作业: 这是一份高中数学人教A版 (2019)选择性必修 第二册5.3 导数在研究函数中的应用优秀课时作业,文件包含人教A版高中数学选择性必修二同步培优讲义专题55导数在研究函数中的应用重难点题型精讲教师版doc、人教A版高中数学选择性必修二同步培优讲义专题55导数在研究函数中的应用重难点题型精讲原卷版doc等2份试卷配套教学资源,其中试卷共48页, 欢迎下载使用。