专题05 回归直线方程(原卷版)-【高考数学之解题思路培养】(全国通用版)学案
展开概率与统计
专题五:回归直线方程
一、必备秘籍
1.两个变量线性相关
(1)散点图:将样本中个数据点(i=1,2,…,)描在平面直角坐标系中得到的图形.
(2)正相关与负相关
①正相关:散点图中的点散布在从左下角到右上角的区域.
②负相关:散点图中的点散布在从左上角到右下角的区域.
2.回归直线的方程
(1)回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程:回归直线对应的方程叫回归直线的方程,简称回归方程.
(3)回归方程的推导过程:
①假设已经得到两个具有线性相关关系的变量的一组数据,,.
②设所求回归方程为,其中是待定参数.
③由最小二乘法得
其中,是回归方程的斜率,是截距.
二、例题讲解
1.(2021·哈尔滨市呼兰区第一中学校高三模拟预测(文))十三届全国人大三次会议表决通过了《中华人民共和国民法典》这部法律自年月日起施行,某市相关部门进行法律宣传,某宣传小分队记录了前周每周普及宣传的人数与时间的数据,得到下表:
时间周 | |||||
人数 |
(1)若可用线性回归模型拟合与的关系,求关于的线性回归方程;
(2)利用(1)的回归方程,预测该宣传小分队第7周普及宣传(民法典)的人数.
参考公式及数据:回归方程中斜率和截距的最小二乘估计公式分别为,,.
2.(2021·合肥市第六中学高三模拟预测(文))树木根部半径与树木的高度呈正相关,即树木根部越粗,树木的高度也就越高.某块山地上种植了树木,某农科所为了研究树木的根部半径与树木的高度之间的关系,从这些地块中用简单随机抽样的方法抽取6棵树木,调查得到树木根部半径(单位:米)与树木高度(单位:米)的相关数据如表所示:
0.1 | 0.2 | 0.3 | 0.4 | 0.5 | 0.6 | |
1.1 | 1.3 | 1.6 | 1.5 | 2.0 | 2.1 |
(1)求关于的线性回归方程;
(2)对(1)中得到的回归方程进行残差分析,若某树木的残差为零则认为该树木“长势标准”,在此片树木中随机抽取1棵树木,估计这棵树木“长势标准”的概率.
参考公式:回归直线方程为,其中,.
三、实战练习
1.(2021·湖南师大附中高三月考)今年五月,某医院健康管理中心为了调查成年人体内某种自身免疫力指标,从在本院体检的人群中随机抽取了100人,按其免疫力指标分成如下五组:,其频率分布直方图如图1所示.今年六月,某医药研究所研发了一种疫苗,对提高该免疫力有显著效果.经临床检测,将自身免疫力指标比较低的成年人分为五组,各组分别按不同剂量注射疫苗后,其免疫力指标y与疫苗注射量x个单位具有相关关系,样本数据的散点图如图2所示.
(1)健管中心从自身免疫力指标在内的样本中随机抽取3人调查其饮食习惯,记表示这3人中免疫力指标在内的人数,求的分布列和数学期望;
(2)由于大剂量注射疫苗会对身体产生一定的副作用,医学部门设定:自身免疫力指标较低的成年人注射疫苗后,其免疫力指标不应超过普通成年人群自身免疫力指标平均值的3倍.以健管中心抽取的100人作为普通人群的样本,据此估计疫苗注射量不应超过多少个单位.
附:对于一组样本数据,其回归直线的斜率和截距的最小二乘估计值分别为.
2.(2021·安徽师范大学附属中学(理))根据国际疫情形势以及传染病防控的经验,加快新冠病毒疫苗接种是当前有力的防控手段,我国正在安全、有序加快推进疫苗接种工作,某乡村采取通知公告、微信推送、广播播放、条幅宣传等形式,积极开展疫苗接种社会宣传工作,消除群众疑虑,提高新冠疫苗接种率,让群众充分地认识到了疫苗接种的重要作用,自宣传开始后村干部统计了本村名居民(未接种)的一个样本,天内每天新接种疫苗的情况,如下统计表:
第天 | |||||
新接种人数 |
(1)建立关于的线性回归方程;
(2)假设全村共计名居民(均未接种过疫苗),用样本估计总体来预测该村居民接种新冠疫苗需要几天?
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:,.
3.(2021·九龙坡·重庆市育才中学高三月考)随着城市规模的扩大和人们生活水平的日益提高,某市近年机动车保有量逐年递增.根据机动车管理部门的统计数据,以5年为一个研究周期,得到机动车每5年纯增数据情况为:
年度周期 | 1995~2000 | 2000~2005 | 2005~2010 | 2010~2015 | 2015~2020 |
时间变量 | 1 | 2 | 3 | 4 | 5 |
纯增数量(单位:万辆) | 3 | 6 | 9 | 15 | 27 |
其中,时间变量对应的机动车纯增数据为,且通过数据分析得到时间变量与对应的机动车纯增数量(单位:万辆)具有线性相关关系.
(1)求机动车纯增数量(单位:万辆)关于时间变量的回归方程,并预测2025~2030年间该市机动车纯增数量的值;
附:回归直线方程中斜率和截距的最小二乘估计公式分别为:;.
(2)该市交通管理部门为了了解市民对“单双号限行”的赞同情况,随机采访了200名市民,将他们的意见和是否拥有私家车情况进行了统计,得到如下的列联表:
| 赞同限行 | 不赞同限行 | 合计 |
没有私家车 | 85 | 15 | 100 |
有私家车 | 75 | 25 | 100 |
合计 | 160 | 40 | 200 |
根据上面的列联表判断,能否有95%的把握认为“对限行的意见与是否拥有私家车”有关.
附:,.
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
4.(2021·贵州贵阳·高三月考(理))据贵州省气候中心报,2021年6月上旬,我省降水量在15.2-170.3mm之间,毕节市局地、遵义市北部、铜仁市局地和黔东南州东南部不足50mm,其余均在50mmm以上,局地超过100mm.若我省某地区2021年端午节前后3天,每一天下雨的概率均为.通过模拟实验的方法来估计该地区这3天中恰好有2天下雨的概率,利用计算机或计算器可以产生0到9之间取整数值的随机数(,且)表示是否下雨:当时表示该地区下雨,当时,表示该地区不下雨.因为是3天,所以每三个随机数作为一组,从随机数表中随机取得20组数如下:
332 714 740 945 593 468 491 272 073 445
992 772 951 431 169 332 435 027 898 719
(1)求出k的值,使得该地区每一天下雨的概率均为;并根据上述20组随机数估计该地区这3天中恰好有2天下雨的概率;
(2)2016年到2020年该地区端午节当天降雨量(单位:mm)如表:
时间 | 2016年 | 2017年 | 2018年 | 2019年 | 2020年 |
年份 | 1 | 2 | 3 | 4 | 5 |
降雨量 | 28 | 27 | 25 | 23 | 22 |
经研究表明:从2016年到2020年,该地区端午节有降雨的年份的降雨量与年份具有线性相关关系,求回归直线方程.并预测该地区2022年端午节有降雨的话,降雨量约为多少?
参考公式:,.
5.(2021·重庆高三月考)为了研究义务教育阶段学生的数学核心素养与抽象能力指标分、推理能力指标分、建模能力指标分的相关性,其中,,,并将它们各自量化为一级、二级、三级3个等级,再用综合指标的值评定学生的数学核心素养,若,则数学核心素养为一级若,则数学核心素养为二级若,则数学核心素养为三级,为了了解重庆市1年级至9年级在校学生的数学核心素养,调查人员随机抽取了该地的五个年级,访问了每个年级的2个学生,统计得到这10个学生的如下数据:
年级 | 2 | 4 | 5 | 6 | 8 |
数学核心素养分 | 29,31 | 38,42 | 47,53 | 56,64 | 69,71 |
数学核心素养平均分分 | 30 | 40 | 50 | 60 | 70 |
(1)画出散点图,并判断,之间是否具有相关关系
(2)若,之间具有线性相关关系,试估计重庆市9年级的学生数学核心素养平均分为多少
(3)在这10名学生中任取三人,其中数学核心素养等级是一级的学生人数记为,求随机变量的分布列和数学期望.
附:①参考数据:,
②求线性回归方程的系数公式,
6.(2021·沙坪坝·重庆南开中学高三月考)近年来,学生职业生涯规划课程逐渐进入课堂,考生选择大学就读专业时不再盲目扎堆热门专业,报考专业分布更加广泛,报考之前较冷门专业的人数也逐年上升.下表是某高校专业近五年来在某省录取平均分与当年该大学的最低提档线对照表:
年份 | 2017 | 2018 | 2019 | 2020 | 2021 |
年份代码() | |||||
该校最低提档分数线 | |||||
专业录取平均分 | |||||
专业录取平均分与提档线之差() |
(1)根据上表数据可知,与之间存在线性相关关系,用最小二乘法求关于的线性回归方程;
(2)据以往数据可知,该大学专业每年录取分数服从正态分布,其中为当年该大学专业录取的平均分. 假设2022年该大学最低提档线为分.
①利用(1)的结果预测2022年专业录取平均分;
②若某同学2022年高考考了分,该大学专业在该省共录取100人,录取成绩前五名的学生可以获得一等奖学金,请问该同学能否获得该奖学金?请说明理由.
参考公式:,.
参考数据:,,.
7.(2021·全国(理))某药厂为了了解某新药的销售情况,将今年2至6月份的销售额整理得到如下图表:
月份 | 2 | 3 | 4 | 5 | 6 |
销售额(万元) | 19 | 25 | 35 | 37 | 42 |
(1)根据2至6月份的数据,求出每月的销售额关于月份的线性回归方程;
(2)根据所求线性回归方程预测该药厂今年第三季度(7,8,9月份)这种新药的销售总额.
(参考公式:,)
8.(2021·眉山市彭山区第一中学(文))为助力湖北新冠疫情后的经济复苏,某电商平台为某工厂的产品开设直播带货专场.为了对该产品进行合理定价,用不同的单价在平台试销,得到如下数据:
单价(元/件) | 8 | 8.2 | 8.4 | 8.6 | 8.8 | 9 |
销量(万件) | 90 | 84 | 83 | 80 | 75 | 68 |
(1)根据以上数据,求关于的线性回归方程;
(2)若该产品成本是7元/件,假设该产品全部卖出,预测把单价定为多少时,工厂获得最大利润?
(参考公式:回归方程,其中,)
9.(2021·四川内江·高三其他模拟(文))为了选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生,教育部开展了招生改革工作——强基计划.现对某高中学校学生对强基课程学习的情况进行调查,在参加数学和物理的强基计划课程学习的学生中,随机抽取了名学生.
(1)在某次数学强基课程的测试中,这名学生成绩的统计数据如茎叶图所示,其中某男生的成绩被污损(为整数),求女生的平均分数超过男生的平均分数的概率.
男生 |
| 女生 | ||||
| ||||||
|
(2)已知学生的物理成绩与数学成绩是线性相关的,现统计了小明同学连续次在强基课程测试中的数学和物理成绩(如下表).若第次测试该生的数学成绩达到,请你估计第次测试他的物理成绩大约是多少?
数学成绩 | |||||
物理成绩 |
附:,.
10.(2021·全国高三模拟预测(文))发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:
年份 | 2015 | 2016 | 2017 | 2018 | 2019 |
编号 | 1 | 2 | 3 | 4 | 5 |
年光伏发电量(亿千瓦时) | 395 | 665 | 1178 | 1775 | 2243 |
其中.
(1)请用相关系数说明是否可用线性回归模型拟合年光伏发电量与的关系;
(2)建立年光伏发电量关于的线性回归方程,并预测2021年年光伏发电量(结果保留整数).
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为, ,
11.(2021·全国高三其他模拟(文))实施新规后,某商场2020年1月份至10月份的收入情况如表.
月份 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
收入(万元) | 10 | 12 | 15 | 13 | 16 | 17 | 15 | 16 | 16 | 20 |
并计算得,,,.
(1)是否可用线性回归模型拟合与的关系?请用相关系数加以说明;(当时,那么变量,有较强的线性相关关系)
(2)建立关于的回归方程(结果保留1位小数),并预测该商场12月份的收入情况.(结果保留整数)
附:,,.
专题02 超几何分布(原卷版)-【高考数学之解题思路培养】(全国通用版)学案: 这是一份专题02 超几何分布(原卷版)-【高考数学之解题思路培养】(全国通用版)学案,共14页。学案主要包含了必备秘籍,例题讲解,实战练习等内容,欢迎下载使用。
专题07 极值点偏移问题 (原卷版)-【高考数学之解题思路培养】 (全国通用版) 学案: 这是一份专题07 极值点偏移问题 (原卷版)-【高考数学之解题思路培养】 (全国通用版) 学案,共7页。学案主要包含了必备秘籍,例题讲解,实战练习等内容,欢迎下载使用。
专题06 非线性回归方程(原卷版)-【高考数学之解题思路培养】(全国通用版)学案: 这是一份专题06 非线性回归方程(原卷版)-【高考数学之解题思路培养】(全国通用版)学案,共17页。学案主要包含了例题讲解,实战练习等内容,欢迎下载使用。