所属成套资源:【高考数学之解题思路培养】高考数学一轮复习解答题拿分秘籍(全国通用版)
专题06 非线性回归方程(原卷版)-【高考数学之解题思路培养】(全国通用版)学案
展开这是一份专题06 非线性回归方程(原卷版)-【高考数学之解题思路培养】(全国通用版)学案,共17页。学案主要包含了例题讲解,实战练习等内容,欢迎下载使用。
概率与统计
专题六:非线性回归方程
一、必备秘籍
当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:
曲线方程 | 变换公式 | 变换后的线性关系式 |
建立非线性经验回归模型的基本步骤
1.确定研究对象,明确哪个是解释变量,哪个是响应变量;
2.由经验确定非线性经验回归方程的模型;
3.通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);
4.按照公式计算经验回归方程中的参数,得到经验回归方程;
5.消去新元,得到非线性经验回归方程;
6.得出结果后分析残差图是否有异常 .
二、例题讲解
1.(2021·全国高三专题练习(文))人类已经进入大数据时代.目前,数据量级已经从(1=1024)级别跃升到(1=1024),(1=1024)乃至(1=1024)级别.国际数据公司(IDC)研究结果表明,2008年全球产生的数据量为0.49,2009年数据量为0.8,2010年增长到1.2,2011年数据量更是高达1.82.下表是国际数据公司(IDC)研究的全球近6年每年产生的数据量(单位:)及相关统计量的值:
年份 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | ||||||
序号 | 1 | 2 | 3 | 4 | 5 | 6 | ||||||
年数据量 | 6.6 | 8.6 | 16.1 | 21.6 | 33.0 | 41.0 | ||||||
3.5 | 21.15 | 2.85 | 17.58 | 13.82 | 125.35 | 6.73 | ||||||
表中,.
(1)根据上表数据信息判断,方程(是自然对数的底数)更适宜作为该公司统计的年数据量y关于年份序号x的回归方程类型,试求此回归方程(精确到0.01).
(2)有人预计2021年全世界产生的数据规模将超过2011年的50倍.根据(1)中的回归方程,说明这种判断是否准确,并说明理由.
参考数据:,,回归方程中,斜率最小二乘法公式为,.
2.(2021·全国高三专题练习(文))有一种速度叫中国速度,有一种骄傲叫中国高铁.中国高铁经过十几年的发展,取得了举世瞩目的成就,使我国完成了从较落后向先进铁路国的跨越式转变.中国的高铁技术不但越来越成熟,而且还走向国外,帮助不少国家修建了高铁.高铁可以说是中国一张行走的名片.截至到2020年,中国高铁运营里程已经达到3.9万公里.下表是2013年至2020年中国高铁每年的运营里程统计表,它反映了中国高铁近几年的飞速发展:
年份 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 |
年份代码 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
运营里程万公里 | 1.3 | 1.6 | 1.9 | 2.2 | 2.5 | 2.9 | 3.5 | 3.9 |
根据以上数据,回答下面问题.
(1)甲同学用曲线来拟合,并算得相关系数,乙同学用曲线来拟合,并算得转化为线性回归方程所对应的相关系数,试问哪一个更适合作为关于的回归方程类型,并说明理由;
(2)根据(1)的判断结果及表中数据,求关于的回归方程(系数精确到).
参考公式:用最小二乘法求线性回归方程的系数公式:;参考数据:令
三、实战练习
1.(2021·山东菏泽·高三二模)“十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为2021年到2025年.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额和年盈利额数据进行分析,建立了两个函数模型:
;,其中, ,, 均为常数,为自然对数的底数
令,经计算得如下数据:,,,,,,,,,,问:
(1)请从相关系数的角度,分析哪一个模型拟合度更好?
(2)根据(1)的选择及表中数据,建立,关于的回归方程(系数精确到0.01)
(3)若希望2021年盈利额y为500亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)
附:①相关系数r=
回归直线中:,
参考数据:,.
2.(2021·重庆高三三模)近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:千件)之间的关系,对该网点近5天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.
4 | 5.16 | 0.415 | 2.028 | 30 | 0.507 |
表中,.
(1)根据散点图判断,与哪一个适宜作为关于的回归方程类型?并根据判断结果及表中数据求出关于的回归方程;
(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量、提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数(单位:千件)与单件快递的平均价格(单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:
①预测该网点某天揽收2000件快递可获得的总利润;
②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.
3.(2021·安徽蚌埠二中高三模拟预测(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共计11次累计确诊人数(万).
日期(月/日) | 4/09 | 5/04 | 5/29 | 6/23 | 7/18 | 8/13 |
统计时间序号 | 1 | 2 | 3 | 4 | 5 | 6 |
累计确认人数 | 43.3 | 118.8 | 179.4 | 238.8 | 377.0 | 536.0 |
日期(月/日) | 9/06 | 10/01 | 10/26 | 11/19 | 12/14 |
|
统计时间序号 | 7 | 8 | 9 | 10 | 11 |
|
累计确认人数 | 646.0 | 744.7 | 888.9 | 1187.4 | 1673.7 |
|
(1)将4月9日作为第1次统计,若将统计时间序号作为变量,每次累计确诊人数作为变量,得到函数关系,对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值,,,,,,,,,,根据相关数据,确定该函数关系式(参数,的取值精确到0.01);
(2)为了了解患新冠肺炎与年龄的关系,已知某地曾患新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少有一人是老年人的概率.
参考公式:线性回归方程中,,;
4.(2021·贵州(理))某二手车交易市场对2020年某品牌二手车的交易进行了统计,得到如图所示的频率分布直方图和散点图.用表示该车的使用时间(单位:年),表示其相应的平均交易价格(单位:万元).
(Ⅰ)已知2020年在此交易市场成交的该品牌二手车为辆,求使用时间在的车辆数;
(Ⅱ)由散点图分析后,可用作为此交易市场上该种车辆的平均交易价格关于其使用时间的回归方程.
5.5 | 9 | 2 | 300 | 80 | 385 |
表中,.根据上述相关数据,求关于的回归方程.
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
5.(2021·河南洛阳市·高三二模(理))某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间近似满足关系式(、为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品.现随机抽取件合格产品,测得数据如下:
尺寸 | 38 | 48 | 58 | 68 | 78 | 88 |
质量 | 16.8 | 18.8 | 20.7 | 22.4 | 24 | 25.5 |
质量与尺寸的比 | 0.442 | 0.392 | 0.357 | 0.329 | 0.308 | 0.290 |
(1)现从抽取的件合格产品中再任选件,记为取到优等品的件数,试求随机变量的期望;
(2)根据测得数据作了初步处理,得相关统计量的值如表:
(i)根据所给统计量,求关于的回归方程;
(ii)已知优等品的收益(单位:千元)与、的关系为,则当优等品的尺寸为何值时,收益的预报值最大?
附:对于样本,其回归直线的斜率和截距的最小二乘估计公式分别为:,,.
6.(2021·全国(文))2020年新型冠状病毒肺炎疫情席卷金球,我国在全力保障口罩、防护服等医疗物资供给基础上,重点开展医疗救治急需的呼吸机、心电监护仪等医疗设备的组织生产和及时供应,统筹协调医用物资生产企业高速生产,支援世界各国抗击肺炎疫情.我市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1目~9月9日连续9天的呼吸机日生产量为(单位:百台,),数据作了初步处理;得到如图所示的散点图.
2.73 | 19 | 5 | 285 | 1095 |
注:图中日期代码1~9分别对应9月1日~9月9日;表中,
(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;
(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.
参考公式:回归直线方程是;, ,
参考数据:.
7.(2021·全国高三专题练习)某公司为了了解年研发资金投人量(单位:亿元)对年销售额(单位:亿元)的影响.对公司近年的年研发资金投入量和年销售额的数据,进行了对比分析,建立了两个函数模型:①,②,其中、、、均为常数,为自然对数的底数.并得到一些统计量的值.令,,经计算得如下数据:
2 | ||||||
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)①根据(1)的选择及表中数据,建立关于的回归方程;
②若下一年销售额需达到亿元,预测下一年的研发资金投入量是多少亿元?
附:相关系数:,回归直线中公式分别为:,;
参考数据:,,.
8.(2021·四川达州·高三二模(理))在能源和环保的压力下,新能源汽车将成为未来汽车的发展方向.我国大力发展新能源汽车的生产和销售.某市近6年的新能源汽车保有量数据如下表
年份代号x | 1 | 2 | 3 | 4 | 5 | 6 |
保有量y(万辆) | 1 | 1.8 | 2.7 | 4 | 5.9 | 9.2 |
(1)从这6年中任意选取两年,求这两年中仅有1年的新能源汽车保有量大于4万辆的概率;
(2)用函数模型对两个变量x,y的关系进行拟合,根据表中数据求出y关于x的回归方程(条数精确到0.01).
参考数据:,,;设.
参考公式:回归直线的斜率和截距的最小二乘估计公式分别为:.
9.(2021·陕西高三二模(理))为了迎接十四运,提高智慧城市水平,西安公交公司近期推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表下所示:
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
6 | 11 | 21 | 34 | 66 | 101 | 196 |
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(均为大于零的常数),哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中的数据,建立与的回归方程,并预测活动推出第天使用扫码支付的人次;
(3)推广期结束后,车队对乘客的支付方式进行统计,结果如下表:
支付方式 | 现金 | 乘车卡 | 扫码 |
比例 |
西安公交六公司车队为缓解周边居民出行压力,以万元的单价购进了一批新车,根据以往的经验可知,每辆车每个月的运营成本约为万元.已知该线路公交车票价为元,使用现金支付的乘客无优惠,使用乘车卡支付的乘客享受折优惠,扫码支付的乘客随机优惠,根据统计结果得知,使用扫码支付的乘客中有的概率享受折优惠,有的概率享受折优惠,有的概率享受折优惠.预计该车队每辆车每个月有万人次乘车,根据所给数据以事件发生的频率作为相应事件发生的概率,在不考虑其它因素的条件下,按照上述收费标准,请你估计这批车辆需要几年(结果取整数年)才能盈利?
参考数据:
其中其中,,
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
10.(2021·吉林高三模拟预测(文))全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入(百万元)与收益(百万元)的数据统计如下:
科技投入 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
收益 | 19 | 20 | 22 | 31 | 40 | 50 | 70 |
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
5 | 140 | 1239 | 149 | 2134 | 130 |
其中,.
(1)请根据表中数据,建立关于的回归方程(系数精确到);
(2)①乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的决定系数(即相关指数),试比较甲乙两人所建立的模型,谁的拟合效果更好?
②由①所得的结论,计算该企业欲使收益达到亿元,科技投入的费用至少要多少百万元?(精确到)
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为,,决定系数:.参考数据:.
11.(2021·江西(文))每年的4月23日是联合国教科文组织确定的“世界读书日”,又称“世界图书和版权日”.从进入大数据时代以来,人们阅读方式发生了改变,数字媒体阅读方式因为便携,容量大等优点越来越被大众接受,下表是国际数据公司(IDC)研究的全球近年每年数字媒体阅读产生的数据量(单位:)及相关统计量的值:
年份 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | ||||||
序号 | ||||||||||||
年数据量 | ||||||||||||
表中,.
(1)根据上表数据信息判断,方程(是自然对数的底数)更适宜作为该公司统计的年数据量关于年份序号的回归方程类型,试求此回归方程;
(2)根据(1)中的回归方程,预计2024年全世界数字媒体阅读产生的数据量是2021年的多少倍?并说明理由.(参考数据:,,结果精确到)
参考数据:回归方程中,斜率最小二乘法公式为,.
12.(2021·山东济宁一中高三开学考试)某公司对某产品作市场调研,获得了该产品的定价(单位:万元/吨)和一天销售量(单位:吨)的一组数据,制作了如下的数据统计表,并作出了散点图.
0.33 | 10 | 3 | 0.164 | 100 | 68 | 350 |
表中,,.
(1)根据散点图判断,与哪一个更适合作为关于的回归方程;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,试建立y关于x的回归方程;
(3)若生产1吨该产品的成本为0.20万元,依据(2)的回归方程,预计定价为多少时,该产品一天的利润最大,并求此时的月利润.(每月按30天计算,计算结果保留两位小数)
(参考公式:回归方程,其中,)
相关学案
这是一份专题02 超几何分布(原卷版)-【高考数学之解题思路培养】(全国通用版)学案,共14页。学案主要包含了必备秘籍,例题讲解,实战练习等内容,欢迎下载使用。
这是一份专题06 数列求和(分组法、倒序相加法)(原卷版)-【高考数学之解题思路培养】(全国通用版)学案,共7页。
这是一份专题07 极值点偏移问题 (原卷版)-【高考数学之解题思路培养】 (全国通用版) 学案,共7页。学案主要包含了必备秘籍,例题讲解,实战练习等内容,欢迎下载使用。