- 第40练 两个原理、排列组合(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用) 试卷 0 次下载
- 第41练 二项式定理(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用) 试卷 0 次下载
- 第42练 随机事件的概率与古典概型(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用) 试卷 0 次下载
- 第43练 离散型随机变量的分布列、均值、方差(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用) 试卷 0 次下载
- 第49练 独立性检验(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用) 试卷 0 次下载
第48练 变量间的相关关系(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用)
展开1.(人A选择性必修三P103习题8.1T1变式)对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A.B.
C.D.
【答案】A
【解析】由题中的散点图可以看出,图1和图3是正相关,相关系数大于0,则,,
图2和图4是负相关,相关系数小于0,则,,
图3和图4的点相对于图1和图2更加集中,所以相关性较强,所以更接近于1,更接近于,由此可得.故选A.
2.(人A选择性必修三P103习题8.1T3变式)若一组观测值,,…,()对应的点位于同一直线上,则x,y的相关系数为______.
【答案】
【解析】由已知条件和相关系数的定义得,x,y的相关系数为.
3.(人A选择性必修三P120练习T2变式)某生物兴趣小组为研究一种红铃虫的产卵数y与温度x(单位:℃)的关系.现收集了7组观测数据得到下面的散点图:
由此散点图,在20℃至36℃之间,下面四个回归方程类型中最适宜作为红铃虫产卵数y和温度x的回归方程类型的是( )
A.B.C.D.
【答案】C
【解析】由散点图可以看出红铃虫产卵数y随着温度x的增长速度越来越快,
所以最适宜作为红铃虫产卵数y和温度x的回归方程类型.故选C
4.(人A选择性必修三P120习题9.2T4变式)某科技公司研发了一项新产品,经过市场调研,对公司1月份至6月份销售量及销售单价进行统计,销售单价(千元)和销售量(千件)之间的一组数据如下表所示:
(1)试根据1至5月份的数据,建立关于的回归直线方程;
(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过千件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?
参考公式:回归直线方程,其中.
参考数据:,.
【解析】(1)因为,,
所以,
得,
于是关于的回归直线方程为;
(2)当时,,
则,
故可以认为所得到的回归直线方程是理想的.
二、考点分类练
(一)相关性与相关系数
5. 通过抽样调研发现,当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,甲认为这是巧合,两者其实没有关系:乙认为冷饮的某种摄入成分导致了疾病;丙认为病人对冷饮会有特别需求:丁认为两者的相关关系是存在的,但不能视为因果,请判断哪位成员的意见最可能成立( )
A.甲B.乙C.丙D.丁
【答案】D
【详解】当地第三季度的医院心脑血管疾病的人数和便利店购买冷饮的人数的相关系数很高,但相关关系是一种非确定性关系,相关关系不等于因果关系,丁的意见最可能成立.故选D.
6. 某统计部门对四组数据进行统计分析后,获得如图所示的散点图.
下面关于相关系数的比较,正确的是( )
A.B.C.D.
【答案】C
【解析】由图可知:所对应的图中的散点呈现正相关 ,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,故选C
7. (多选)(2023届湖湘名校教育联合体高三上学期联考)对两个变量y和x进行回归分析,得到一组样本数据,则下列结论正确的是( )
A.若求得的经验回归方程为,则变量y和x之间具有正的线性相关关系
B.若其经验回归方程必过点,则
C.若根据这组数据得到样本相关系数,则说明样本数据的线性相关程度较强
D.若用相关指数来刻画回归效果,回归模型1的相关指数,回归模型2的相关指数,则模型1的拟合效果更好
【答案】AC
【解析】在经验回归方程中,则y与x之间具有正的线性相关关系.故A正确;
在经验回归方程中恒过样本中心,则,故,故B错误;
,则样本数据的线性相关程度越强.故C正确;相关系数越大,模型拟合效果越好,故D错误.
故选AC.
8. 在一组样本数据为,,…,不全相等的散点图中,若所有样本点都在直线上,则这组样本数据的相关系数_______.
【答案】
【解析】因为,所以这两个变量成负相关,故这组样本数据的相关系数为负值,又所有样本点都在直线上,则,所以.
(二)回归直线方程
9.2022年6月18日,很多商场都在搞促销活动.重庆市物价局派人对5个商场某商品同一天的销售量及其价格进行调查,得到该商品的售价元和销售量件之间的一组数据如下表所示:
用最小二乘法求得关于的经验回归直线是,相关系数,则下列说法不正确的有( )A.变量与负相关且相关性较强 B.
C.当时,的估计值为13D.相应于点的残差为
【答案】C
【解析】对于A,由回归直线可得变量 线性负相关,且由相关系数,可知相关性强,故A正确,对于B,由表中数据可得,﹐
,故回归直线恒过点 ,
故 ,解得,故B正确,
对于C,当时,,故C错误,
对于D,相应于点的残差为,故D正确. 故选C.
10. (多选)已知由样本数据组成的一个样本,得到回归直线方程为,且,去除两个歧义点和后,得到新的回归直线的斜率为3.则下列说法正确的是( )
A.相关变量x,y具有正相关关系
B.去除两个歧义点后的回归直线方程为
C.去除两个歧义点后,样本(4,8.9)的残差为
D.去除两个歧义点后,随x值增加相关变量y值增加速度变小
【答案】ABC
【解析】对A,因为回归直线的斜率大于0,即相关变量x,y具有正相关关系,故A正确;
对B,将代入得,则去掉两个歧义点后,得到新的相关变量的平均值分别为,,此时的回归直线方程为,故B正确;
对C,x=4时,,残差为8.9-9=-0.1,故C正确;
对D,斜率3>1,此时随x值增加相关变量y值增加速度变大,D错误.故选ABC.
11. 若某地的财政收入x与支出y满足线性回归方程(单位:亿元),其中,,.若今年该地区财政收入为10亿元,则年支出预计不会超过________亿元.
【答案】10
【解析】由题意得财政收入x与支出y满足线性回归方程为,其中,
当时,,
因为 ,所以,
所以今年该地区财政收入为10亿元,则年支出预计不会超过10亿元
12. (20-23届河南省湘豫名校联考高三上学期期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:
2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)
(1)根据条形统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;
(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)
参考数据:,.参考公式:相关系数.线性回归方程的斜率,截距.
附:
【解析】(1)由条形统计图,得,
,
所以
,
.
所以.
因为相关系数,所以与具有很强的线性相关关系,且为正相关.
(2),
所以,
所以.
由题意知,2023年对应的年份代码,
当时,,
故预测2023年该公司的研发人数约为613人.
13.(2023届河南省许昌市高三上学期诊断) 随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜爱.某新能源汽车销售企业在2017年至2021年的销售量(单位:万辆)数据如下表:
(1)请用相关系数判断关于的线性相关程度(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确到小数点后两位);
(2)求出关于的线性回归方程,并预计2022年该新能源汽车企业的销售量为多少万辆?
参考数据:,,
附:相关系数,回归直线方程的斜率,截距
【解析】(1)解:由表中数据可得,,∴,
又,,
∴,
所以与有很强的线性相关性;
(2)解:由表中数据可得,
则,
∴,
又2022年对应的代号为6,故,
由此预计2022年该新能源汽车企业的销售量为109.2万辆.
(三)曲线型回归方程
14.(2022届河南豫北高中高三毕业班考前定位联合考试)某高科技公司为加强自主研发能力,研发费用逐年增加,统计最近6年的研发费用(单位:元)与年份编号得到样本数据,令,并将绘制成下面的散点图.若用方程对与的关系进行拟合,则( )
A.,B.,
C.,D.,
【答案】A
【解析】因为,令,则与的回归方程为.根据散点图可知与正相关,所以.从回归直线图象,可知回归直线的纵截距大于0,即,所以.故选A
15. 以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.
【答案】
【解析】,即,∴,.
16. (2022届河北省石家庄市部分学校高三下学期5月模拟)截至2021年12月,中国网民规模达10.32亿人,随之电信网络诈骗犯罪形势也非常严峻.2021年6月,公安部推出国家级反诈防骗“王炸”系统——“国家反诈中心APP”,这是一款能有效预防诈骗、快速举报诈骗内容的软件,用户通过学习里面的防诈骗知识可以有效避免各种网络诈骗的发生,减少不必要的财产损失,某省自“国家反诈中心APP”推出后,持续采取多措并举的推广方式,积极推动全省“国家反诈中心APP”安装注册工作.经统计,省反诈中心发现全省网络诈骗举报件数y(件)与推广时间有关,并记录了经推广x个月后举报件数的数据:
(1)现用作为回归方程模型,利用表中数据,求出该回归方程.
(2)分析该省一直加大力度推广下去有可能将网络诈骗举报件数降至接近于零吗?参考数据(其中):
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
【解析】(1)由题意.
令,设y关于t的线性回归方程为直线
则
则,
∴,又,
∴y关于x的回归方程为.
(2)仅从现有统计数据所得回归方程,可发现当推广时间越来越长时,即x越来越大时,y的值会逐渐降至接近于30,可知该省一直加大力度推广下去,网络诈骗举报件数大概会逐渐降至30件.
但在使用经验回归方程进行预测时,方程只适用于所研究的样本总体,一般具有时效性,不能期望回归方程得到的预报值就是响应变量的精确值,所以若加大力度一直推广下去,并随着国家对网络诈骗的严厉打击和科技发展,再加上相关部门对个人信息防护手段的加强,人们对网络诈骗犯罪的防范意识逐步提高,网络诈骗举报件数是有可能降至接近于零的.
三、最新模拟练
17.(2023届江苏省G4联盟高三上学期12月联考)如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈现正相关B.乡村人口与年份的相关系数接近
C.城镇人口逐年增长率大致相同D.可预测乡村人口仍呈现下降趋势
【解析】对于A选项,由折线图可知,城镇人口与年份呈现正相关,A对;
对于B选项,因为乡村人口与年份呈负线性相关关系,且线性相关性很强,所以接近,B错;
对于C选项,城镇人口与年份呈现正相关,且线性相关性很强,相关系数接近,
故城镇人口逐年增长率大致相同,C对;
对于D选项,由折线图可知,乡村人口与年份呈负线性相关关系,可预测乡村人口仍呈现下降趋势,D对.
故选B.
18. (2023届广东省广州市四校高三上学期第二次模拟)对两个变量和进行回归分析,得到一组样本数据,,…,则下列说法不正确的是( )
A.若变量和之间的相关系数为,则变量和之间具有较强的线性相关关系
B.残差平方和越小的模型,拟合的效果越好
C.用决定系数来刻画回归效果,越小说明拟合效果越好
D.在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
【答案】C
【解析】变量和之间的相关系数为越大,则变量和之间具有较强的线性相关关系,故A正确;
残差平方和越小的模型,拟合的效果越好,故B正确;
用决定系数来刻画回归效果,越大说明拟合效果越好,故C错误;
在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.
故选C.
19. (多选)(2022届湖北省黄冈中学高三下学期二模)已知由样本数据,,2,3,,组成的一个样本,得到回归直线方程为,且,去除两个样本点和后,得到新的回归直线的斜率为3.则下列说法正确的是( )
A.相关变量,具有正相关关系
B.去除两个样本点和后,回归直线方程为
C.去除两个样本点和后,随值增加相关变量值增加速度变小
D.去除两个样本点和后,样本的残差为0.1
【答案】AB
【解析】对于A,,则相关变量,具有正相关关系,故A正确;
对于B,求出,故去除样本点后的回归直线方程为,故B正确;
对于C,由于斜率为,随值增加相关变量值增加速度变大,故C错误;
对于D,样本的残差为,故D错误.
20. (2022届山西省怀仁市高三上学期期末)某工厂为研究某种产品的产量x(吨)与所需某种原材料y(吨)的相关性,在生产过程中收集了对应数据如表所示:
根据表中数据,得出关于的回归直线方程为.据此计算出在样本处的残差为,则表中的值为__________.(注:残差是实际观察值与估计值之间的差,)
【答案】
【解析】根据样本处的残差为,即,可得,
即回归直线方程为,
又由样本数据的平均数为,
得,解得.
21. (2022届海南省文昌中学高三4月段考)从某大学中随机选取8名女大学生,其身高x(单位:cm)与体重y(单位:kg)数据如下表:
若已知y与x的线性回归方程为,设残差记为观测值与预测值之间的差(即残差)那么选取的女大学生身高为175cm时,相应的残差为___________.
【答案】4
【解析】已知y与x的线性同归方程为
当时:,相应的残差为:
22. (2023届贵州省贵阳市白云区高三上学期质量监测)下面给出了根据我国年—2022年水果人均占有量(单位:kg)和年份代码绘制的散点图和线性回归方程的残差图(2016年—2022年的年份代码分别为1~7).
(1)根据散点图分析与之间的相关关系;
(2)根据散点图相应数据计算得,,求关于的线性回归方程(数据精确到);
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.
附:回归方程中的斜率和截距的最小二乘法估计公式分别为
【解析】(1)根据散点图可知,散点均匀的分布在一条直线附近,且随着的增大,增大,故与成线性相关,且为正相关;
(2)解:依题意,,,
,
,
,
所以关于的线性回归方程为:;
(3)解:由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较好,回归方程的预报精度较高.
23. (2023届福建省三明市教研联盟校高三上学期期中)中国在第75届联合国大会上承诺,将采取更加有力的政策和措施,力争于2030年之前使二氧化碳的排放达到峰值,努力争取2060年之前实现碳中和(简称“双碳目标”),此举展现了我国应对气候变化的坚定决心,预示着中国经济结构和经济社会运转方式将产生深刻变革,极大促进我国产业链的清洁化和绿色化.新能源汽车、电动汽车是重要的战略新兴产业,对于实现“双碳目标”具有重要的作用.为了解某一地区电动汽车销售情况,一机构根据统计数据,用最小二乘法得到电动汽车销量(单位:万台)关于(年份)的线性回归方程为,且销量的方差为,年份的方差为.
(1)求与的相关系数,并据此判断电动汽车销量与年份的相关性强弱;
(2)该机构还调查了该地区90位购车车主的性别与购车种类情况,得到的数据如下表:
依据小概率值的独立性检验,能否认为购买电动汽车与车主性别有关;
(3)在购买电动汽车的车主中按照性别进行分层抽样抽取7人,再从这7人中随机抽取3人,记这3人中,男性的人数为,求的分布列和数学期望.
①参考数据:;
②参考公式:(i)线性回归方程:,其中;
(ii)相关系数:,若,则可判断与线性相关较强.
(iii),其中.附表:
【解析】(1)相关系数为
故与线性相关较强.
(2)零假设为:购买电动汽车与车主性别相互独立,
即购买电动汽车与车主性别无关.
所以依据小概率值的独立性检验,我们推断不成立,
即认为购买电动汽车与车主性别有关,此推断犯错误的概率不大于.
(3)抽样比,男性车主选取2人,女性车主选取5人,则的可能取值为故
,,
故的分布列为:
四、高考真题练
24.(2022高考全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数.
【解析】(1)样本中10棵这种树木的根部横截面积的平均值
样本中10棵这种树木的材积量的平均值
据此可估计该林区这种树木平均一棵的根部横截面积为,
平均一棵的材积量为
(2)由表中的数据和附注中的参考数据得
, ,
,
=0.2474=0.0134,
所以相关系数r≈≈0.97.
(3)树木的材积量与其根部横截面积近似成正比,比例系数,
所以该林区这种树木的总材积量的估计值为().
25.(2020高考全国乙卷)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该
地区某种野生动物数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20
个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单
位:公顷)和这种野生动物的数量,并计算得,,,
,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
【解析】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从俄各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
26.(2016高考全国丙卷)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
参考数据:,,,.
参考公式:相关系数
回归方程中斜率和截距最小二乘估计公式分别为:,.
【解析】(Ⅰ)由折线图中数据和附注中参考数据得,,,
,.
因为与的相关系数近似为0.99,说明与的线性相关程度相当高
从而可以用线性回归模型拟合与的关系.
(Ⅱ)由及(Ⅰ)得,
.
所以,关于的回归方程为:.
将2016年对应的代入回归方程得:.
所以预测2016年我国生活垃圾无害化处理量将约1.82亿吨.
五、综合提升练
27. 已知x与y之间的几组数据如下表:
参考公式:线性回归方程,其中,;相关系数.
上表数据中y的平均值为2.5,若某同学对m赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为,,,对应的相关系数分别为,,,下列结论中错误的是( )A.三条回归直线有共同交点B.相关系数中,最大
C.D.
【答案】D
【解析】由题意,,即.
若,则,此时,.
,
,
.
则, , ;
若,则,此时,.
,
,.
,,;
若,则,此时,.
,
,,.
由样本点的中心相同,故A正确;
由以上计算可得,相关系数中,最大,,,故B,C正确,D错误.
故选D.
28. 某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
由上表数据可知,y与x的相关系数为______.
(精确到0.01,参考公式和数据:,,,)
【答案】0.99
【解析】由题意,知,
,
.
所以.
所以y与x的相关系数近似为0.99.
29. (2022届黑龙江省大庆实验中学高三5月模拟)【阅读材料1】
我们在研究两个变量之间的相关关系时,往往先选取若干个样本点(),(),……,(),将样本点画在平面直角坐标系内,就得到样本的散点图.观察散点图,如果所有样本点都落在某一条直线附近,变量之间就具有线性相关关系,如果所有的样本点都落在某一非线性函数图象附近,变量之间就有非线性相关关系.在统计学中经常选择线性或非线性(函数)回归模型来刻画相关关系,并且可以用适当的方法求出回归模型的方程,还常用相关指数R2来刻画回归的效果,相关指数R2的计算公式为:
当R2越大时,回归方程的拟合效果越好;当R2越小时,回归方程的拟合效果越差,R2是常用的选择模型的指标之一,在实际应用中应该尽量选择R2较大的回归模型.
【阅读材料2】
2021年6月17日9时22分,我国酒泉卫星发射中心用长征二号F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪胺3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造,根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
当0
当x>13时,确定y与x满足的线性回归直线方程为.
根据以上阅读材料,解答以下问题:
(1)根据下列表格中的数据,比较当0
附:①若最小二乘法求得回归直线方程为,则;
②
③,当时,.
【解析】 (1)
对于模型①,
因为,故对应的,
故对应的相关指数,
对于模型②,同理对应的相关指数,
故模型②拟合效果更好.
(2)
当时,
后五组的,
由最小二乘法可得,
所以当时,确定y与x满足的线性回归直线方程为
故当投入20亿元时,预测公司的收益约为:(亿元).
30.(2023届河北省沧州市海兴县高三上学期12月调研)某统计部门依据《中国统计年鉴——2017》提供的数据,对我国1997-2016年的国内生产总值(GDP)进行统计研究,作出了两张散点图:图1表示1997-2016年我国的国内生产总值(GDP),图2表示2007-2016年我国的国内生产总值(GDP).
(1)用表示第i张图中的年份与GDP的线性相关系数,,依据散点图的特征分别写出的结果;
(2)分别用线性回归模型和指数回归模型对两张散点图进行回归拟合,分别计算出统计数据——相关指数的数值,部分结果如下表所示:
①将上表中的数据补充完整(结果保留3位小数,直接写在答题卡上);
②若估计2017年的GDP,结合数据说明采用哪张图中的哪种回归模型会更精准一些?若按此回归模型来估计,2020年的GDP能否突破100万亿元?事实上,2020年的GDP刚好突破了100万亿元,估计与事实是否吻合?结合散点图解释说明.
【解析】(1)由散点图可知,图2拟合效果更好、相关系数较大,所以,.
(2)①0.996
②由图2中的线性回归模型得到的相关指数为0.996,是所有回归模型的相关指数中数值最大的,而且2017年是最近的年份,因此选择图2中的线性回归模型来估计2017年的GDP,是比较精准的.
按照图2中的线性回归模型来估计(延长回归直线可发现),2020年不能突破100万亿元.
估计与事实不吻合.综合两张图来考虑,我国的GDP随年份的增长整体上呈现指数增长的趋势,而且2020年比2016年又多发展了4年,指数回归趋于明显,因此,按照线性回归模型得到的估计值与实际数据有偏差、不吻合,属于正常现象.月份
1
2
3
4
5
6
销售单价
销售量
价格
90
95
100
105
110
销售量
11
10
8
6
5
相关性
弱
一般
强
年份
2017年
2018年
2019年
2020年
2021年
年份代号
1
2
3
4
5
销售量(万辆)
75
84
93
98
100
推广月数(个)
1
2
3
4
5
6
7
y(件)
891
888
351
220
200
138
112
1586
0.37
0.55
3
4
5
6
2
3
4
x
165
165
157
170
175
165
155
170
y
48
57
50
54
64
61
43
59
性别
购买非电动汽车
购买电动汽车
总计
男性
39
6
45
女性
30
15
45
总计
69
21
90
0
1
2
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
x
1
2
3
4
y
1
m
n
4
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
序号
1
2
3
4
5
6
7
8
9
10
11
12
x
2
3
4
6
8
10
13
21
22
23
24
25
y
15
22
27
40
48
54
60
68.5
68
67.5
66
65
回归模型
模型①
模型②
回归方程
79.13
20.2
年份
1997-2016
2007-2016
线性回归模型
0.9306
指数回归模型
0.9899
0.978
第49练 独立性检验(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用): 这是一份第49练 独立性检验(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用),文件包含第49练独立性检验原卷版docx、第49练独立性检验解析版docx等2份试卷配套教学资源,其中试卷共47页, 欢迎下载使用。
第41练 二项式定理(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用): 这是一份第41练 二项式定理(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用),文件包含第41练二项式定理原卷版docx、第41练二项式定理解析版docx等2份试卷配套教学资源,其中试卷共21页, 欢迎下载使用。
第40练 两个原理、排列组合(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用): 这是一份第40练 两个原理、排列组合(课本变式练+考点分类练+最新模拟练+高考真题练+综合提升练)-备战2024年高考数学一轮复习高分突破(新高考通用),文件包含第40练两个原理排列组合原卷版docx、第40练两个原理排列组合解析版docx等2份试卷配套教学资源,其中试卷共23页, 欢迎下载使用。