





所属成套资源:【讲通练透】2025年新高考数学一轮复习(新教材,含2024高考真题)
第02讲 成对数据的统计分析(五大题型)(讲义)-2025年高考数学一轮复习讲练测(新教材新高考)
展开
这是一份第02讲 成对数据的统计分析(五大题型)(讲义)-2025年高考数学一轮复习讲练测(新教材新高考),文件包含第02讲成对数据的统计分析五大题型讲义原卷版docx、第02讲成对数据的统计分析五大题型讲义解析版docx等2份试卷配套教学资源,其中试卷共78页, 欢迎下载使用。
\l "_Tc178325866" 01 考情透视·目标导航 PAGEREF _Tc178325866 \h 2
\l "_Tc178325867" 02 知识导图·思维引航 PAGEREF _Tc178325867 \h 3
\l "_Tc178325868" 03 考点突破·题型探究 PAGEREF _Tc178325868 \h 4
\l "_Tc178325869" 知识点1:变量间的相关关系 PAGEREF _Tc178325869 \h 4
\l "_Tc178325870" 知识点2:线性回归 PAGEREF _Tc178325870 \h 5
\l "_Tc178325871" 知识点3:非线性回归 PAGEREF _Tc178325871 \h 7
\l "_Tc178325872" 知识点4:独立性检验 PAGEREF _Tc178325872 \h 8
\l "_Tc178325873" 解题方法总结 PAGEREF _Tc178325873 \h 11
\l "_Tc178325874" 题型一:变量间的相关关系 PAGEREF _Tc178325874 \h 12
\l "_Tc178325875" 题型二:一元线性回归模型 PAGEREF _Tc178325875 \h 15
\l "_Tc178325876" 题型三:非线性回归 PAGEREF _Tc178325876 \h 20
\l "_Tc178325877" 题型四:列联表与独立性检验 PAGEREF _Tc178325877 \h 28
\l "_Tc178325878" 题型五:误差分析 PAGEREF _Tc178325878 \h 34
\l "_Tc178325879" 04真题练习·命题洞见 PAGEREF _Tc178325879 \h 39
\l "_Tc178325880" 05课本典例·高考素材 PAGEREF _Tc178325880 \h 41
\l "_Tc178325881" 06易错分析·答题模板 PAGEREF _Tc178325881 \h 46
\l "_Tc178325882" 易错点:对回归直线的性质理解不深刻 PAGEREF _Tc178325882 \h 46
\l "_Tc178325883" 答题模板:独立性检验 PAGEREF _Tc178325883 \h 47
知识点1:变量间的相关关系
1、变量之间的相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断.
注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系.
2、散点图
将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系.
(1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示;
(2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示.
3、相关系数
若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为.
(1)当时,表示两个变量正相关;当时,表示两个变量负相关.
(2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上.
(3)通常当时,认为两个变量具有很强的线性相关关系.
【诊断自测】如图,为某组数据的散点图,由最小二乘法计算得到回归直线的方程为,相关系数为,决定系数为.若经过残差分析后去掉点P,剩余的点重新计算得到回归直线的方程为,相关系数为,决定系数为.则下列结论一定正确的是( )
A.B.C.D.,
【答案】C
【解析】共8个点且离群点P的横坐标较小而纵坐标相对过大,去掉离群点后回归方程的斜率更大,故C正确
去掉离群点后相关性更强,拟合效果也更好,且还是正相关,故D错误
有,,故AB错误.
故选:C.
知识点2:线性回归
1、线性回归
线性回归是研究不具备确定的函数关系的两个变量之间的关系(相关关系)的方法.
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的求法为
其中,,,(,)称为样本点的中心.
2、残差分析
对于预报变量,通过观测得到的数据称为观测值,通过回归方程得到的称为预测值,观测值减去预测值等于残差,称为相应于点的残差,即有.残差是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
(1)残差图
通过残差分析,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高;反之,不合适.
(2)通过残差平方和分析,如果残差平方和越小,则说明选用的模型的拟合效果越好;反之,不合适.
(3)相关指数
用相关指数来刻画回归的效果,其计算公式是:.
越接近于,说明残差的平方和越小,也表示回归的效果越好.
【诊断自测】将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标和某植物分布的数量,得到样本,且其相关系数,记关于的线性回归方程为.经计算可知:,则 .
参考公式:.
【答案】/1.875
【解析】因为,
所以,
由,
解得,
所以.
故答案为:
知识点3:非线性回归
解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程.
求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.
1、建立非线性回归模型的基本步骤:
(1)确定研究对象,明确哪个是解释变量,哪个是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系);
(3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等);
(4)通过换元,将非线性回归方程模型转化为线性回归方程模型;
(5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程;
(6)消去新元,得到非线性回归方程;
(7)得出结果后分析残差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等.
【诊断自测】某人新房刚装修完,为了监测房屋内空气质量的情况,每天在固定的时间测一次甲醛浓度(单位:mg/m3),连续测量了10天,所得数据绘制成散点图如下:用表示第天测得的甲醛浓度,令,经计算得,,.
(1)由散点图可知,与可用指数型回归模型进行拟合,请利用所给条件求出回归方程;(系数精确到0.01)
(2)已知房屋内空气中的甲醛浓度的安全范围是低于0.08 mg/m3,则根据(1)中所得回归模型,该新房装修完第几天开始达到此标准?(参考数据:)
附:,.
【解析】(1)令,而,,
则,,
因此,即,
所以所求回归方程为.
(2)由(1)知:,即,解得,
所以,即在新房装修完第35天开始达到此标准.
知识点4:独立性检验
1、分类变量和列联表
(1)分类变量:
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{,}和{,},其样本频数列联表(称为2×2列联表)为
从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2、等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征.
(2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系.
3、独立性检验
计算随机变量利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
【诊断自测】近年中国新能源汽车进入高速发展时期.专家预测2024年中国汽车总销售量将超过3100万辆,继续领跑全球.为了了解广大消费者购买新能源汽车意向与年龄是否具有相关性,某汽车APP采用问卷调查形式对400名消费者进行调查,数据显示这400人中中老年人共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍;青年中愿意购买新能源车的人数是愿意购买燃油车的4倍.
(1)完善2×2列联表,请根据小概率值的独立性检验,分析消费者对新能源车和燃油车的意向购买与年龄是否有关;
(2)采用分层随机抽样从愿意购买新能源车的消费者中抽取9人,再从这9人中随机抽取4人,求这4人中青年人数的期望.
附:,.
【解析】(1)中老年共有150人,且愿意购买新能源车的人数是愿意购买燃油车的2倍,
所以愿意购买新能源车的中老年人数为100人,
愿意购买燃油车的中老年人数为50人,青年共有250人,
愿意购买新能源车是愿意购买燃油车的4倍,
所以青年中愿意购买新能源车为200人,愿意购买燃油车为50人,
得到如下2×2列联表:
零假设:消费者购买新能源车和燃油车的意向与年龄无关,
,
根据小概率值的独立性检验,我们推断不成立,
即认为消费者购买新能源车和燃油车的意向与年龄有关.
(2)愿意购买新能源车的共有300人,青年人与中老年人的比例为2:1,
所以分层随机抽样抽取的9人中6人是青年人,3人是中老年人,
记这4人中,青年的人数为,则的可能取值为1,2,3,4,
, ,
,,
所以的分布列如下:
,
所以这4人中青年人数的期望为.
解题方法总结
常见的非线性回归模型
(1)指数函数型(且,)
两边取自然对数,,即,
令,原方程变为,然后按线性回归模型求出,.
(2)对数函数型
令,原方程变为,然后按线性回归模型求出,.
(3)幂函数型
两边取常用对数,,即,
令,原方程变为,然后按线性回归模型求出,.
(4)二次函数型
令,原方程变为,然后按线性回归模型求出,.
(5)反比例函数型型
令,原方程变为,然后按线性回归模型求出,.
题型一:变量间的相关关系
【典例1-1】已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关B.变量x与变量y的相关性变强
C.残差平方和变大D.样本相关系数r变大
【答案】B
【解析】由散点图可知,去掉点后,与的线性相关加强,且为负相关,
所以B正确,A错误;
由于与的线性相关加强,所以残差平方和变小,所以C错误,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数r变小,所以D错误.
故选:B.
【典例1-2】已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【答案】C
【解析】因为线性相关系数,,
所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.
因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.
故选:C.
【方法技巧】
判定两个变量相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r
相关试卷
这是一份新高考数学一轮复习讲练测第9章第02讲 成对数据的统计分析(五大题型)(讲义)(2份打包,原卷版+解析版),文件包含新高考数学一轮复习讲练测第9章第02讲成对数据的统计分析五大题型讲义原卷版doc、新高考数学一轮复习讲练测第9章第02讲成对数据的统计分析五大题型讲义解析版doc等2份试卷配套教学资源,其中试卷共0页, 欢迎下载使用。
这是一份高考数学一轮复习【考点题型归纳讲练】导学案(新高考专用)第02课时成对数据的统计分析(原卷版+解析),共41页。
这是一份第02讲 成对数据的统计分析(五大题型)(讲义)-2024年高考数学一轮复习讲义(新教材新高考),文件包含第02讲成对数据的统计分析五大题型讲义原卷版docx、第02讲成对数据的统计分析五大题型讲义解析版docx等2份试卷配套教学资源,其中试卷共78页, 欢迎下载使用。