高考数学一轮复习第八章第三讲成对数据的统计分析课件
展开1.了解样本相关系数的统计含义,会通过相关系数比较多组成
2.了解一元线性回归模型的含义,了解最小二乘原理,掌握一
元线性回归模型参数的最小二乘估计方法.
3.理解 2×2 列联表的统计意义,了解 2×2 列联表独立性检验
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系叫做相关关系.与函数关系不同,相关关系是一种非确定性关系.
(2)散点图可以直观地判断两变量的关系是否可以用线性关系表示.若这些散点有 y 随 x 增大而增大的趋势,则称两个变量正相关;若这些散点有 y 随 x 增大而减小的趋势,则称两个变量负相关.
它主要用于对成对样本数据的相关程度进行定量分析,以衡量它们之间的线性相关程度.当 r>0 时表示两个变量正相关,当r<0 时表示两个变量负相关.|r|越接近 1,表明两个变量的线性相关性越强;当|r|接近 0 时,表明两个变量间几乎不存在相关关系,相关性越弱.
(5)残差①残差:对于响应变量 Y,通过观测得到的数据称为观测值,差.
越接近 1,表示回归的效果
设 X,Y 为两个分类变量,它们的取值分别为{x1,x2}和{y1,
y2},其样本频数列联表(2×2 列联表)如下:
+d 为样本容量)来判断“两个分类变量是否独立”的方法称为独立性检验.
(3)独立性检验的一般步骤①提出零假设H0:X和Y相互独立,并给出在问题中的解释;②根据样本数据列出2×2列联表;③计算随机变量χ2的值,查表确定临界值xα;④当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2
考点一 相关关系的判断1.对 4 组样本数据进行统计,获得如图 8-3-1 所示的散点图,
关于其相关系数的比较,正确的是(样本相关系数为 r1(1)
)样本相关系数为 r2(2)
样本相关系数为 r3(3)A.r2<r4<0<r3<r1C.r4<r2<0<r3<r1
样本相关系数为 r4(4)图 8-3-1B.r4<r2<0<r1<r3D.r2<r4<0<r1<r3
解析:由散点图知图(1)与图(3)是正相关,故 r1>0,r3>0,图(2)与图(4)是负相关,故 r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此 r2<r4<0<r3<r1.故选 A.
2.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图 8-3-2 所示的人体脂肪含量与年龄
关系的散点图.根据该图,下列结论中正确的是(图 8-3-2
A. 人体脂肪含量与年龄正相关,且脂肪含量的中位数等于
B. 人体脂肪含量与年龄正相关,且脂肪含量的中位数小于
C. 人体脂肪含量与年龄负相关,且脂肪含量的中位数等于
D. 人体脂肪含量与年龄负相关,且脂肪含量的中位数小于
解析:观察题图,可知人体脂肪含量与年龄正相关,且脂肪
含量的中位数小于 20%.故选 B.
【题后反思】判定两个变量正、负相关的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;
点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0 时,两个变量正相关;r<0 时,两个变量
[例 1](1)(多选题)2024 年 3 月 15 日,某市物价部门对 5 家商场的某种商品一天的销售量及其价格进行调查,5 家商场的售价x(单位:元)和销售量 y(单位:件)之间的一组数据如表所示:
数|r|=0.986,则下列说法正确的有(
A.变量 x,y 线性负相关且相关性较强B.a=40C.当 x=8.5 时,y 的估计值为 12.8D.相应于点(10.5,6)的残差约为 0.4
(2)某研究机构为调查人的最大可视距离 y(单位:米)和年龄x(单位:岁)之间的关系,对不同年龄的志愿者进行了研究,收集数据得到下表:
②根据①中求出的线性回归方程,估计年龄为 50 岁的人的最大可视距离.
【题后反思】回归分析问题的类型及解题方法(1)求经验回归方程
①根据散点图判断两变量是否线性相关,如不是,应通过换
(2)利用经验回归方程进行预测时,可把经验回归方程看作一次函数求函数值.线性经验回归方程的图象一定过点( x , y ).(3)利用经验回归方程判断正、负相关时,决定是正相关还是
(4)判断经验回归方程的拟合效果,可以利用样本相关系数判
断,|r|越趋近于 1,两变量的线性相关性越强.
随着经济的发展,某地居民收入逐年增长.该地某银行连续五
年的储蓄存款(年底余额)如下表:
为了研究计算的方便,工作人员将上表的数据进行了处理,
令 t=x-2 018,z=y-5,得到下表:
(1)求 z 关于 t 的线性回归方程;(2)通过(1)中的方程,求出 y 关于 x 的回归方程;(3)用所求回归方程预测到 2025 年的年底,该银行储蓄存款额可达多少?
[例 2](2023 年全国甲卷文科)一项试验旨在研究臭氧效应,试验方案如下:选 40 只小白鼠,随机地将其中 20 只分配到试验组,另外 20 只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.530.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.340.5 43.2试验组的小白鼠体重的增加量从小到大排序为
16.5 18.0 18.8
19.2 19.8 20.2
23.9 25.1 28.2
32.3 36.5
(1)计算试验组的样本平均数;
(2)①求 40 只小白鼠体重的增加量的中位数 m,再分别统计两样本中小于 m 与不小于 m 的数据的个数,完成如下列联表;
②根据①中的列联表,能否有 95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
n(ad-bc)2附:χ2=(a+b)(c+d)(a+c)(b+d)
解:(1)根据题意,试验组的样本平均数为
18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8.
(2)①由题意知,这 40 只小白鼠体重增加量的中位数是将两组数据合在一起,从小到大排列后第 20 位与第 21 位数据的平均数.因为第 20 位数据为 23.2,第 21 位数据为 23.6,
②零假设为 H0:小鼠体重的增加量与是否饲养在高浓度臭氧环境中无关.根据列联表中数据,计算得到
40×(6×6-14×14)2=6.4>3.841.20×20×20×20
根据小概率值α=0.050 的独立性检验,我们推断 H0 不成立.所以有 95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
【题后反思】独立性检验的一般步骤(1)根据样本数据制成 2×2 列联表,提出零假设 H0.
n(ad-bc)2(a+b)(c+d)(a+c)(b+d)
(3)比较χ2 与临界值的大小关系,然后得出结论.
(2023 年威海市期末)某大学在一次调查学生是否有自主创业
打算的活动中,获得了如下数据:
(1)若 m=24,n=36,根据调查数据判断,是否有 99%的把握
认为该校学生有无自主创业打算与性别有关?
(2)若 m=15,n=60,从这些学生中随机抽取一人.①若已知抽到的人有自主创业打算,求该学生是男生的概率;②判断“抽到的人无自主创业打算”与“抽到的人是男生”是否独立.
解:(1)零假设为 H0:该校学生有无自主创业打算与性别无关.根据列联表中的数据,经计算得到
140×(16×36-24×64)2=6.72>6.635.(16+24)×(64+36)×(16+64)×(24+36)
根据小概率值α=0.01 的χ2 独立性检验,我们推断 H0 不成立.所以有 99%的把握认为该校学生有无自主创业打算与性别有关.
(2)记 A 为“抽到的人有自主创业打算”,B 为“抽到的人是男生”.
所以“抽到的人无自主创业打算”与“抽到的人是男生”独立.
⊙非线性回归的应用问题
[例 3](2023 年宁波市期末)某企业对 2023 年上半年的月利润
情况进行调查统计,得到数据如下:
根据以上数据,绘制了如图 8-3-3 所示的散点图.
(1)根据散点图判断,y=c·edx与y=a+bx(a,b,c,d均为大于零的常数)哪一个更适宜作为描述 y 与 x 关系的回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果求出 y 关于 x 的回归方程.
(3)已知该企业的产品合格率为 90%,现随机抽取 9 件产品进行检测,则这 9 件产品中合格的件数最有可能是多少?
解:(1)由散点图可知,y 与 x 之间是非线性相关关系,所以 y=c·edx 更适宜作为描述 y 与 x 关系的回归方程类型.
(3)设抽到的产品中有 X 件合格品,则 X~B(9,0.9).
所以当 k=8 或 k=9 时 P(X=k)最大.所以这 9 件产品中合格的件数最有可能是 8 件或 9 件.
【反思感悟】有些非线性回归分析问题并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,结合题目给出的数据,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,把问题化为线性回归问题.
(2023 年江门市期末)镇海湾生蚝是台山市的特产,因镇海湾的生蚝田处于咸淡水交汇之地,所以这里的生蚝长得比其他地方更肥大,味道更鲜美.2023 年镇海湾某养殖基地考虑增加人工投入,根据市场调研与模拟,得到人工投入增量 x(单位:人)与年收益增量 y(单位:万元)的数据如下,并绘成如图 8-3-4 所示的散点图.
根据散点图,有如下两个 y 与 x 的回归模型:
(1)求出模型②中 y 关于 x 的回归方程(精确到 0.1);
(2)比较模型①,②的决定系数 R2 的大小,说明哪个模型拟合效果更好,并用该模型预测,要使年收益增量超过 80 万元,人工投入增量至少需要多少人?(精确到 1)
∵182.42>72.98,∴模型①的决定系数小于模型②的决定系数,故模型②的拟合效果更好.
2025年高考数学一轮复习-成对数据的统计分析【课件】: 这是一份2025年高考数学一轮复习-成对数据的统计分析【课件】,共47页。PPT课件主要包含了基础知识·诊断,变量的相关关系,样本相关系数,一元线性回归模型,题组1走出误区,题组2走进教材,题组3走向高考,考点聚焦·突破等内容,欢迎下载使用。
2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件: 这是一份2025届高考数学一轮总复习第十章统计与成对数据的统计分析第二节成对数据的统计分析课件,共60页。PPT课件主要包含了内容索引,强基础增分策略,增素能精准突破,样本相关系数,2经验回归方程,2独立性检验,答案C,典例突破等内容,欢迎下载使用。
2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件: 这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。