备战2025年高考数学精品课件第九章 第3讲 成对数据的统计分析
展开
这是一份备战2025年高考数学精品课件第九章 第3讲 成对数据的统计分析,共60页。PPT课件主要包含了正相关,负相关,一条直线,预测值,3临界值,不成立,不独立,-01,方法技巧,独立性检验的一般步骤等内容,欢迎下载使用。
学生用书P2171. 变量的相关关系(1)正相关和负相关:从整体上看,当一个变量的值增加时,另一个变量的相应值也
呈现① 的趋势,我们就称这两个变量② ;当一个变量的值增加
时,另一个变量的相应值呈现③ 的趋势,则称这两个变量④ .(2)线性相关:一般地,如果两个变量的取值呈现⑤ 相关或⑥ 相关,而
且散点落在⑦ 附近,我们就称这两个变量线性相关.(3)非线性相关或曲线相关:一般地,如果两个变量具有相关性,但不是线性相关,
那么我们就称这两个变量非线性相关或曲线相关.
4. 列联表与独立性检验(1)2×2列联表一般地,假设有两个分类变量 X 和 Y ,它们的取值为{0,1},其样本频数列联表(称
为2×2列联表)为:
对于任何小概率值α,可以找到相应的正实数 xα,使得 P ( X 2≥ xα)=α成立,我们称
xα为α的临界值,这个临界值可作为判断 X2大小的标准.概率值α越小,临界值 xα
⑭ .
下表给出了 X 2独立性检验中5个常用的小概率值和相应的临界值.
(4)基于小概率值α的检验规则当 X 2≥ xα时,我们就推断 H 0⑮ ,即认为 X 和 Y ⑯ ,该推断
犯错误的概率不超过α;当 X 2< xα时,我们没有充分证据推断 H 0不成立,可以认为 X 和 Y ⑰ .说明 若 X 2越大,则两个分类变量有关的把握越大.
1. 下列四个散点图中,变量 x 与 y 之间具有负的线性相关关系的是( D )
2. 下列说法正确的是( D )
4. [2023福州5月质检]已知变量 x 和 y 的统计数据如下表:
学生用书P219命题点1 成对数据的相关性角度1 判断两个变量的相关性例1 (1)已知变量 x 和 y 近似满足关系式 y =-0.1 x +1,变量 y 与 z 正相关.下列结论中
正确的是( C )
[解析] 由 y =-0.1 x +1,知 x 与 y 负相关,即 y 随 x 的增大而减小,又 y 与 z 正相
关,所以 z 随 y 的增大而增大,随 y 的减小而减小,所以 z 随 x 的增大而减小, x 与 z
负相关.
(2)[2023湖北仙桃中学模拟]对四组数据进行统计后,获得了如图所示的散点图,四
组数据的相关系数分别为 r 1, r 2, r 3, r 4,对各组的相关系数进行比较,正确的是
( C )
[解析] 由题图可知,第一、四组数据均正相关,第二、三组数据均负相关,当相
关系数的绝对值越大时,数据的线性相关性越强.第一组数据的线性相关性较第四组
强,则 r 1> r 4>0,第二组数据的线性相关性较第三组强,则| r 2|>| r 3|,且 r 2<0, r 3<0,则 r 2< r 3<0.因此, r 2< r 3<0< r 4< r 1.故选C.
方法技巧判断两个变量相关性的3种方法
角度2 相关系数的计算
例2 [2022全国卷乙]某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计
一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面
积(单位:m2)和材积量(单位:m3),得到如下数据:
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量.
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
训练1 变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),
(13,5);变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,
2),(13,1). r 1表示变量 Y 与 X 之间的线性相关系数, r 2表示变量 V 与 U 之间的线性
相关系数,则( C )
[解析] 由题中的数据可知,变量 Y 与 X 正相关,相关系数 r 1>0,变量 V 与 U 负相
关,相关系数 r 2<0,即 r 2<0< r 1.故选C.
命题点2 回归模型及其应用
角度1 一元线性回归模型
(1)请用相关系数 r 判断该组数据中 y 与 x 之间线性相关关系的强弱(若| r |
∈[0.75,1],相关性较强;若| r |∈[0.30,0.75),相关性一般;若 r ∈[-0.25,
0.25],相关性较弱).
(2)求 y 关于 x 的线性回归方程.
(3)若该省北部某城镇2024年的人口约为5万人,根据(2)中的线性回归方程估计该城
镇2024年的GDP.
(2)利用经验回归方程进行预测:直接将已知的自变量的某个数值代入经验回归方程
求得特定要求下的预测值.(3)判断回归模型的拟合效果:利用残差平方和或决定系数 R 2判断, R 2越大,表示
残差平方和越小,即模型的拟合效果越好.
角度2 非线性回归模型例4 [2023重庆市三检]已知变量 y 关于 x 的经验回归方程为 y =e bx -0.6,若对 y =e bx -0.6两边取自然对数,可以发现ln y 与 x 线性相关,现有一组数据如表所示:
则当x=6时,预测y的值为( C )
[解析] 对y= ebx-0.6两边取自然对数,得 ln y=bx-0.6,令z= ln y,则 z=bx-
0.6,数据为
解得b=1.6,所以z=1.6x-0.6,即y= e 1.6x-0.6.当x=6时,y= e 1.6×6-0.6= e 9,故选
C .
训练2 [2023合肥市质检]研究表明,温度的突然变化会引起机体产生呼吸道上皮组织
的生理不良反应,从而导致呼吸系统疾病的发生或恶化.某中学数学建模社团成员欲
研究昼夜温差大小与该校高三学生患感冒人数多少之间的关系,他们记录了某周连
续六天的昼夜温差,并到校医务室查阅了这六天中每天高三学生新增患感冒而就诊
的人数(假设患感冒必到校医务室就诊),得到资料如下:
命题点3 列联表与独立性检验例5 [2022全国卷甲改编]甲、乙两城之间的长途客车均由 A 和 B 两家公司运营.为了
解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得
到下面列联表:
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)依据小概率值α=0.1的独立性检验,分析甲、乙两城之间的长途客车是否准点与
客车所属公司有关.
(1)提出零假设 H 0;
(2)根据样本数据制成2×2列联表;
(4)比较 X 2与临界值 x α的大小关系,根据检验规则得出推断结论.
训练3 某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查
的1 000名骑行人员中,记录其年龄(单位:岁)和是否佩戴头盔情况,得到如图所示
的统计图:
(1)估算该市电动自行车骑乘人员的平均年龄.
[解析] (1)该市电动自行车骑乘人员的平均年龄为25×0.25+35×0.35+45×0.2+55×0.15+65×0.05=39(岁).
(2)根据所给的数据,完成下面的列联表:单位:名
[解析] (2)依题意,完成列联表如下:
(3)根据(2)中的列联表,依据α=0.010的独立性检验,能否认为遵守佩戴安全头盔规
则与年龄有关?
1. [命题点1角度1/2023天津高考]调查某种群花萼长度和花瓣长度,所得数据如图所
示.其中相关系数 r =0.824 5,下列说法正确的是( C )
[解析] 因为相关系数 r =0.824 5>0.75,所以花瓣长度和花萼长度的相关性较强,
并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有
关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.
2. [命题点1,2/2024济南市摸底考试]随着科技的发展,网购成了人们购物的重要选
择,并对实体经济产生了一定影响.为了解实体经济的现状,某研究机构统计了一个
大商场2018—2022年的线下销售额,如下表:
(1)由表中数据可以看出,可用经验回归模型拟合销售额 y 与年份编号 x 的关系,请
用相关系数加以说明;
(2)建立 y 关于 x 的经验回归方程,并预测2024年该商场的线下销售额.
3. [命题点3/2021全国卷甲改编]甲、乙两台机床生产同种产品,产品按质量分为一级
品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产
品,产品的质量情况统计如下表:单位:件
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)依据小概率值α=0.01的独立性检验,分析甲机床的产品质量与乙机床的产品质量
是否有差异.
学生用书·作业帮P378
1. 在用经验回归方程研究四组数据的拟合效果时,分别作出下列四个关于四组数据
的残差图,则用线性回归模型拟合效果最佳的是( A )
[解析] 用残差图判断模型的拟合效果时,残差点比较均匀地落在水平的带状区域
中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合效果越好.故
选A.
2. [全国卷Ⅰ]某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x (单位:℃)
的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据( xi , yi )( i =1,
2,…,20)得到如图所示的散点图.
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率 y 和
温度 x 的回归方程类型的是( D )
[解析] 由散点图可以看出,随着温度 x 的增加,发芽率 y 增加到一定程度后,变化
率越来越慢,符合对数型函数的图象特征.
3. [2024江苏徐州模拟]如图,在一组样本数据 A (2,2), B (4,3), C (6,4), D (8,
7), E (10,6)的散点图中,若去掉 D (8,7),则下列说法正确的为( D )
[解析] 由散点图分析可知,只有 D 点偏离直线较远,去掉 D 点后, x 与 y 的线性相
关程度变强,且为正相关,所以样本相关系数 r 变大,决定系数 R 2变大,残差平方
和变小,故选D.
4. [2024青岛市检测]已知某设备的使用年限 x (年)与年维护费用 y (千元)的对应数据
如下表:
表(1) 单位:人
A. 列联表中c的值为30,b的值为35B. 列联表中c的值为20,b的值为45C. 根据列联表中的数据,有95%的把握认为成绩与班级有关D. 根据列联表中的数据,没有95%的把握认为成绩与班级有关
8. [2024海南月考]某高校“统计初步”课程的教师随机调查了选该课的一些学生的
情况,具体数据如下表:单位:人
[解析] 因为 X 2>3.841= x 0.05,所以依据小概率值α=0.05的独立性检验,认为主修
统计专业与性别有关,出错的可能性最大为5%.
9. 某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国
内、国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所
示的等高堆积条形图.根据等高图,依据小概率值α=0.005的独立性检验, (填
“能”或“不能”)认为持乐观态度和国内外差异有关.
[解析] 零假设为 H 0:持乐观态度和国内外差异无关.由题填写2×2列联表如下,
10. [2024武汉部分学校调考]某校为考查学生对紧急避险知识的掌握情况,从全校学
生中选取200名学生进行紧急避险知识测试,其中男生110名,女生90名.所有学生的
测试成绩(单位:分)都在区间[50,100]内,由测试成绩数据作出如图所示的频率分
布直方图.(1)若从频率分布直方图中估计出样本的平均数与中位数相等,求图中 m 的值;
(2)规定测试成绩不低于80分为优秀,已知共有45名男生测试成绩优秀,完成下面的
列联表,并根据小概率值α=0.05的独立性检验,能否推断男生和女生的测试成绩优
秀率有差异?单位:人
[解析] (2)零假设 H 0:男生和女生的测试成绩优秀率没有差异.测试成绩优秀的总人数为200×10×(0.025+0.01)=70.得到列联表: 单位:人
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种
野生动物数量的平均数乘地块数).
(2)求样本( xi , yi )( i =1,2,…,20)的相关系数(精确到0.01).
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得
该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并
说明理由.
(3)分层随机抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层
随机抽样.
理由如下:由(2)知,各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由
于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,
采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本
的代表性,从而可以获得该地区这种野生动物数量更准确的估计.
12. [2024内江模拟]某网络直播平台调研“大学生是否喜欢观看体育比赛直播与性别有关”,从某高校男、女生中各随机抽取100人进行问卷调查,得到如下数据(5≤ m ≤15, m ∈N).通过计算,有95%以上的把握认为大学生喜欢观看体育比赛直播与性别有关,则在被调查的100名女生中喜欢观看体育比赛直播的人数的最大值为( C )
14. [2024庆阳检测]已知某池塘中水生植物的覆盖水塘面积 x (单位:dm2)与水生植物
的株数 y (单位:株)的关系可以用模型 y = c e kx ( c >0)去拟合,设 z =ln y , x 与 z 的
数据如表格所示:
15. [2024云南模拟]某新能源汽车公司从2018年到2022年汽车年销售量 y (单位:万
辆)的散点图如下:
记年份代码为 x ( x =1,2,3,4,5).(1)根据散点图判断,模型① y = a + bx 与模型② y = c + dx 2,哪一个更适宜作为年
销售量 y 关于年份代码 x 的经验回归方程?(给出判断即可,不必说明理由)
[解析] (1)由散点图知,模型②更适宜作为年销售量 y 关于年份代码 x 的经验回归方
程.(若线性相关,则可以看出各散点大概排列在一条直线附近)
(2)根据(1)的判断结果,建立 y 关于 x 的经验回归方程.
(3)预测2024年该公司新能源汽车销售量.
(2)若从树人中学所有学生中抽取11人,用样本的频率估计概率,则11人中不明显有
效运动的人数最有可能是多少?
相关课件
这是一份新高考数学一轮复习课件第8章统计与统计分析第3讲 成对数据的统计分析(含解析),共60页。PPT课件主要包含了回归分析,独立性检验,12×2列联表,2独立性检验,名师点睛,题组一,走出误区,答案1√,2√3×,题组二等内容,欢迎下载使用。
这是一份2025版高考数学全程一轮复习第九章统计与成对数据的统计分析第三节成对数据的统计分析课件,共60页。PPT课件主要包含了课前自主预习案,课堂互动探究案,正相关,负相关,预测值,是否独立,答案C,答案A,答案73,答案D等内容,欢迎下载使用。
这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析课件,共60页。PPT课件主要包含了去精确地决定,正相关或负相关,一条直线,相关或曲线相关,非线性,正相关,负相关,bx+a+e,因变量或响应变量,自变量或解释变量等内容,欢迎下载使用。