所属成套资源:2025版高考数学全程一轮复习练习(Word版附解析)
2025版高考数学全程一轮复习练习第九章统计与成对数据的统计分析第三节成对数据的统计分析
展开这是一份2025版高考数学全程一轮复习练习第九章统计与成对数据的统计分析第三节成对数据的统计分析,共19页。试卷主要包含了了解样本相关系数的统计意义.,8 20,3 34,2 11,971 B.5,775 D.9,8+9等内容,欢迎下载使用。
1.了解样本相关系数的统计意义.
2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会用一元线性回归模型进行预测.
3.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
问题思考·夯实技能
【问题1】 在回归分析的过程中,散点图、样本相关系数r、决定系数R2的作用相同吗?
【问题2】 根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变量有关的把握越大对吗?
关键能力·题型剖析
题型一 成对数据的统计相关性
例1 (1)[2024·河南南阳模拟]某同学在研究变量x,y之间的相关关系时,得到以下数据:并采用最小二乘法得到了经验回归方程 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) ,则( )
A. eq \(a,\s\up6(^)) >0, eq \(b,\s\up6(^)) >0 B. eq \(a,\s\up6(^)) >0, eq \(b,\s\up6(^)) <0
C. eq \(a,\s\up6(^)) <0, eq \(b,\s\up6(^)) <0 D. eq \(a,\s\up6(^)) <0, eq \(b,\s\up6(^)) >0
(2)(多选)[2024·河北沧州模拟]医学上判断体重是否超标有一种简易方法,就是用一个人身高的厘米数减去105所得差值即为该人的标准体重.比如身高175 cm的人,其标准体重为175-105=70公斤,一个人实际体重超过了标准体重,我们就说该人体重超标了,现分析某班学生的身高和体重的相关性时,随机抽测了8人的身高和体重,数据如下表所示:
由最小二乘法计算得到经验回归直线l1的方程为 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) 1x+ eq \(a,\s\up6(^)) 1,相关系数为r1,决定系数为R eq \\al(\s\up11(2),\s\d4(1)) ;经过残差分析确定有一个样本点为离群点(对应残差过大),把它去掉后,再用剩下的7组数据计算得到经验回归直线l2的方程为 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) 2x+ eq \(a,\s\up6(^)) 2,相关系数为r2,决定系数为R eq \\al(\s\up11(2),\s\d4(2)) ,则( )
A. r1
C.r1>r2 D.R eq \\al(\s\up11(2),\s\d4(1))
判断数据的相关关系的三种方法
巩固训练1
(1)下列图中,能反映出相应两个变量之间具有线性相关关系的是( )
(2)对两个变量x,y进行线性相关检验,得线性相关系数r1=0.899 5,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
题型二 回归模型
角度一 一元线性回归模型
例2 [2024·辽宁辽阳模拟]2022年12月份以来,全国多个地区纷纷采取不同的形式发放多轮消费券,助力消费复苏.记发放的消费券额度为x(百万元),带动的消费为y(百万元).某省随机抽查的一些城市的数据如下表所示.
(1)根据表中的数据,请用相关系数说明y与x有很强的线性相关关系,并求出y关于x的经验回归方程.
(2)(ⅰ)若该省A城市在2023年2月份准备发放一轮额度为10百万元的消费券,利用(1)中求得的经验回归方程,预计可以带动多少消费?
(ⅱ)当实际值与估计值的差的绝对值与估计值的比值不超过10%时,认为发放的该轮消费券助力消费复苏是理想的.若该省A城市2月份发放额度为10百万元的消费券后,经过一个月的统计,发现实际带动的消费为30百万元,请问发放的该轮消费券助力消费复苏是否理想?若不理想,请分析可能存在的原因.
题后师说
求经验回归方程的步骤
巩固训练2
[2024·吉林长春模拟]偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某同学的某科考试成绩与该科平均成绩的差叫某科偏差(实际成绩-平均成绩=偏差).在某次考试成绩统计中,教研人员为了对学生数学偏差x(单位:分)与物理偏差y(单位:分)之间的关系进行分析,随机挑选了8位同学,得到他们的两科成绩偏差数据如下:
(1)若x与y之间具有线性相关关系,求y关于x的经验回归方程;
(2)若本次考试数学平均成绩为100分,物理平均成绩为70.5分,试由(1)的结论预测数学成绩为116分的同学的物理成绩.
角度二 非线性回归模型
例3 [2024·河北承德模拟]某公司研制了一种对人畜无害的灭草剂,为了解其效果,通过实验,收集到其不同浓度x(ml/L)与灭死率y的数据,得下表:
(1)以x为解释变量,y为响应变量,在 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 和 eq \(y,\s\up6(^)) = eq \(c,\s\up6(^)) 1+ eq \(c,\s\up6(^)) 2lg x中选一个作为灭死率y关于浓度x(ml/L)的经验回归方程,不用说明理由;
(2)(i)根据(1)的选择结果及表中数据,求出所选经验回归方程;
(ii)依据(i)中所求经验回归方程,要使灭死率不低于0.8,估计该灭草剂的浓度至少要达到多少ml/L?
题后师说
解决非线性回归模型的应用问题的关键是对非线性回归函数模型作变换,一般思路是换元,化非线性为线性,进而应用线性回归的方法进行求解.如
①若 eq \(y,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) eq \r(x) ,设t= eq \r(x) ,则 eq \(y,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) t;
②若满足对数式: eq \(y,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) ln x,设t=ln x,则 eq \(y,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) t;
③若满足指数式:y=c1ec2x,两边取对数得ln y=ln c1+c2x,设z=ln y, eq \(a,\s\up6(^)) =ln c1, eq \(b,\s\up6(^)) =c2,则 eq \(z,\s\up6(^)) = eq \(a,\s\up6(^)) + eq \(b,\s\up6(^)) x.
巩固训练3
[2024·山东滨州模拟]为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1~10分别对应年份2013~2022.
根据散点图,分别用模型①y=bx+a,②y=c+d eq \r(x) 作为年研发投入y关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y关于年份代码x的经验回归方程模型?并说明理由;
(2)根据(1)中所选模型,求出y关于x的经验回归方程,并预测该公司2028年的高科技研发投入.
题型三 独立性检验
例4 [2023·全国甲卷]一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表
(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,
题后师说
独立性检验的一般步骤
巩固训练4
[2024·河北秦皇岛模拟]某市电视台为了解一档节目收视情况,随机抽取了该市n对夫妻进行调查,根据调查得到每人日均收看该节目的时间绘制成如图所示的频率分布直方图,收视时间不低于40分钟的观众称为“热心观众”,收视时间低于40分钟的观众称为“非热心观众”,已知抽取样本中收视时间低于10分钟的有10人.
(1)求n,p;
(2)根据已知条件完成下面2×2列联表,试根据小概率值α=0.05的独立性检验,分析“热心观众”是否与性别有关.
附:χ2= eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) ,其中n=a+b+c+d.
1.[2023·天津卷]调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是( )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
2.[2024·黑龙江大庆模拟]我国西北某地区开展改造沙漠的巨大工程,该地区对近5年投入的沙漠治理经费x(亿元)和沙漠治理面积y(万亩)的相关数据统计如下表所示.
根据表中所给数据,得到y关于x的经验回归方程为 eq \(y,\s\up6(^)) =2x+a,则a=( )
A.1 B.2
C.3 D.4
3.[2024·福建莆田模拟]根据分类变量X和Y的样本观察数据的计算结果,有不少于99.5%的把握认为X和Y有关,则χ2的一个可能取值为( )
A. 3.971 B.5.872
C.6.775 D.9.698
4.[2024·江苏镇江模拟]2023年五一节日期间,通过对某一路口在具体时刻的瞬时速度进行观测统计发现,时刻x和瞬时速度y的关系如下:
由表中数据得到的经验回归方程为 eq \(y,\s\up6(^)) =-4x+a,则由此可预测此路口11时的瞬时速度为__________.
第三节 成对数据的统计分析
问题思考·夯实技能
【问题1】 提示:不同.散点图判定两个分类变量是否具有相关关系,样本相关系数r判定两个分类变量相关性的强弱,决定系数R2判定所选模型拟合的程度.
【问题2】 提示:正确.
关键能力·题型剖析
例1 解析:(1)画出散点图如下:
从而可以看出 eq \(y,\s\up6(^)) = eq \(b,\s\up6(^)) x+ eq \(a,\s\up6(^)) 中, eq \(b,\s\up6(^)) >0, eq \(a,\s\up6(^)) <0.故选D.
(2)去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,且由表可知,两个变量呈正相关,所以r1
答案:(1)D (2)AD
巩固训练1 解析:(1)对于A,由图象可知,两个变量是确定的函数关系,不是相关关系,故A不正确;对于B,由散点图可知,散点呈带状分布,所以两个变量具有线性相关关系,故B正确;由散点图可知,散点不呈带状分布,所以两个变量不具有线性相关关系,故CD不正确.故选B.
(2)因为线性相关系数r1=0.899 5>0,所以x,y正相关,
因为线性相关系数r2=-0.956 8<0,所以u,v负相关,
又因为|r1|<|r2|,所以变量u,v的线性相关性比x,y的线性相关性强,故A、B、D错误,C正确.故选C.
答案:(1)B (2)C
例2
巩固训练2
例3
例4 解析:(1)试验组样本平均数为:
eq \f(1,20) (7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)= eq \f(396,20) =19.8.
(2)(ⅰ)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排列后第20位与第21位数据的平均数,
由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,…,
故第20位为23.2,第21位数据为23.6,
所以m= eq \f(23.2+23.6,2) =23.4,
故列联表为:
(ⅱ)由(ⅰ)可得,K2= eq \f(40×(6×6-14×14)2,20×20×20×20) =6.400>3.841,
所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.
巩固训练4 解析:(1)收视时间在0~10分钟组的频率为1-(0.018+0.022+0.025+0.020+0.005)×10=0.1,
∴p= eq \f(0.1,10) =0.01,
又∵收视时间低于10分钟的有10人,∴2n= eq \f(10,0.1) ,∴n=50.
(2)∵n=50,
∴“热心观众”有2×50×(0.020+0.005)×10=25人,
则2×2列联表如图所示,
零假设H0:“热心观众”与性别无关联.
将2×2列联表数据代入公式计算得:χ2= eq \f(100×(35×10-40×15)2,50×50×75×25) = eq \f(4,3) ≈1.333<3.841,
根据小概率值α=0.05的独立性检验,没有充分证据证明H0不成立,
因此可认为H0成立,即认为“热心观众”与性别无关联.
随堂检测
1.解析:根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关,B选项错误,C选项正确;由于r=0.824 5是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.824 5,D选项错误.故选C.
答案:C
2.解析: eq \(x,\s\up6(-)) = eq \f(3+4+5+6+7,5) =5, eq \(y,\s\up6(-)) = eq \f(10+12+11+12+20,5) =13,
因回归方程过定点( eq \(x,\s\up6(-)) , eq \(y,\s\up6(-)) ),将其代入 eq \(y,\s\up6(^)) =2x+a,得13=2×5+a,解得a=3.故选C.
答案:C
3.解析:因为有不少于99.5%的把握认为X和Y有关,所以χ2≥7.879,9.698≥7.879,满足题意,故选D.
答案:D
4.解析:由题意可得, eq \(x,\s\up6(-)) = eq \f(4+5+6+7+8+9,6) = eq \f(13,2) ,
eq \(y,\s\up6(-)) = eq \f(90+84+83+80+75+68,6) =80,
则80=-4× eq \f(13,2) +a,解得a=106,
当x=11时, eq \(y,\s\up6(^)) =-4×11+106=62.
答案:62
x
4.8
5.8
7
8.3
9.1
y
2.8
4.1
7.2
9.1
11.8
编号
1
2
3
4
5
6
7
8
身高x/cm
165
168
170
172
173
174
175
177
体重y/kg
55
89
61
65
67
70
75
75
x
3
3
4
5
5
6
6
8
y
10
12
13
18
19
21
24
27
学生序号
1
2
3
4
5
6
7
8
数学偏差x/分
20
15
13
3
2
-5
-10
-18
物理偏差y/分
6.5
3.5
3.5
1.5
0.5
-0.5
-2.5
-3.5
浓度x(ml/L)
10-12
10-10
10-8
10-6
10-4
灭死率y
0.1
0.24
0.46
0.76
0.94
对照组
试验组
P(x2≥k0)
0.100
0.050
0.010
k0
2.706
3.841
6.635
非热心观众
热心观众
总计
男
女
10
总计
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
治理经费x/亿元
3
4
5
6
7
治理面积y/万亩
10
12
11
12
20
α
0.10
0.05
0.025
0.010
0.005
xα
2.706
3.841
5.024
6.635
7.879
x(时)
4
5
6
7
8
9
y(速度)
90
84
83
80
75
68
合计
对照组
6
14
20
试验组
14
6
20
合计
20
20
40
非热心观众
热心观众
总计
男
35
15
50
女
40
10
50
总计
75
25
100
相关试卷
这是一份2025版高考数学一轮总复习知识梳理训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析,共6页。试卷主要包含了相关关系,散点图,正相关、负相关,变量的线性相关,样本相关系数等内容,欢迎下载使用。
这是一份2025版高考数学一轮总复习素养提升训练题第9章统计成对数据的统计分析第2讲成对数据的统计分析,共4页。试卷主要包含了8+10,1+10,635=x0,5和SO2浓度,得下表,484,841等内容,欢迎下载使用。
这是一份2025版高考数学一轮总复习第9章统计成对数据的统计分析第2讲成对数据的统计分析提能训练,共14页。试卷主要包含了单选题,多选题,填空题,解答题等内容,欢迎下载使用。