





所属成套资源:备战2024年高考数学一轮复习精讲精练高效测(新教材新高考)
- 第07讲 抛物线 (精讲)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考) 试卷 0 次下载
- 第09讲 高考难点突破一:圆锥曲线的综合问题(定点问题) (精讲)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考) 试卷 0 次下载
- 第04讲 拓展一:非线性经验回归方程 (精讲)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考) 试卷 0 次下载
- 第05讲 第九章 统计与成对数据的统计分析(综合测试)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考) 试卷 0 次下载
- 第01讲 分类加法计数原理与分步乘法计数原理 (精讲)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考) 试卷 0 次下载
第03讲 成对数据的统计分析 (精练)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考)
展开
这是一份第03讲 成对数据的统计分析 (精练)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考),文件包含第03讲成对数据的统计分析精练原卷版docx、第03讲成对数据的统计分析精练解析版docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。
A夯实基础
一、单选题
1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
【答案】C
【详解】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析预测和估计两个变量之间具有的相关关系;
独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.
故ABD错误,C正确.
故选:C.
2.(2022·陕西西安·高一期末)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有( )
A.①②B.①③C.②④D.③④
【答案】D
【详解】由图可知,③,④中各点比较均匀的分布在一条直线附近,具有线性相关关系.
故选:D.
3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是( )
A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”
B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”
C.有99.99%以上的把握认为“药物有效”
D.有99.99%以上的把握认为“药物无效”
【答案】A
【详解】因为,即,
所以在犯错误的概率不超过0.1%的前提下,认为“药物有效”或有99.9%以上的把握认为“药物有效”.
故选:A.
4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )
A.,B.,
C.,D.,
【答案】C
【详解】记三条回归直线分别为,,,
画出这三条回归直线的大致图象,如图所示,
由图可知这三条回归直线的斜率大小关系为,
截距大小关系为.
故选:C.
5.(2022·安徽·歙县教研室高二期末)已知变量的成对样本数据的四个样本点,用最小二乘法得到回归方程 过点的直线方程为,给出下列4个命题:
①;
②;
③;
④点一定在直线上.
其中正确的命题的个数是( )
参考公式:,.
A.1个B.2个C.3个D.4个
【答案】C
【详解】作出散点图,直观判断可知,,故①正确,②错误;
又,
所以,
所以
因为,所以
所以
所以的残差平方和较小,所以③正确;
由回归方程一定过样本点中心,所以④正确.
故选:C
6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生、女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
A.7B.8C.9D.10
【答案】C
【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.
故选:C
7.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元B.9.5元C.9.6元D.9.7元
【答案】B
【详解】由题意
由
所以,则
设该产品的售价为元,工厂的利润为,则
由
当且仅当,即时等号成立.
所以时,工厂的利润的最大为405元
故选:B
8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查研究发现选择函数模型来拟合y与x的关系,根据以下数据:
可求得y关于x的回归方程为( )
(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)
A.B.
C.D.
【答案】B
【详解】对等式两边同时取对数,可得:
易知:,
则
综上,可得:
又有:
可得:
故选:B
二、多选题
9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )
A.120B.130C.240D.250
【答案】AB
【详解】依题意,设男、女学生的人数均为,则被调查的男、女学生的总人数为.建立如下列联表:
则,又,
所以.
故选:AB.
10.(2022·山东聊城·高二期末)对具有相关关系的两个变量和进行回归分析时,经过随机抽样获得成对的样本数据,则下列说法正确的是( )
A.若两变量、具有线性相关关系,则回归直线至少经过一个样本点
B.变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强
C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好
D.用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为
【答案】BCD
【详解】对于A选项,若两变量、具有线性相关关系,则回归直线过样本中心点,但不一定过样本点,A错;
对于B选项,若变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强,B对;
对于C选项,用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好,C对;
对于D选项,用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为,D对.
故选:BCD.
三、填空题
11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表:
根据表中所数据,求得y与x的线性回归方程为:,则2019年该地区实际年人均收入为___________万元.
【答案】##
【详解】解:依题意,,
因为回归直线方程必过样本中心点,
所以,解得,即2019年该地区实际年人均收入为万元;
故答案为:
12.(2022·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
【答案】①③
【详解】在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
四、解答题
13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7天每天的游客人数(百人)的数据,得到下面的表格:
(1)若与具有线性相关关系,求关于的线性回归方程;
(2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需要采取限流措施?
附:线性回归方程的斜率和截距的最小二乘估计分别为,.
【答案】(1)
(2)从第14天开始.该水上乐园需要采取限流措施
(1)由表中数据得:,,计算得,∴,∴,∴,∴关于的线性回归方程为
(2)令得,解得,∴从第14天开始.该水上乐园需要采取限流措施.
14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表:
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
【答案】(1)表格见解析,有99.9%的把握认为闯红灯与年龄有关
(2)0.2
(3)答案见解析
由表中数据,得.∵,∴有99.9%的把握认为闯红灯与年龄有关.
(2)未进行处罚前,行人闯红灯的概率约为0.4,当处罚金额为10元时,行人闯红灯的概率约为,故当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2.
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;②由于试行经济处罚可以明显降低行人闯红灯的概率,则可以进行适当经济处罚来降低行人闯红灯的概率.
B能力提升
1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖种类中的抽奖系统的概率和相关保底机制如下:
基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率.
保底机制:现假定玩家从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4星)的次数增加而改变,相关机制如下表所示:
注:①表示中的最小值:
②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除;
③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于表中的值(记为p),而抽中4星的概率为.
现记玩家获得1个5星物品所需要的最大抽奖次数为N;
(1)统计10名玩家抽到第一个五星的总次数和中途抽到四星的次数如下表所示:
计算得:,已知y与x之间存在很强的线性相关关系,求出其线性回归方程,并求出使得最小的x(回归方程中的和取两位小数)
参考公式:回归直线方程斜率和截距的最小二乘估计公式分别为:.
【答案】(1),
(1)因为,代入数据得:,所以,所以y与x的线性回归方程为.当连续未抽中5星的次数,下一次抽中5星的概率为0.600%,所以下一次可能抽不中5星;当连续未抽中5星的次数,下一次抽中5星的概率0.600%,由有:,所以玩家获得1个5星物品所需要的最大抽奖次数为73. 所以,由有:,所以使得最小的x为8.
2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)为6组:,,,,,,得到如图所示的频率分布直方图.
(1)求a的值;
(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?
参考公式及数据:,.
【答案】(1);
(2)0.35;
(3)列联表答案见解析,没有99.9%的把握认为比赛成绩优秀与性别有关.
(1)由频率分布直方图知,,解得:,所以a的值是0.025.
(2)由(1)知,则比赛成绩不低于80分的频率为,所以从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35.
(3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有人,由此可得完整的2×2列联表:
零假设:比赛成绩优秀与性别无关,根据表中的数据,计算得到,依据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即没有99.9%的把握认为比赛成绩优秀与性别有关.
C综合素养
1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格:
(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程(若,则线性相关程度很高,可用直线拟合).
参考公式和数据:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,.
【答案】(1)说明答案见解析,
由题:,,
,,,
所以相关系数,
说明y与x之间的性相关程度很高,所以可用线性回归模型拟合y与x之间的关系.
,
故y关于x的线性回归方程为.
2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特长生中随机选取8名,其身高和体重的数据如表所示:
(1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为.利用已经求得的线性回归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字).
(2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.
参考公式:,,,.参考数据:,,,,.
【答案】(1)填表答案见解析,约为0.91
(2)
(1)解:对编号为6的数据:;
对编号为7的数据:;
对编号为8的数据:.
完成的残差表如下所示:
,
,
所以解释变量(身高)对于预报变量(体重)变化的贡献值约为0.91.
(2)由(1)可知,第六组数据的体重应为58,
此时,又,,,
,
,
所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为.
3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:
数据的散点图如图所示:
为近似描述y与x的关系,除了一次函数,还有和两个函数可选.
(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(保留到小数点后1位);
(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.
参考公式:,.
参考数据(其中,):,,,, ,,,,,.
【答案】(1)选用;;
(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.理由见解析.
(1)由散点图可知,这些数据集中在图中曲线的附近,
而曲线的形状与函数的图象很相似,
因此可以用类似的表达式来描述y与x的关系,
即三个函数中的图象是拟合y与x的关系“最好”的曲线.
令,则,根据已知数据,
得,,
所以,
又回归直线经过点(4,8),所以,
所以y关于x的回归直线方程为,即;
(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.
设其幼苗从观察之日起,第m天的高度为1000cm,
有,解得,
第n天的高度为1001cm,
有,解得,
天,
所以说法“高度从1000cm长到1001cm所需时间超过一年”成立.
0.025
0.010
0.005
0.001
5.02
6.635
7.879
10.828
0.05
0.01
3.841
6.635
单价x元
9
9.2
9.4
9.6
9.8
10
销量y件
100
94
93
90
85
78
茶叶量x/克
1
2
3
4
5
4.34
4.36
4.44
4.45
4.51
喜欢跑步
不喜欢跑步
总计
男
女
总计
年份
2015
2016
2017
2018
2019
年份编号x
1
2
3
4
5
年人均收入y(万元)
0.5
0.6
1
1.4
m
第天
3
4
5
6
7
游客人数(百人)
1.5
2
3
3.5
5
30岁及以下
30岁以上
总计
闯红灯
60
未闯红灯
80
总计
200
处罚金额(单位:元)
5
10
15
20
闯红灯的人数
50
40
20
0
(1)
30岁及以下
30岁以上
总计
闯红灯
20
60
80
未闯红灯
80
40
120
总计
100
100
200
物品类别
5星
4星
3星
基础概率
0.600%
5.100%
94.300%
连续未抽中4星的次数i
下一次抽中4星的概率
5.100%
连续未抽中5星的次数i
下一次抽中5星的概率
0.600%
玩家序号
1
2
3
4
5
6
7
8
9
10
总次数y
30
78
64
80
85
79
55
83
66
81
四星个数x
4
8
7
9
9
8
6
9
8
9
优秀
非优秀
合计
男生
40
女生
50
合计
100
0.10
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
优秀
非优秀
合计
男生
10
40
50
女生
25
25
50
合计
35
65
100
A区
B区
C区
D区
疫苗接种人数x/万
6
8
10
12
第三针接种人数y/万
2
3
5
6
编号
1
2
3
4
5
6
7
8
身高x()
178
173
158
167
160
173
166
169
体重y()
66
61
50
58
53
66
57
57
编号
1
2
3
4
5
6
7
8
体重y()
66
61
50
58
53
66
57
57
残差
-0.5
-1.5
-0.5
0.3
0.9
编号
1
2
3
4
5
6
7
8
体重y(kg)
66
61
50
58
53
66
57
57
残差
-0.5
-1.5
-0.5
0.3
0.9
3.5
0.1
-2.3
1
4
9
16
25
36
49
0
4
7
9
11
12
13
相关试卷
这是一份第05讲 第九章 统计与成对数据的统计分析(综合测试)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考),文件包含第05讲第九章统计与成对数据的统计分析综合测试原卷版docx、第05讲第九章统计与成对数据的统计分析综合测试解析版docx等2份试卷配套教学资源,其中试卷共27页, 欢迎下载使用。
这是一份第03讲 圆的方程 (精练)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考),文件包含第03讲圆的方程精练原卷版-高考数学一轮复习讲练测新教材新高考docx、第03讲圆的方程精练解析版-高考数学一轮复习讲练测新教材新高考docx等2份试卷配套教学资源,其中试卷共18页, 欢迎下载使用。
这是一份第03讲 圆的方程 (精讲)-备战2024年高考数学一轮复习精讲精练高效测(新教材新高考),文件包含第03讲圆的方程精讲原卷版-高考数学一轮复习讲练测新教材新高考docx、第03讲圆的方程精讲解析版-高考数学一轮复习讲练测新教材新高考docx等2份试卷配套教学资源,其中试卷共28页, 欢迎下载使用。
