专题17 统计-备战2022年高考数学(理)母题题源解密(全国乙卷)
展开专题17 统计
【母题来源】2021年高考乙卷
【母题题文】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【答案】(1);(2)新设备生产产品的该项指标的均值较旧设备有显著提高.
【试题解析】(1),
,
,
.
(2)依题意,,,
,所以新设备生产产品的该项指标的均值较旧设备有显著提高.
【命题意图】
1. 会计算数据的平均数,方差
2. 考查阅读理解能力、数据处理能力、运算求解能力,考查逻辑推理、数学建模、数学运算、数据分析等核心素养.
【命题方向】
从近几年高考试题可以看出,本知识点越来越注重对试题的理解以及数学建模能力的考查,综合性强,多为古典概型与频率分布表、茎叶图、频率分布直方图、回归分析、独立性检验等交汇考查.解题的关键是认真读题,读懂题意,才能利用所学数学知识来解决.
【得分要点】
众数、中位数、平均数、方差、标准差定义
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
(4)一组数据x1,x2,…,xn,用表示这组数据的平均数,
则这组数据的方差为=(-),
标准差为.
1.(2021·河南高一三模)机床生产一批参考尺寸为的零件,从中随机抽取个,量得其尺寸如下表(单位:):
序号
1
2
3
4
5
6
7
8
9
10
尺寸
6.3
5.8
6.2
5.9
6.2
6.0
5.8
5.8
5.9
6.1
(1)求样本零件尺寸的平均值与标准差;
(2)估计这批零件尺寸位于的百分比.
参考数据:取.
【答案】(1),;(2).
【分析】
(1)由平均数和标准差计算公式可直接计算求得结果;
(2)由(1)可求得区间为,利用样本估计总体的思想可直接计算得到结果.
【详解】
(1)由表格数据得:,
,;
(2)由(1)可知:,.
这件样本中,尺寸在内的共有件,
以样本估计总体,则这批零件尺寸位于的百分比约为.
2.(2021·河南高二月考(理))在2021年高考体检中,某校随机选取了20名男生,测得其身高数据如下(单位)
序号
1
2
3
4
5
6
7
8
9
10
身高
168
167
165
186
178
158
序号
11
12
13
14
15
16
17
18
19
20
身高
166
178
175
169
172
177
182
169
168
176
由于统计时出现了失误,导致号的身高数据丢失,先用字母表示,但是已知这4个人的身高都在之间(单位,且这20组身高数据的平均数为,标准差为
(1)为了更好地研究本校男生的身高数据,决定用这20个数据中在区间以内的数据,重新计算其平均数与方差,据此估计,高校男生身高的平均值与方差分别为多少(方差保留两位小数)?
(2)使用统计学的观点说明,以内的数据与原数据对比,有什么特点(主要用平均数与方差进行说明)?(参考公式)
【答案】(1)平均数为,方差为;(2)答案见解析.
【分析】
(1)由题先算出,故需剔除158和,新数据的平均数为:,方差为:,化简计算即可;
(2)由新数据样本数占总数据的90%可知,样本数据较集中,平均数无变化,即平均身高无变化,方差变小,即数据更集中,更具代表性
【详解】
(1)由条件可得区间,
在区间外的数据有158和剔除后,剩余18个数据,其平均数为:,
方差为:,
,
(2)以内的数据与原数据对比,有以下特点:
①以内的数据的的占总数据个数的,
说明该校左右的男生身高都在区间以内;
②以内的数据与原数据对比,平均数没变,即平均身高没有变化;
③原数据的方差为49,而以内的数据的方差约为32.67,方差变小了,
说明剔除两个极端数据后,数据更趋于集中,更具有代表性.
3.(2021·全国高一课时练习)某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74.
(1)求这10个学生体重数据的平均数、中位数、方差、标准差;
(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.
【答案】(1)平均数71、中位数71.5、方差11、标准差;(2)平均数为71,中位数为71.5,方差为11,标准差为.
【分析】
(1)根据平均数、中位数、方差、标准差的计算公式即可求解.
(2)由(1)计算的数据即可得出结果.
【详解】
解:(1)这10个学生体重数据的平均数为
=×(74+71+72+68+76+73+67+70+65+74)=71.
这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,
位于中间的两个数是71,72,∴这10个学生体重数据的中位数为.
这10个学生体重数据的方差为
s2=×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+
(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-71)2]=11,
这10个学生体重数据的标准差为s=.
(2)由样本估计总体得高一所有学生体重数据的平均数为71,
中位数为71.5,方差为11,标准差为.
4.(2021·合肥一六八中学高三其他模拟(理))2020年是全面建成小康社会之年,是脱贫攻坚收官之年.莲花村是乡扶贫办的科学养鱼示范村,为了调查该村科技扶贫成果,乡扶贫办调查组从该村的养鱼塘内随机捕捞两次,上午进行第一次捕捞,捕捞到60条鱼,共105kg,称重后计算得出这60条鱼质量(单位kg)的平方和为200.41,下午进行第二次捕捞,捕捞到40条鱼,共66kg.称重后计算得出这40条鱼质量(单位kg)的平方和为117.
(1)请根据以上信息,求所捕捞100条鱼质量的平均数和方差;
(2)根据以往经验,可以认为该鱼塘鱼质量X服从正态分布,用作为的估计值,用作为的估计值.随机从该鱼糖捕捞一条鱼,其质量在的概率是多少?
(3)某批发商从该村鱼塘购买了1000条鱼,若从该鱼塘随机捕捞,记为捕捞的鱼的质量在的条数,利用(2)的结果,求的数学期望.
附:(1)数据,,…的方差,
(2)若随机变量X服从正态分布,则;;.
【答案】(1),;(2);(3).
【分析】
(1)根据题目中的数据先求出平均数,再结合给出的方差公式可求得方差.
(2)根据题意可得,则,根据题目给出的数据,结合正态分布曲线的性质可得答案.
(3) 由(2)可得鱼的质量在的概率为,则,由二项分布的数学期望公式可得答案.
【详解】
解:(1),.
(2)该鱼塘鱼质量满足,其中,,即
则,
∴.
(3)由(2)可得鱼的质量在的概率为.
由题意可知,
由二项分布的数学期望公式可得,的数学期望为.
5.(2021·河南洛阳市·高三二模(文))改革开放以来,我国经济持续高速增长.如图给出了我国2010年至2019年第二产业增加值与第一产业增加值的差值(以下简称为:产业差值)的折线图,记产业差值为(单位:万亿元).
注:年份代码1-10分别对应年份2010-2019.
(1)求出关于年份代码的线性回归方程;
(2)利用(1)中的回归方程,分析2010-2019年我国产业差值的变化情况,并预测我国产业差值在哪一年约为34万亿元;
(3)结合折线图,试求出除去2014年产业差值后剩余的9年产业差值的平均值及方差(结果精确到0.1).
附:回归直线的斜率和截距的最小二乘法估计公式分别为:,.样本方差公式:.参考数据:,,.
【答案】(1);(2)2010-2019年我国产业差值逐年增加,平均每年增加1.6万亿元,预测我国产业差值在2029约为34万亿元;(3)平均值为,方差为.
【分析】
求出回归系数,求出回归方程即可;
根据的值,即可分析变化情况,令即可求解;
结合折线图求出平均值和方差即可.
【详解】
解:(1)由题意可得,,,,
所以,
故,
所以回归直线为;
(2)由(1)值,,
故2010-2019年我国产业差值逐年增加,平均每年增加1.6万亿元,
令,解得,
故预测我国产业差值在2029约为34万亿元;
(3)结合折线图,2014年产业差值为10.8万亿元,
除去2014年(时)产业差值外的9年的产业差值的平均值为,
又,故除去2014年(时)产业差值外的9年的产业差值的方差为.
6.(2021·河南南阳市·高一月考)某地区拟举办汉字听写大赛,某校为了选拔优秀的学生参加比赛,在本校举行了次汉字听写大赛,其中甲、乙两位同学的成绩最优异,由甲、乙两位同学的成绩绘制的茎叶图如图所示.已知甲成绩的中位数小于乙成绩的中位数.
(1)求的值;
(2)若要从甲、乙中选择一名同学参加该地区举办的汉字听写大赛,试从统计学的角度分析,选哪位同学比较合适.
【答案】(1)0;(2)乙同学比较合适.
【分析】
(1)由乙的中位数为91,甲的中位数(90+x)小于91得解;
(2)计算甲乙二人三次成绩的平均数、方差等特征数据,再分析选择.
【详解】
(1)由茎叶图可知,乙同学成绩的中位数为.
又由茎叶图可得甲同学成绩的中位数大于或等于,
且甲成绩的中位数小于乙成绩的中位数,所以甲同学成绩的中位数只能为,
故.
(2)甲同学成绩的平均数为,
乙同学成绩的平均数为,
所以甲、乙成绩的平均数相等.
甲同学成绩的方差,
乙同学成绩的方差,
,所以乙同学的成绩更稳定,选乙同学比较合适.
7.(2021·全国高三专题练习)若甲、乙两台机床同时加工直径为100 mm的零件,为了检验产品的质量,从产品中随机抽取6件进行测量,测得数据如下:(单位:mm):甲:99,100,100,98,100,103;乙:99,100,102,99,100,100.通过计算,请你说明哪一台机床加工的零件更符合要求.
【答案】乙机床加工的零件更符合要求.
【分析】
计算平均数以及方差,利用方差的性质进行判断.
【详解】
,
,说明甲机床加工的零件波动比较大.
故乙机床加工的零件更符合要求.
8.(2021·山东高三二模)2020年是全面建成小康社会之年,是脱贫攻坚收官之年.上坝村是乡扶贫办的科学养鱼示范村,为了调查上坝村科技扶贫成果,乡扶贫办调查组从该村办鱼塘内随机捕捞两次,上午进行第一次捕捞,捕捞到60条鱼,共105,称重后计算得出这60条鱼质量(单位)的平方和为200.41,下午进行第二次捕捞,捕捞到40条鱼,共66.称重后计算得出这40条鱼质量(单位)的平方和为117.
(1)请根据以上信息,求所捕捞100条鱼儿质量的平均数和方差;
(2)根据以往经验,可以认为该鱼塘鱼儿质量服从正态分布,用作为的估计值,用作为的估计值.随机从该鱼塘捕捞一条鱼,其质量在的概率是多少?
(3)某批发商从该村鱼塘购买了5000条鱼,若从该鱼塘随机捕捞,记为捕捞的鱼儿质量在的条数,利用(2)的结果,求的数学期望.
附:(1)数据,,…的方差,(2)若随机变量服从正态分布,则;;.
【答案】(1),;(2);(3).
【分析】
(1)利用平均数及方差公式直接得解;
(2)由题知,结合参考数据即可得解;
(3)利用二项分布期望公式直接得解.
【详解】
(1),.
(2)该鱼塘鱼儿质量,其中,,
所以.
(3)由题意可知,
所以的数学期望为.
【点睛】
关键点点睛:本题考查平均数与方差的计算,考查正态分布及二项分布的应用,数学二项分布,则是解题的关键,考查学生的计算能力,属于一般题.
9.(2021·江苏高一课时练习)某校医务室随机抽查了高一10位男同学的体重(单位:kg)如下:
74,71,72,68,76,73,67,70,65,74.
(1)估计高一所有男同学体重数据的平均数、中位数、方差、标准差;
(2)高一10位男同学的体重数据中,位于[-s,+s]内的有几个?所占的百分比是多少?
【答案】(1)答案见解析;(2)7个, 70%.
【分析】
(1)直接利用平均数公式计算平均数,对这10个数排列,位中间的两个数的平均数为中位数,利用方差公式直接求方差,方差的算术平方根为标准差;
(2)由(1)可知,从而可求得结果
【详解】
(1)这10位男同学的体重数据的平均数×(74+71+72+68+76+73+67+70+65+74)=71.
将这10位男同学的体重数据按从小到大重新排列,得65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,
所以这10位男同学的体重数据的中位数为,这10位男同学的体重数据的方差s2=×[(74-71)2+(71-71)2+(72-71)2+(68-71)2+(76-71)2+(73-71)2+(67-71)2+(70-71)2+(65-71)2+(74-712)]=11,
标准差.
(2)因为,
所以数据74,71,72,68,76,73,67,70,65,74中,有7个数据位于区间内,所占的百分比为70%.
10.(2021·江苏高一课时练习)某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.
【答案】平均数为39.2岁,方差为20.64
【分析】
首先计算高级职称教师的平均年龄和年龄的方差,再利用公式分别的平均数和方差公式计算总的平均数和方差.
【详解】
由已知条件可知高级职称教师的平均年龄为
高==45(岁),
年龄的方差为
=×[3×(58-45)2+5×(40-45)2+2×(38-45)2]
=73,
所以该校中级职称和高级职称教师的平均年龄为
=×38+×45≈39.2(岁),
该校中级职称和高级职称教师的年龄的方差是
s2=×[2+(38-39.2)2]+×[73+(45-39.2)2]
=20.64.
11.(2021·江苏高一课时练习)某化肥厂有甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记录抽查数据如下(单位:kg):
甲:102 101 99 98 103 98 99
乙:110 115 90 85 75 115 110
试计算甲、乙两个车间产品质量的平均数与方差,并说明哪个车间产品比较稳定.
【答案】甲车间的平均数为,方差为,乙车间的平均数为,方差为,甲车间产品比较稳定.
【分析】
分别计算甲、乙车间的平均数和方差即可得到答案.
【详解】
甲的平均数,
甲的方差为
.
乙的平均数,
乙的方差为
.
因为,,所以甲车间产品比较稳定.
12.(2021·北京高三一模)单板滑雪型池比赛是冬奥会比赛中的一个项目,进入决赛阶段的名运动员按照预赛成绩由低到高的出场顺序轮流进行三次滑行,裁判员根据运动员的腾空高度、完成的动作难度和效果进行评分,最终取单次最高分作为比赛成绩.现有运动员甲、乙二人在2021赛季单板滑雪型池世界杯分站比赛成绩如下表:
分站
运动员甲的三次滑行成绩
运动员乙的三次滑行成绩
第1次
第2次
第3次
第1次
第2次
第3次
第1站
80.20
86.20
84.03
80.11
88.40
0
第2站
92.80
82.13
86.31
79.32
81.22
88.60
第3站
79.10
0
87.50
89.10
75.36
87.10
第4站
84.02
89.50
86.71
75.13
88.20
81.01
第5站
80.02
79.36
86.00
85.40
87.04
87.70
假设甲、乙二人每次比赛成绩相互独立.
(1)从上表5站中随机选取1站,求在该站运动员甲的成绩高于运动员乙的成绩的概率;
(2)从上表5站中任意选取2站,用表示这2站中甲的成绩高于乙的成绩的站数,求的分布列和数学期望;
(3)假如从甲、乙2人中推荐1人参加2022年北京冬奥会单板滑雪型池比赛,根据以上数据信息,你推荐谁参加,并说明理由.
(注:方差,其中为,,…,的平均数)
【答案】(1);(2)分布列答案见解析,数学期望:;(3)答案见解析.
【分析】
(1)先得到甲站和乙站的成绩,再根据该站运动员甲的成绩高于运动员乙的成绩,由古典概型求解;
(2)的可能取的值为,然后分别求得其相应的概率,列出分布列,根据分布列中的数据再求期望;
(3)根据甲站和乙站的平均成绩以及方差比较下结论.
【详解】
(1)设“该站运动员甲的成绩高于该站运动员乙的成绩”为事件;
运动员乙第1站、第2站、第3站、第4站、第5站的成绩分别为:,
运动员甲第1站、第2站、第3站、第4站、第5站的成绩分别为: ,
其中第2站和第4站甲的成绩高于乙的成绩
,
(2)的可能取的值为,则
所以的分布列为
0
1
2
(3)推荐乙.
甲5站的平均成绩为:
乙5站的平均成绩为:
甲5站成绩方差为:乙5站成绩方差为:说明甲乙二人水平相当,表明乙的发挥比甲的更稳定
所以预测乙的成绩会更好.
【点睛】
方法点睛:(1)求解离散型随机变量X的分布列的步骤:①理解X的意义,写出X可能取的全部值;②求X取每个值的概率;③写出X的分布列.(2)求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时,要注意应用计数原理、古典概型等知识.
13.(2021·河南商丘市·高一月考)某教练统计了甲、乙两名三级跳远运动员连续次的跳远成绩(单位:米),统计数据如图所示.
(1)分别求甲、乙跳远成绩的平均数;
(2)通过平均数和方差分析甲、乙两名运动员的平均水平和发挥的稳定性.
【答案】(1),;(2)答案见解析.
【分析】
(1)利用平均数的定义直接求解即可;
(2)利用方差公式求出甲、乙两名运动员的方差,利用方差越小数据越稳定判断即可
【详解】
解:(1)根据题意可知,
.
(2),
.
,,
甲、乙两名运动员的平均水平相当,甲的发挥更稳定.
14.(2021·北京市第四中学顺义分校高一期末)以下茎叶图记录了甲、乙两组各三名同学在期末考试中的数学成绩.乙组记录中有一个数字模糊,无法确认,假设这个数字具有随机性,并在图中以a表示.
(I)若甲、乙两组的数学平均成绩相同,求a的值;
(II)求乙组平均成绩超过甲组平均成绩的概率;
(III)当时,试比较甲、乙两组同学数学成绩的方差的大小.(结论不要求证明)
【答案】(I);(II);(III)甲组同学数学成绩的方差大于乙组同学数学成绩的方差.
【分析】
(I)先求解出甲、乙两组的数学平均成绩,根据平均成绩相同求解出的值;
(II)先确定出的所有可取值,再求解出满足条件的的取值,根据满足条件的取值个数与总的可取值个数的比值求解出对应概率;
(III)根据数据的分布情况直接判断出甲、乙两组同学数学成绩的方差大小.
【详解】
(I)因为,且,所以,所以;
(II)记“乙组平均成绩超过甲组平均成绩”为事件,
因为乙组平均成绩超过甲组平均成绩,所以,所以,
所以的可取值有:,共个数,
又因为,集合中共有个元素,
所以;
(III)甲组同学数学成绩的方差大于乙组同学数学成绩的方差.
(理由如下:因为,所以,
,因为,所以)
15.(2021·宁夏银川市·贺兰县景博中学高二期末(文))某化肥厂甲、乙两个车间负责包装肥料,在自动包装传送带上每隔30秒抽取一包产品,称其重量,分别记录抽查数据如下:
甲:102,111,89,98,103,98,99;
乙:104,111,87,100,99,98,101.
(1)这种抽样方法是那种抽样方法?
(2)用茎叶图表示这两组数据;
(3)计算这两组数据的平均数和方差,说明那个车间的产品比较稳定.
【答案】(1)系统抽样;(2)茎叶图答案见解析;(3)甲、乙两组数据的平均数分别为:,,甲、乙两组数据的方差分别是:,,甲比乙较稳定.
【分析】
(1)根据系统抽样的特点进行判断即可;
(2)用茎叶图直接表示即可;
(3)用平均数和方差的定义进行运算,根据方差的意义进行判断即可.
【详解】
解:(1)根据系统抽样的特点是从比较多且均衡的个体中抽取一定的样本,该样本的抽取方法是系统抽样;
(2)把甲乙两组数据用茎叶图表示如图所示:
(3)甲组数据的平均数是,
乙组数据的平均数是;
甲组数据的方差是
,
乙组数据的方差是
;∴甲比乙较稳定.
专题17 统计-备战2022年高考数学(理)母题题源解密(全国乙卷)(原卷版)无答案: 这是一份专题17 统计-备战2022年高考数学(理)母题题源解密(全国乙卷)(原卷版)无答案,共8页。
专题17 概率统计(解答题)-备战2022年高考数学(理)母题题源解密(全国甲卷)(原卷版): 这是一份专题17 概率统计(解答题)-备战2022年高考数学(理)母题题源解密(全国甲卷)(原卷版),共20页。试卷主要包含了概率的基本性质,求复杂事件的概率通常有两种方法等内容,欢迎下载使用。
专题20 导数-备战2022年高考数学(理)母题题源解密(全国乙卷)(解析版): 这是一份专题20 导数-备战2022年高考数学(理)母题题源解密(全国乙卷)(解析版),共21页。