高考数学一轮复习考点探究与题型突破第64讲 用样本估计总体(原卷版+解析)
展开1.总体百分位数的估计
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把eq \f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq \(x,\s\up6(-)),则这组数据的标准差和方差分别是s=
eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]),
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
考点1 百分位数
[名师点睛]
计算一组数据的第p百分位数的步骤
[典例]
1.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是( )
A.-2 B.0 C.1 D.2
2.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为________,第86百分位数为________.
[举一反三]
1.(多选)已知100个数据的第75百分位数是9.3,则下列说法不正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
2.将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是________.(结果保留两位小数)
考点2 总体的集中趋势估计
[名师点睛]
(1)众数、中位数、平均数的应用要点
中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
(2)频率分布直方图的数字特征
①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
③平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
[典例]
1.某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):
(1)请你计算这两组数据的平均数、中位数;
(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.
2.首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
[举一反三]
1.(2023·成都质检)有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是( )
A.甲射击的平均成绩比乙好
B.乙射击的平均成绩比甲好
C.甲射击的成绩的众数小于乙射击的成绩的众数
D.甲射击的成绩的中位数等于乙射击的成绩的中位数
2.(多选)(2023·长沙模拟)某校高二年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组为:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150),得到的频率分布直方图如图所示,则下列说法中正确的是( )
A.a=0.045
B.这800名学生中数学成绩在110分以下的人数为160
C.这800名学生数学成绩的中位数约为121.4
D.这800名学生数学成绩的平均数为125
考点3 总体离散程度的估计
[名师点睛]
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度越大;标准差(方差)较小,数据的离散程度越小.
[典例]
(2023·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为eq \x\t(x)和eq \x\t(y),样本方差分别记为seq \\al(2,1)和seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果eq \x\t(y)-eq \x\t(x)≥2eq \r(\f(s\\al(2,1)+s\\al(2,2),10)),则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
[举一反三]
(2023·蚌埠质检)某校计划在秋季运动会期间开展“运动与健康”知识大赛,为此某班开展了10次模拟测试,以此选拔选手代表班级参赛,下表为甲、乙两名学生的历次模拟测试成绩.
甲、乙两名学生测试成绩的平均数分别记作eq \x\t(x),eq \x\t(y),方差分别记作seq \\al(2,1),seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)以这10次模拟测试成绩及(1)中的结果为参考,请你从甲、乙两名学生中选出一人代表班级参加比赛,并说明你作出选择的理由.
甲
95
82
88
81
93
79
84
78
乙
83
75
80
80
90
85
92
95
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
场次
1
2
3
4
5
6
7
8
9
10
甲
98
94
97
97
95
93
93
95
93
95
乙
92
94
93
94
95
94
96
97
97
98
第64讲 用样本估计总体
1.总体百分位数的估计
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
2.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把eq \f(a1+a2+…+an,n)称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为eq \(x,\s\up6(-)),则这组数据的标准差和方差分别是s=
eq \r(\f(1,n)[(x1-\(x,\s\up6(-)))2+(x2-\(x,\s\up6(-)))2+…+(xn-\(x,\s\up6(-)))2]),
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
考点1 百分位数
[名师点睛]
计算一组数据的第p百分位数的步骤
[典例]
1.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是( )
A.-2 B.0 C.1 D.2
答案 D
解析 由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,
因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是eq \f(2+2,2)=2.
2.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为________,第86百分位数为________.
答案 14.5 17
解析 ∵75%×20=15,
∴第75百分位数为eq \f(14+15,2)=14.5.
∵86%×20=17.2,
∴第86百分位数为第18个数据17.
[举一反三]
1.(多选)已知100个数据的第75百分位数是9.3,则下列说法不正确的是( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据从小到大排列后,9.3是第75个数据
C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数
答案 ABD
解析 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,则C正确,其它选项均不正确,故选ABD.
2.将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是________.(结果保留两位小数)
答案 124.44
解析 由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.022 5)×10×100%=92.5%,
因此,80%分位数一定位于[120,130)内.
因为120+eq \f(0.80-0.70,0.925-0.70)×10≈124.44,
所以此班的模拟考试成绩的80%分位数约为124.44.
考点2 总体的集中趋势估计
[名师点睛]
(1)众数、中位数、平均数的应用要点
中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.
(2)频率分布直方图的数字特征
①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;
③平均数:平均数在频率分布表中等于组中值与对应频率之积的和.
[典例]
1.某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):
(1)请你计算这两组数据的平均数、中位数;
(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.
解 (1)eq \(x,\s\up6(-))甲=eq \f(1,8)×(95+82+88+81+93+79+84+78)=85(分),
eq \(x,\s\up6(-))乙=eq \f(1,8)×(83+75+80+80+90+85+92+95)=85(分).
甲、乙两组数据的中位数分别为83分,84分.
(2)由(1)知eq \(x,\s\up6(-))甲=eq \(x,\s\up6(-))乙=85分,
所以seq \\al(2,甲)=eq \f(1,8)[(95-85)2+(82-85)2+…+(78-85)2]=35.5,
seq \\al(2,乙)=eq \f(1,8)[(83-85)2+(75-85)2+…+
(95-85)2]=41.
①从平均数看,甲、乙均为85分,平均水平相同;
②从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲;
③从方差来看,因为eq \(x,\s\up6(-))甲=eq \(x,\s\up6(-))乙,seq \\al(2,甲)<seq \\al(2,乙),所以甲的成绩较稳定;
④从数据来看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;
⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.
综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.
2.首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.
(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);
(2)估计该校学生联考数学成绩的第80百分位数;
(3)估计该校学生联考数学成绩的众数、平均数.
解 (1)由频率分布直方图的性质,
可得(0.004+a+0.013+0.014+0.016)×20=1,
解得a=0.003.所以及格率为(0.016+0.014+0.003)×20=0.66=66%.
(2)得分在110分以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,
得分在130分以下的学生所占比例为
0.66+0.014×20=0.94,
所以第80百分位数位于[110,130)内,
由110+20×eq \f(0.8-0.66,0.94-0.66)=120,估计第80百分位数为120分.
(3)由图可得,众数估计值为100分.
平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).
[举一反三]
1.(2023·成都质检)有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是( )
A.甲射击的平均成绩比乙好
B.乙射击的平均成绩比甲好
C.甲射击的成绩的众数小于乙射击的成绩的众数
D.甲射击的成绩的中位数等于乙射击的成绩的中位数
答案 D
解析 由题意得,甲射击的平均成绩为eq \(x,\s\up6(-))甲=eq \f(7+8+10+9+8+8+6,7)=8,众数为8,中位数为8;
乙射击的平均成绩为
eq \(x,\s\up6(-))乙=eq \f(9+10+7+8+7+7+8,7)=8,
众数为7,中位数为8;
故甲射击的平均成绩等于乙射击的平均成绩,甲射击的成绩的众数大于乙射击的成绩的众数,甲射击的成绩的中位数等于乙射击的成绩的中位数.
2.(多选)(2023·长沙模拟)某校高二年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组为:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150),得到的频率分布直方图如图所示,则下列说法中正确的是( )
A.a=0.045
B.这800名学生中数学成绩在110分以下的人数为160
C.这800名学生数学成绩的中位数约为121.4
D.这800名学生数学成绩的平均数为125
答案 BC
解析 由题意,(0.005+0.01+0.01+0.015+0.025+a)×10=1,解得a=0.035,A错误;
110分以下的人数为(0.01+0.01)×10×800=160,B正确;
120分以下的频率是(0.01+0.01+0.025)×10=0.45,设中位数为x,则eq \f(x-120,10)=eq \f(0.005,0.035),x≈121.4,C正确;
平均数为95×0.1+105×0.1+115×0.25+125×0.35+135×0.15+145×0.05=120,D错误.
考点3 总体离散程度的估计
[名师点睛]
标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)较大,数据的离散程度越大;标准差(方差)较小,数据的离散程度越小.
[典例]
(2023·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为eq \x\t(x)和eq \x\t(y),样本方差分别记为seq \\al(2,1)和seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果eq \x\t(y)-eq \x\t(x)≥2eq \r(\f(s\\al(2,1)+s\\al(2,2),10)),则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
解 (1)由表格中的数据易得eq \x\t(x)=eq \f(1,10)×(-0.2+0.3+0+0.2-0.1-0.2+0+0.1+0.2-0.3)+10.0=10.0,
eq \x\t(y)=eq \f(1,10)×(0.1+0.4+0.1+0+0.1+0.3+0.6+0.5+0.4+0.5)+10.0=10.3,
seq \\al(2,1)=eq \f(1,10)×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,
seq \\al(2,2)=eq \f(1,10)×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.
(2)由(1)中数据可得eq \x\t(y)-eq \x\t(x)=10.3-10.0=0.3,而2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))=eq \r(\f(2,5)s\\al(2,1)+s\\al(2,2))=eq \r(0.030 4),显然有eq \x\t(y)-eq \x\t(x)>2eq \r(\f(s\\al(2,1)+s\\al(2,2),10))成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.
[举一反三]
(2023·蚌埠质检)某校计划在秋季运动会期间开展“运动与健康”知识大赛,为此某班开展了10次模拟测试,以此选拔选手代表班级参赛,下表为甲、乙两名学生的历次模拟测试成绩.
甲、乙两名学生测试成绩的平均数分别记作eq \x\t(x),eq \x\t(y),方差分别记作seq \\al(2,1),seq \\al(2,2).
(1)求eq \x\t(x),eq \x\t(y),seq \\al(2,1),seq \\al(2,2);
(2)以这10次模拟测试成绩及(1)中的结果为参考,请你从甲、乙两名学生中选出一人代表班级参加比赛,并说明你作出选择的理由.
解 (1)eq \x\t(x)=eq \f(1,10)(98+94+97+97+95+93+93+95+93+95)=95,
eq \x\t(y)=eq \f(1,10)(92+94+93+94+95+94+96+97+97+98)=95,
seq \\al(2,1)=eq \f(1,10)[32+(-1)2+22+22+0+(-2)2+(-2)2+0+(-2)2+0]=3,
seq \\al(2,2)=eq \f(1,10)[(-3)2+(-1)2+(-2)2+(-1)2+0+(-1)2+12+22+22+32]=3.4.
(2)答案一:
由(1)可知,eq \x\t(x)=eq \x\t(y),seq \\al(2,1)
由(1)可知,eq \x\t(x)=eq \x\t(y),seq \\al(2,1)
95
82
88
81
93
79
84
78
乙
83
75
80
80
90
85
92
95
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
场次
1
2
3
4
5
6
7
8
9
10
甲
98
94
97
97
95
93
93
95
93
95
乙
92
94
93
94
95
94
96
97
97
98
高考数学一轮复习考点探究与题型突破第53讲抛物线(原卷版+解析): 这是一份高考数学一轮复习考点探究与题型突破第53讲抛物线(原卷版+解析),共15页。试卷主要包含了抛物线的概念,抛物线的标准方程和简单几何性质等内容,欢迎下载使用。
高考数学一轮复习考点探究与题型突破第52讲双曲线(原卷版+解析): 这是一份高考数学一轮复习考点探究与题型突破第52讲双曲线(原卷版+解析),共15页。试卷主要包含了双曲线的定义,双曲线的标准方程和简单几何性质等内容,欢迎下载使用。
高考数学一轮复习考点探究与题型突破第48讲圆的方程(原卷版+解析): 这是一份高考数学一轮复习考点探究与题型突破第48讲圆的方程(原卷版+解析),共14页。试卷主要包含了圆的定义和圆的方程等内容,欢迎下载使用。