高中数学苏教版 (2019)必修 第二册14.4 用样本估计总体优秀课时作业
展开知识点01 平均数、众数与中位数
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果个数,那么叫做这个数的平均数.
频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
【即学即练1】(2024·高三·全国·专题练习)某篮球兴趣小组7名学生参加投篮比赛,每人投10个,投中的个数分别为8,5,7,5,8,6,8,则这组数据的众数和中位数分别为( ).
A.5,7B.6,7C.8,5D.8,7
【答案】D
【解析】数据由小到大排列为5,5,6,7,8,8,8,
因此,这组数据的众数为8,中位数为7.
故选:D.
知识点02 极差、方差、标准差
1、极差
(1)定义:一组数据的最大值与最小值的差.
(2)作用:极差较大,数据点较分散;极差较小,数据点较集中.
2、方差、标准差的定义
一组数据,用表示这组数据的平均数,则这组数据的方差为,标准差为.
3、总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为,总体平均数为,则称为总体方差,为总体标准差.如果总体的个变量值中,不同的值共有个,记为,,其中出现的频数为,则总体方差为.
4、样本方差、样本标准差的定义
如果一个样本中个体的变量值分别为,样本平均数为,则称为样本方差,为样本标准差.
5、方差、标准差特征
标准差、方差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.
【即学即练2】(2024·高三·内蒙古赤峰·开学考试)在某知识竞赛中,共设有10道题目,每题1分,经统计,10位选手的得分情况如下表:
则这10位选手得分的方差为( )
A.12B.8C.D.
【答案】D
【解析】依题意,
所以方差.
故选:D
知识点03 百分位数
1、第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
2、计算第百分位数的步骤
第1步:按从小到大排列原始数据.
第2步:计算.
第3步:若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第项数据的平均数.
3、四分位数
常用的分位数有第25百分位数、第50百分位数、第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
【即学即练3】(2024·高一·甘肃金昌·阶段练习)某校高一年级15个班参加朗诵比赛的得分如下(单位:分):
则这组数据的分位数为( )
A.91B.90C.89.5D.89
【答案】D
【解析】依题意,,所以这组数据的分位数为从小到大排列的第5个数据89.
故选:D
题型一:平均数、中位数、众数在具体数据中的应用
【典例1-1】如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是( )
A.中位数和众数都是5B.众数是10
C.中位数是4D.中位数、平均数都是5
【答案】A
【解析】将这组数据从小到大的顺序排列为4,4,5,5,5,6,13,处于中间位置的那个数是5,
每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,
这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,BC错误.
平均数,故D错误.
故选:A
【典例1-2】(2024·高二·浙江杭州·期中)某校素质运动会上,个男生的引体向上个数依次为,设这组数据的平均数为,中位数为,众数为,则( )
A.B.C.D.
【答案】A
【解析】该组数据的平均数;
将引体向上的个数按照从小到大顺序排列为:,
则中位数;
该组数据的众数;.
故选:A.
【变式1-1】(2024·全国·模拟预测)小军小朋友参加少儿体操选拔赛,8位教练员的评分分别为13,14,16,18,18,20,22,23,按比赛规则,计算选手最后得分时,要去掉一个最高分和一个最低分.去掉这组得分中的一个最高分和一个最低分后,下列会发生变化的是( )
A.平均数B.极差C.中位数D.众数
【答案】B
【解析】由题可知,去掉一个最高分和一个最低分前后的样本数字特征如下表,
续表
由表可知,只有极差发生变化.
故选:B.
【变式1-2】(2024·全国·模拟预测)已知一组数据:96,97,95,99,96,98,100,97,98,96,则下列说法不正确的是( )
A.这组数据的中位数是97B.这组数据的众数是96
C.这组数据的平均数是97D.这组数据的极差是5
【答案】C
【解析】由题意,数据从小到大排列为95,96,96,96,97,97,98,98,99,100,共10个数据,所以这组数据的中位数是,故A正确;
在这组数据中96出现的次数最多,故众数是96,故B正确;
这组数据的平均数是,故C不正确;
这组数据的极差是,故D正确.
故选:C.
【变式1-3】(2024·重庆·模拟预测)2023年10月4日,在杭州亚运会跳水男子10米台决赛中,中国选手杨昊夺得金牌.中国跳水队包揽杭州亚运会跳水项目全部10枚金牌.跳水比赛的评分规则如下,7位裁判同时给分,去掉两个最高分,去掉两个最低分,剩下的3个分数求和再乘以难度系数,就是该选手本轮的得分,下表就是杨昊比赛中的第一轮得分表,则( )
A.这7个数据的众数只能是10.0
B.这7个数据的中位数只能是9.0
C.a可能是10.0
D.a可能是9.5
【答案】D
【解析】当时,由题意可知:,符合题意,此时众数为10或(此时),中位数为9.5,因此选项AB不正确,D正确;
当时,由题意可知:,舍去,因此选项C不正确,
故选:D
【变式1-4】(2024·辽宁葫芦岛·一模)从某班所有同学中随机抽取10人,获得他们某学年参加社区服务次数的数据如下:4,4,4,7,7,8,8,9,9,10,这组数据的众数是( )
A.9B.8C.7D.4
【答案】D
【解析】由数据可知,其中服务次数为4的个数最多,故众数为4.
故选:D.
【方法技巧与总结】(众数、中位数、平均数的意义)
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
题型二:在频率分布直方图中求平均数、中位数、众数
【典例2-1】(2024·高一·江西上饶·期末)某校在上饶市期末数学测试中为统计学生的考试情况,从学校的1000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组,第二组,……第八组,如图是按上述分组方法得到的频率分布直方图的一部分.
(1)求第八组的频率,并完成频率分布直方图;
(2)用样本数据估计该校的1000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值)和中位数(保留小数点后面一位)
【解析】(1)因为各组的频率和等于1,故第八组的频率为:,
则第八组对应矩形的高为,补全频率分布直方图如图所示:
(2)用样本数据估计该校的1000名学生这次考试成绩的平均分为:
(分);
因为,,
所以中位数在内,
设中位数为x,则,解得;所以估计中位数是分.
【典例2-2】(2024·高一·新疆喀什·期末)某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试成绩的中位数(结果取整数值);
(3)估计这次考试的众数、平均分.
【解析】(1)因为各组的频率和等于1,
故第四组的频率:
直方图如图所示.
(2)成绩在的频率为
成绩在的频率为:,中位数在内.
设中位数为,
中位数要平分直方图的面积
,
解得即中位数为.
(3)频率最大的是组,则众数是;
利用组中值估算抽样学生的平均分为:
估计这次考试的平均分是分.
【变式2-1】(2024·高二·贵州黔东南·期末)根据阅兵领导小组办公室介绍,2019年国庆70周年阅兵有59个方(梯)队和联合军乐团,总规模约1.5万人,是近几次阅兵中规模最大的一次.其中,徒步方队15个.为了保证阅兵式时队列保持整齐,各个方队对受阅队员的身高也有着非常严格的限制,太高或太矮都不行.徒步方队队员,男性身高普遍在至之间;女性身高普遍在至之间,这是常规标准.要求最为严格的三军仪仗队,其队员的身高一般都在至之间.经过随机调查某个阅兵阵营中女子100人,得到她们身高的直方图,其中.
(1)求直方图中的值;
(2)估计这个阵营女子身高的平均值;(同一组中的数据用该组区间的中点值为代表)
(3)请根据频率分布直方图估计阅兵阵营中女子身高的中位数.
【解析】(1)
由频率分布直方图可知,
,且,
解得:,;
(2)这个阵营女子身高的平均值为
(3)前3组的频率和为,
所以中位数为.
【变式2-2】(2024·高一·新疆喀什·期末)某城市100户居民的月平均用电量(单位:度),以,, ,,,,分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的平均数、众数和中位数.
【解析】(1)依题意,,
解得.
(2)由图可知,平均数
,
最高矩形的数据组为,
所以众数为,
因为的频率之和为,
的频率之和为,
所以月平均用电量的中位数在,设中位数为,
所以,
解得,即中位数为,
综上所述,平均数,众数为230,中位数为224.
【变式2-3】(2024·高二·四川成都·阶段练习)2023年8月8日,世界大学生运动会在成都成功举行闭幕式.某校抽取100名学生进行了大运会知识竞赛并纪录得分(满分:100分),根据得分将他们的成绩分成六组,制成如图所示的频率分布直方图.
(1)求图中
的值;
(2)估计这100人竞赛成绩的平均数(同一组数据用该组数据的中点值代替)及中位数.
【解析】(1)由题意知:,
即.
(2)由频率分布直方图可知:
平均数为:
前3组的频率为,
所以中位数为.
【变式2-4】(2024·高一·黑龙江牡丹江·期末)新课标设置后,特别强调了要增加对数学文化的考查,某市高二年级期末考试特命制了一套与数学文化有关的期末模拟试卷,试卷满分150分,并对整个高二年级的学生进行了测试.现从这些学生中随机抽取了100名学生的成绩,按照成绩为,,,分成了6组,制成了如图所示的频率分布直方图(假定每名学生的成绩均不低于90分).
(1)求频率分布直方图中的的值,并估计所抽取的100名学生成绩的平均分(同一组中的数据用该组区间的中点值代表);
(2)若利用分层抽样的方法从样本中成绩位于的两组学生中抽取6人,则成绩位于有几人;
(3)估计所抽取的100名学生成绩的中位数(保留一位小数).
【解析】(1)由频率分布直方图得,
,得,
所以平均分为:
;
(2)由频率分布直方图得出成绩位于和上的人数比为,
故抽样比为,
抽取的6人中成绩位于上的有人.
(3)由频率分布直方图:
的频率为,的频率为,
的频率为,
因前两组的频率之和为,而前三组的频率之和为
故中位数在之间,
设中位数为,则,得,
故中位数为:分
【变式2-5】(2024·高一·内蒙古通辽·阶段练习)某实验中学对选择生物学科的200名学生的高一下学期期中考试成绩进行统计,得到如图所示的频率直方图.已知成绩均在区间内,不低于90分视为优秀,低于60分视为不及格.同一组中数据用该组区间中间值做代表值.
(1)根据此次成绩采用分层抽样从中抽取40人开座谈会,求在区间应抽取多少人?
(2)根据频率直方图,估计这次考试成绩的平均数,众数和中位数.
【解析】(1)区间的频率为,
区间应抽取样本数为(人).
(2)区间的频率为,区间的频率为,
区间的频率为,区间的频率为,
区间的频率为,
估计这次考试成绩的平均数为
,
由区间的频率最大,估计这次考试成绩的众数为,
因为,,
所以中位数
,解得.
【方法技巧与总结】(知频率分布直方图中求平均数、中位数、众数)
(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.
(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.
题型三:方差、标准差的计算
【典例3-1】(2024·高一·河南驻马店·期末)由6个实数组成的一组数据方差为,将其中一个数5改为2,另一个数4改为7,其余的数不变得到一组数据的方差为.则( )
A.2B.3C.4D.5
【答案】A
【解析】将其中一个数5改为2,另一个数4改为7,其余的数不变,
可得这6个实数组成的一组数据的平均数不变,并设为,
设没有变化的4个数为,
则,
,
所以.
故选:A.
【典例3-2】(2024·高二·湖北·阶段练习)已知样本的平均数是9,方差是2,则( )
A.41B.71C.55D.45
【答案】B
【解析】的平均数是9,
,
即①;
又方差是2,
,
即②;
由①②联立,
解得:或;
故选:B.
【变式3-1】(2024·高一·全国·单元测试)期末考试后,高二某班50名学生物理成绩的平均分为85,方差为8.2,则下列四个数中不可能是该班物理成绩的是( )
A.60B.78C.85D.100
【答案】A
【解析】根据题意,平均数,方差,所以,若存在,则,则方差必然大于8.2,不符合题意,所以60不可能是所有成绩中的一个数据.又,,.故B,C,D错误.
故选:A.
【变式3-2】(2024·高三·四川成都·期末)若数据9,m,6,n,5的平均数为7,方差为2,则数据11,9,,17,的平均数和方差分别为( )
A.13,4B.14,4C.13,8D.14,8
【答案】C
【解析】数据9,m,6,n,5的平均数为,
方差为,
化简得 ,解得或,
或,
则数据11,9,,17,为或,
两组数据有相同的平均数和方差,
平均数为,
方差为,
故选:C
【变式3-3】(2024·江西上饶·二模)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本数据平均数为6,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
A.8B.9C.10D.11
【答案】B
【解析】设样本数据为,其中,
由题意得:①,
②,
由于,故样本数据中最大值不是11,
若样本数据中最大值为10,不妨设,代入②中得:③,
由于样本数据互不相同,故③不成立,
若样本数据中最大值为9,不妨令,此时有,,
不妨令满足要求,故样本数据中最大值为9.
故选:B
【变式3-4】(2024·高一·全国·课时练习)高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为x,y,105,109,110.已知她的五次数学成绩数据的平均数为108分,方差为35.2,则|x-y|的值为( )
A.15B.16
C.17D.18
【答案】D
【解析】由题意得,①,,②
由①②解得或,所以|x-y|=18.
故选:D.
【变式3-5】(2024·高一·河北唐山·期末)已知样本数据由小到大依次为2,3,3,7,,,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则,的值分别为( ).
A.10,11B.10.5,9.5C.10.4,10.6D.10.5,10.5
【答案】D
【解析】利用中位数可得,要使该样本的方差最小,只需最小,将代入,配方即可求解.由于样本共有10个值,且中间两个数为,,
依题意,得,即.
因为平均数为,
所以要使该样本的方差最小,只需最小.
又,
所以当时,最小,此时.
故选:D
【变式3-6】(2024·高一·广西河池·阶段练习)已知一组正数,,,的方差为,则数据,,,的平均数为( )
A.3B.4C.5D.6
【答案】D
【解析】设正数的平均数为,
则方差为
,
所以,解得,
所以数据,,,的平均数为.
故选:D.
【方法技巧与总结】
方差的计算方法
.
题型四:方差的性质
【典例4-1】(2024·高二·四川成都·开学考试)已知一组数据,,,的方差为4,若数据,,,的方差为36,则b的值为 .
【答案】3或
【解析】设数据,,,的平均数为,方差为,则,
,
设数据,,,的平均数为,方差为,
则,
,
所以或,
故答案为:3或.
【典例4-2】(2024·高二·浙江杭州·期中)若一组个数据、、、的平均数为,方差为,则 .
【答案】
【解析】由题意可知,这个数据的平均数为,
方差为,
解得.
故答案为:.
【变式4-1】(2024·高三·全国·专题练习)已知15个数,,…,的平均数为6,方差为9,现从中剔除,,,,这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数,,…,的方差 .
【答案】8
【解析】由题意知,,,
所以,
所以剩余的10个数的平均数为.
根据方差公式得,
,,
即,,
所以,
所以剩余的10个数的方差为.
故答案为:8.
【变式4-2】(2024·高一·江苏苏州·阶段练习)已知一组数据的平均数是2,方差是,那么另一组数据的平均数,方差分别为 ,
【答案】 /
【解析】∵一组数据的平均数是2,方差是,
∴另一组数据的平均数为:,
方差为:.
故答案为:;
【变式4-3】(2024·全国·模拟预测)已知样本数据都为正数,其方差,则样本数据、、、、的平均数为 .
【答案】11
【解析】根据题意,设样本数据、、、、的平均数为,
其方差
,
又,
则有,解得,
则样本数据、、、、的平均数为;
故答案为:11.
【变式4-4】(2024·高二·四川绵阳·阶段练习)已知数据,,,,的方差为,则数据,,,,的方差为 ;
【答案】20
【解析】因为数据,,,,的方差为,
所以数据,,,,的方差为.
故答案为:20
【变式4-5】(2024·高二·江西宜春·期末)若一组数据的方差为10,则另一组数据的方差为 .
【答案】40
【解析】由题意设的平均数为,则的平均数为,
由题意的方差为,
从而的方差为.
故答案为:40.
【方法技巧与总结】
方差的性质
(1)数据,,…,与数据,,…,的方差相等.
(2)若,,…,的方差为,则,,…,的方差为.
(3)若,,…,的方差为,则,,…,的方差为.
题型五:标准差与方差的应用
【典例5-1】(2024·高一·全国·开学考试)在一次高一年级数学统一考试中,甲班有40人,平均成绩为70分,方差为30;乙班有60人,平均数为75,方差为40.求:
(1)甲、乙两班全部学生的平均成绩;
(2)有人预测,甲、乙两个班级总体的方差在30至40之间,请计算甲、乙两个班级全体成绩的方差,并判断此人说法是否正确.
【解析】(1)设甲班成绩的平均数为,方差为;乙班成绩的平均数为,方差为,
则,,,,
所以甲、乙两班全部学生的平均成绩为,
即甲、乙两班全部学生的平均成绩为73分.
(2)两个班级全体成绩的方差为
故此人的说法是错误的.
【典例5-2】(2024·高二·云南昆明·期末)某学校有高中学生500人,其中男生300人,女生200人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:),计算得男生样本的均值为170,方差为17,女生样本的均值为160,方差为30.
(1)根据以上信息,能够计算出总样本的均值和方差吗?为什么?
(2)如果已知男、女样本量按比例分配,你能计算出总样本的均值和方差各为多少吧?
【解析】(1)不能,因为题目没有给出男、女生的样本量.
(2)总体样本的均值为,
总体样本的方差为.
【变式5-1】(2024·高二·四川成都·阶段练习)坐位体前屈是中小学体质健康测试项目,主要测试学生躯干、腰、髋等部位关节韧带和肌肉的伸展性、弹性及身体柔韧性,在对某高中2000名高二年级学生的坐位体前屈成绩的调查中,采用按学生性别比例分配的分层随机抽样抽取100人,已知这2000名高二年级学生中男生有1200人,且抽取的样本中男生的平均数和方差分别为和13.36,女生的平均数和方差分别为和17.56.
(1)求样本中男生和女生应分别抽取多少人;
(2)求抽取的总样本的平均数,并估计高二年级全体学生的坐位体前屈成绩的方差.
(参考公式:总体分为2层,各层抽取的样本量、样本平均数和样本方差分别为:.记总样本的平均数为,样本方差为,则)
【解析】(1)设在男生、女生中分别抽取m名和n名,则,
解得.
(2)记抽取的总样本的平均数为,可得,
所以抽取的总样本的平均数为.
男生样本的平均数为,样本方差为;
女生样本的平均数为,样本方差为;
记总样本的样本方差为,则
所以估计高三年级全体学生的坐位体前屈成绩的方差为16.
【变式5-2】(2024·高一·全国·课堂例题)校高一年级有男生180人,女生120人.某统计小组为调查本年级学生身高情况,采取分层抽样的方法从总体中随机抽取样本,其中男生抽取18人,女生抽取12人.将男生组看作样本,计算出样本的平均身高为173.5cm,方差为17;将女生组看作样本,计算出样本的平均身高为164.0cm,方差为30.试根据以上数据计算由,组成的样本的方差,并估计总体方差.
【解析】设从男生中抽出的样本个体为,,…,,均值记为,方差记为;
从女生中抽取的样本个体为,,…,,均值记为,方差记为.
先计算总样本均值:
;
再计算总样本方差:
.
于是可以估计该校高一年级学生身高的方差为43.86.
【变式5-3】(2024·高一·广西·期末)某中学400名学生参加全市高中数学竞赛,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:,,…,,并整理得到如下频率分布直方图:
(1)由频率直方图求样本中分数的中位数;
(2)已知样本中分数在的学生有5人,试估计总体中分数小于40的人数;
(3)已知样本中男生与女生的比例是,男生样本的均值为70,方差为10,女生样本的均值为80,方差为12,请计算出总体的方差.
【解析】(1)由频率分布直方图,设分数中位数为,则有,解得,
所以分数的中位数为72.5;
(2)由频率分布直方图知,分数在的频率为,
在样本中分数在的人数为(人),
在样本中分数在的人数为95人,所以估计总体中分数在的人数为(人),
总体中分数小于40的人数为20人;
(3)总样本的均值为,
所以总样本的方差为.
【变式5-4】(2024·高一·湖北武汉·期末)某中学为了贯策教育部对学生的五项管理中的体质管理,对高一年级学生身高进行调查,在调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男34人,其平均数和方差分别为170.5和15,抽取了女生16人,其平均数和方差分别为160.5和35.
(1)由这些数据计算总样本的平均数;
(2)由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计.
参考数据:
【解析】(1)把男生样本记为,其平均数记为,方差记为;
把女生样本记为,其平均数记为,方差记为;
把总样本数据的平均数记为,方差记为.
则,
故.
(2)由分层方差公式可得
.
据此估计高一总方差为.
【变式5-5】(2024·高一·福建福州·期末)古人云“民以食为天”,某校为了了解学生食堂服务的整体情况,进一步提高食堂的服务质量,营造和谐的就餐环境,使同学们能够获得更好的饮食服务.为此做了一次全校的问卷调查,问卷所涉及的问题均量化成对应的分数(满分100分),从所有答卷中随机抽取100份分数作为样本,将样本的分数(成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如表所示的频数分布表.
(1)求频数分布表中a的值,并求样本成绩的中位数和平均数;
(2)已知落在[50,60)的分数的平均值为56,方差是7;落在[60,70)的分数的平均值为65,方差是4,求两组成绩的总平均数和总方差.
【解析】(1)由,解得,
前三段的频率之和,,
前四段的频率之和,
,由成绩在段的频率为0.3,
所以中位数为,
.
(2)由表可知,分数在[50,60)的问卷为10份,分数在[60,70)的问卷为20份,
故,
.
所以两组成绩的总平均数是62,总方差是23.
【变式5-6】(2024·高一·福建龙岩·期末)某大型企业为员工谋福利,与某手机通讯商合作,为员工办理流量套餐.为了解该企业员工手机流量使用情况,通过抽样,得到100名员工近一周每人手机日平均使用流量(单位:M)的数据,其频率分布直方图如图:
若将每位员工的手机日平均使用流量分别视为其手机日使用流量,回答以下问题.
(1)求这100名员工近一周每人手机日使用流量的众数、中位数;
(2)在办理流量套餐后,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男员工20名,其手机日使用流量的平均数为800M,方差为10000;抽取了女员工40名,其手机日使用流量的平均数为1100M,方差为40000.
(i)已知总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:,,;,,,记总的样本平均数为,样本方差为.证明:.
(ii)用样本估计总体,试估计该大型企业全体员工手机日使用流量的平均数和方差.
【解析】(1)估计这100名员工近一周每人手机日使用流量的众数450
由频率分布直方图可知流量少于300的所占比例为,流量少于400的所占比例为,所以抽取的100名员工近一周每人手机日使用流量的中位数在内,且中位数为 .
(2)(i)证明:根据方差的定义,总样本的方差为
由,可得
同理可得
因此
(ii)估计该大型企业全体员工手机日使用流量的平均数为
由(i)知,估计该大型企业全体员工手机日使用流量的方差为
【变式5-7】(2024·高一·河南开封·期末)某校高一年级有学生1000人,其中男生600人,女生400人.为了获得该校全体高一学生的身高信息,采用样本量比例分配的分层随机抽样,抽取一个容量为50的样本.
(1)求抽取男生、女生的人数;
(2)观测样本的指标值(单位:),计算得到男生样本的均值为170,方差为14,女生样本的均值为160,方差为34,求总样本的方差,并估计高一年级全体学生的身高方差.
【解析】(1)由题意,高一年级有学生1000人,其中男生600人,女生400人,
采用样本量比例分配的分层随机抽样,抽取一个容量为50的样本,
所以抽取男生人数为,女生人数为.
(2)记男生身高为,其均值记为,方差记为;女生身高为,其均值记为,方差记为,把总样本数据的均值记为,方差记为,
所以总样本的均值为,
总样本的方差为
,
所以总样本的方差为46,据此估计高一年级学生身高的总体方差为.
【方法技巧与总结】(实际应用中标准差、方差的意义)
在实际问题中,仅靠平均数不能完全反映问题,还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,稳定性越高.
题型六:用样本平均数和样本标准差估计总体
【典例6-1】(2024·高一·安徽安庆·期末)某校通过统计学生在校的5次模考数学成绩(分数均为整数)决定该学生是否适合进行数学竞赛培训.规定:“5次模考成绩均不低于140分”,现有甲、乙、丙三位同学5次模考成绩,则根据以下数据能确定适合数学竞赛培训的学生有( )
甲:众数为140,中位数为145;
乙:中位数为145,极差为6;
丙:均值为143,其中一次成绩为145,方差为1.6.
A.甲乙B.甲丙C.乙丙D.甲乙丙
【答案】B
【解析】甲同学众数为140,说明140出现至少两次,若保证中位数为145,说明另外两个数不小于145,满足参加竞赛培训条件;
乙同学若最低分为139分,其余分数均为145分时符合“中位数为145,极差为6”,不满足参加竞赛培训条件;
丙同学,设另外四次成绩分别为,
所以,
由于均为整数,所以,满足参加竞赛培训条件.
故选:B
【典例6-2】(2024·高一·湖南怀化·期末)四名同学各投掷质地均匀的骰子5次,分别记录每次骰子出现的点数,根据四名同学的统计结果,可以判断一定没有出现点数6的是( )
A.众数为3,极差为3B.平均数为2,中位数为2
C.平均数为2,标准差为2D.中位数为3,众数为3
【答案】B
【解析】A:若众数为数据中的最小值,结合极差为3,则数据中最大值为6,故可能出现点数6;
B:由平均数为2,则所有数据之和为,又中位数为2,将数据从小到大排列,则前3个数据之和最小的情况为,故后2个数据之和最大为,所以不可能出现数据6;
C:若出现点数6,平均数为2,满足条件的情况有,则方差为,即标准差为2,故可能出现点数6;
D:如满足中位数为3,众数为3,故可能出现点数6;
故选:B
【变式6-1】(2024·福建莆田·一模)若某同学连续三次考试的名次(第一名为,第二名为,以此类推,且可以有名次并列的情况)均不超过,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续三次考试的名次数据,推断一定不是尖子生的是( )
A.甲同学:平均数为,中位数为
B.乙同学:平均数为,方差小于
C.丙同学:中位数为,众数为
D.丁同学:众数为,方差大于
【答案】D
【解析】甲同学名次数据的平均数为,说明名次之和为,由中位数为,
得出三次考试名次均不超过,断定甲是尖子生;
乙同学名次数据的平均数为,设乙同学3次考试的名次分别为、、,
由题意可得则方差,
所以,
,则,所以,、、均不超过,
由此可断定乙是尖子生;
丙同学名次数据的中位数为,众数为,说明三次考试中至少有两次名次为,故丙可能是尖子生;
丁同学名次数据的众数为,说明某两次名次为,设另一次名次为,
平均数为,方差为,
即,所以,或或均不满足,故,断定丁一定不是尖子生.
故选:D.
【变式6-2】(2024·高三·全国·专题练习)为了考查某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )
A.9B.10
C.11D.12
【答案】B
【解析】不妨设样本数据x1,x2,x3,x4,x5,且x1
甲:中位数为3,众数为5;
乙:中位数为4,极差为3;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是( )
A.甲B.乙C.丙D.丁
【答案】ACD
【解析】对于A,因为中位数为3,众数为5,所以这7个数从小到大排列后,第4个数是3,所
以中一定有一个数出现2次,5出现3次,所以这7个数中一定没有出现7,则正确.
对于B,因为中位数为4,极差为3,所以这7个数可以是,则B错误.
对于C,若出现1个7,则这7个数从小到大排列后,后4个数之和最小为19,前3个数之和最小为3,
从而这7个数的平均数最小为,即这7个数的平均数不可能为3,故C正确.
对于,设这7个数分别为,则,
.
若7,则
,
从而这6个数可能是或或
或或或或或
或或,这与矛盾,
即这7个数中一定没有出现7,故D正确.
故选:ACD
【变式6-4】(多选题)(2024·高二·山东菏泽·期末)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
A.甲地:中位数为2,众数为3
B.乙地:总体平均数为1,中位数为1
C.丙地:极差为3,第80百分位数为4
D.丁地:总体平均数为2,总体方差为3
【答案】BCD
【解析】对于A,当中位数为2,众数为3时,有可能某一天的病例超过7人,所以A错误;
对于B,总体平均数为1,中位数为1时,若有一天的病例超过7人,假设某天病例为8人,而中位数为1,则平均数会超过1,所以总体平均数为1,中位数为1时,则每天新增疑似病例不超过7人,所以B正确;
对于C,极差为3,第80百分位数为4,可知数据的最大可能取值为7,所以C正确;
对于D,设连续10天,每天新增疑似病例分别为,并设有一天超过7人,设第一天为8人,则,因为总体方差为3,所以说明连续10,每天新增疑似病例不超过7人,所以D正确,
故选:BCD
【变式6-5】(多选题)(2024·高二·重庆沙坪坝·阶段练习)某大型公司规定:若任意连续7天,每天不超过5人体温高于,则称没有发生群体性发热.下列连续7天体温高于人数的统计特征数中,能判定该公司没有发生群体性发热的为( )
A.中位数为3,众数为2B.均值小于1,中位数为1
C.均值为3,众数为4D.均值为2,标准差为
【答案】BD
【解析】设连续7天体温高于人数依次为
,,,,,,,则,.
将,,,,,,
按顺序从小到大依次记为,,,,,,,且,.
A选项:
由中位数为3得,又众数为2,所以,,的值无法确定,故选项A错误;
B选项:
由中位数为1得,由均值小于1得,
有,,故选项B正确;
C选项:
由均值为3得,,,
取,,,,满足众数为4,
但有1天有7人体温高于,故选项C错误;
D选项:
由均值为2得,,,
由标准差为得,
所以,所以,故选项D正确.
故选:BD.
【方法技巧与总结】(用样本平均数和样本标准差估计总体注意事项)
(1)标准差代表数据的离散程度,考虑数据范围时需要加减标准差.
(2)计算样本平均数、样本方差直接利用公式,注意公式的变形和整体代换.
题型七:百分位数在具体数据中的应用
【典例7-1】(2024·海南省直辖县级单位·模拟预测)我们平时登录各类网络平台的密码中的不同符号都各自对应一个字节数,若某个密码使用的符号对应的字节数分别为1,2,4,4,6,7,8,则这组数据的分位数为( )
A.4B.5C.6D.7
【答案】D
【解析】由某个密码使用的符号对应的字节数分别为1,2,4,4,6,7,8,
可得,所以这组数据的75%分位数为第6个数字7.
故选:D.
【典例7-2】(2024·高一·辽宁辽阳·阶段练习)已知某地十个加油站某日92号汽油的价格(单位:元/升)如下:
【变式7-1】94 7.92 7.92 7.87 7.86 7.95 7.93 7.94 7.92 7.98
这十个加油站该日92号汽油价格的分位数是( )
A.B.7.94C.7.93D.7.935
【答案】B
【解析】将这十个加油站该日号汽油的价格从低到高排列:,,,,,,,,,.
因为,所以这十个加油站该日汽油价格的分位数为从小到大排列的第七个数,即为.
故选:B
【变式7-2】(2024·高一·辽宁抚顺·阶段练习)样本数据2,0,2,4,0,6,0,8的分位数为( )
A.5B.6C.7D.8
【答案】D
【解析】个样本数据从小到大排序为:,又,
故其88%分位数为第个数据,即.
故选:D.
【变式7-3】(2024·河北廊坊·模拟预测)已知某地最近天每天的最高气温(单位:)分别为,则天最高气温的第百分位数是( )
A.15B.21C.D.22
【答案】C
【解析】将此组数据从小到大排列:,
且共有个数,因为,所以第百分位数为.
故选:C.
【变式7-4】(2024·高三·贵州·阶段练习)某同学一学期七次模拟考试数学成绩(满分150分)依次为88,98,112,106,122,118,110,则这名同学七次数学成绩的分位数为( )
A.110B.112C.115D.118
【答案】D
【解析】将某同学一学期七次模拟考试数学成绩从低到高排列依次为88,98,106,110,112,118,122,
由于,故这名同学七次数学成绩的分位数为第6个数,即118,
故选:D
【变式7-5】(2024·全国·一模)一组数据:155,156,156,157,158,160,160,161,162,165的第75百分位数是( )
A.161B.160.5C.160D.161.5
【答案】A
【解析】由题意得此组数据已从小到大排列,此组数据共有10个数,
所以第75百分位数的位置为,
所以第75百分位数为第8个数161,故A正确.
故选:A.
【方法技巧与总结】(计算一组n个数据的第p百分位数的步骤)
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
题型八:百分位数在统计表或统计图中的应用
【典例8-1】(2024·高二·重庆·阶段练习)随机抽取100名男学生,测得他们的身高(单位:cm),按照区间,,,,分组,得到样本身高的频率分布直方图如图所示
(1)求这100名男学生身高在170cm及以上的学生人数;
(2)估计该校100名学生身高的75%分位数.
【解析】(1)由频率分布直方图可知,解得,
身高在及以上的学生人数(人;
(2),的人数占比为,,的人数占比为,
所以该校100名学生身高的分位数落在,,
设该校100名生学身高的分位数为,
则,解得,
故该校100名生学身高的分位数为176.25;
【典例8-2】(2024·高一·山东临沂·期末)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者,某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩的总平均数和总方差.
【解析】(1)因为每组小矩形的面积之和为1,
所以,
则.
(2)成绩落在内的频率为,
落在内的频率为,
设第75百分位数为m,
由,得,故第75百分位数为84.
(3)由图可知,成绩在的市民人数为,
成绩在的市民人数为,
故这两组成绩的总平均数为,
由样本方差计算总体方差公式可得总方差为:
.
【变式8-1】(2024·高二·四川成都·期末)某中学为了解该校高三年级学生数学学习情况,对一模考试数学成绩进行分析,从中抽取了200名学生的成绩作为样本进行统计(若该校全体学生的成绩均在分),按照,,,,,,,的分组做出频率分布直方图如图所示,若用分层抽样从分数在内抽取17人,则抽得分数在的人数为6人.
(1)求频率分布直方图中的x,y的值;
(2)该高三数学组准备选取数学成绩在前4%的学生进行培优指导,若小明此次数学分数是132,请你估算他能被选取吗?
【解析】(1)由已知得用分层抽样从分数在内抽取的人数为人,
则由分层抽样可得分数在的人数与分数在的人数之比为,
所以,则,
所以 .
(2)由题意可知分数在的频率为,所以前在该组,不妨设第名的分数为,
则可得等式为,
即,
因为,所以小明不能被选取.
【变式8-2】(2024·高二·四川绵阳·期末)从出游方式看,春节期间是家庭旅游好时机.某地区消费者协会调查了部分2023年春节以家庭为单位出游支出情况,统计得到家庭旅游总支出(单位:百元)频率分布直方图如图所示.(同一组中的数据用该组区间的中点值为代表)
(1)求的值;
(2)估计家庭消费总支出的平均值及第80百分位数.(结果保留一位小数)
【解析】(1)由频率分布直方图,得,
∴.
(2)平均值为.
第80百分位数为,则,
解得.
【变式8-3】(2024·高一·广西·期末)某果园为了更好地销售沃柑,需对其质量进行分析,以便做出合理的促销方案.现从果园内随机采摘200个沃柑进行称重,其质量(单位:克)分别在中,其频率分布直方图如图所示.
(1)求的值;
(2)该果园准备将质量较大的的沃柑选为特级果,单独包装售卖,求被选为特级果的沃柑的质量至少为多少克.
【解析】(1)根据题意得,
解得.
(2)设选为特级果的沃柑的质量至少为克.
最后一组的面积为,
最后两组的面积之和为.
因为,所以位于倒数第2组,
则,解得,
所以被选为特级果的沃柑的质量至少为140克.
【变式8-4】(2024·高一·陕西咸阳·阶段练习)某景点某天接待了1250名游客,老年625人,中青年500人,少年125人,该景点为了提升服务质量,采用分层抽样从当天游客中抽取100人,以评分方式进行满意度回访.将统计结果按照分成5组,制成如下频率分布直方图:
(1)求抽取的样本中,老年、中青年、少年的人数各是多少;
(2)估计当天游客满意度分值的分位数.
【解析】(1)老年625人,中青年500人,少年125人,
故老年、中青年、少年的人数比例为,
故抽取100人,样本中老年人数为人,
中青年人数为人,少年人数为人;
(2)设当天游客满意度分值的分位数为,
因为,
,
所以位于区间内,
则,解得:,
所以估计当天游客满意度分值的分位数为.
【变式8-5】(2024·高三·全国·阶段练习)某日数学老师进行了一次小测验,两班一共有100名学生参加了测验,成绩都在内,按照,,…,分组,得到如下频率分布直方图:
(1)求两班全体学生成绩的平均数;(每组数据以区间中点值为代表)
(2)若根据测试成绩从高到低进行排顺序,预定前40名为达标人数,估计应该把达标分数线约定为多少分.
【解析】(1)由题意得,解得,
两班全体学生成绩的平均数为
.
(2)根据题意,达标的比例为,
设分数线定为,根据频率分布直方图可知,
则,解得,
所以估计应该把达标分数线定为109分.
【方法技巧与总结】(频率直方图计算百分位数的规律)
求总体百分位数的估计,首先要从小到大排列数据,频率直方图看作数据均匀分布在直方图上,然后计算出,当i不是整数要取整,频率直方图要计算出比例值.
一、单选题
1.(2024·高三·河南·阶段练习)高二年级进行消防知识竞赛,统计所有参赛同学的成绩,成绩都在内,估计所有参赛同学成绩的第75百分位数为( )
A.65B.75C.85D.95
【答案】C
【解析】因为,所以.参赛成绩位于内的频率为,
第75百分位数在内,设为,则,解得,即第75百分位数为85,
故选:C.
2.(2024·江西赣州·一模)若一组样本数据的方差为,则样本数据的方差为( )
A.1B.2C.2.5D.
【答案】C
【解析】设样本数据的平均数为,则,
设样本数据的平均数为,由,
则,所以
.
故选:C
3.(2024·高三·江苏苏州·阶段练习)已知某4个数据的平均数为6,方差为3,现再加入一个数据8,则这5个数据的方差为( )
A.B.C.D.
【答案】C
【解析】设原来4个数据依次为,则,
方差为3,则,
即,
所以,
则
再加入一个数据8,则其平均数为,
则这5个数据的方差为
.
故选:C
4.(2024·高二·浙江杭州·期中)某中学高二学生500人,其中男生300人,女生200人﹐现获得全体学生的身高信息,采用样本量比例分配的分层抽样方法,抽取了容量为50的样本,经计算得到男生身高样本均值为,方差为;女生身高样本均值为,方差为,下列说法中不正确的是( )
A.男生样本容量为30B.每个男生被抽入到样本的概率均为
C.所有样本的均值为D.所有样本的方差为
【答案】D
【解析】A.由题意可知,男生应抽取人,故A正确;
B. 每个男生被抽入到样本的概率均为,故B正确;
C.所有样本的均值为,故C正确;
D.所有样本的方差为,故D错误.
故选:D
5.(2024·高一·浙江绍兴·期末)某校组织高一1班,2班开展数学竞赛,1班40人,2班30人,根据统计分析,两班成绩的方差分别为,.记两个班总成绩的方差为,则( )
A.B.C.D.
【答案】B
【解析】设两个班的平均分分别为,,两个班的总的平均分为,
则
.
故选:B.
6.(2024·高三·江西·开学考试)样本中共有个个体,其值分别为、、、、,若该样本的中位数为,则的取值范围为( )
A.B.C.D.
【答案】C
【解析】若,则这组数据由小到大排列依次为、、、、,中位数为,不合乎题意;
若,则这组数据由小到大排列依次为、、、、,中位数为,不合乎题意;
若,则这组数据由小到大排列依次为、、、、,中位数为;
若,则这组数据由小到大排列依次为、、、、,中位数为;
若,则这组数据由小到大排列依次为、、、、,中位数为.
综上所述,实数的取值范围是.
故选:C.
7.(2024·高三·湖南·开学考试)有一组样本数据由5个连续的正整数组成,其中是最小值,是最大值,若在原数据的基础上增加两个数据,,组成一组新的样本数据,则( )
A.新样本数据的平均数小于原样本数据的平均数
B.新样本数据的平均数大于原样本数据的平均数
C.新样本数据的方差等于原样本数据的方差
D.新样本数据的方差大于原样本数据的方差
【答案】D
【解析】设原样本数据的平均数为,
则新数据的平均数为
,
所以新样本数据的平均数等于原样本数据的平均数,故A,B错误;
由题意新数据的波动增大,所以方差越大,故C错误,D正确.
故选:D.
8.(2024·全国·模拟预测)若数据、、、、的方差为,数据、、、、,的方差为,,则( )
A.B.
C.D.关系不确定
【答案】C
【解析】因为,
则,其中,
所以,
,
故选:C.
二、多选题
9.(2024·高一·全国·开学考试)为深入推进党史学习教育活动,某校开展了“学史明鉴、牢记使命”知识竞赛活动,从1200名参赛的学生中随机选取100人的成绩作为样本(满分100分,60分及以上为及格,得分均在),按,,,,得到如图所示的频率分布直方图,则下列说法正确的是( )
A.
B.1200名参赛的学生中约有60人不及格
C.选取100人的成绩中,成绩落在的人数是成绩落在的人数的
D.以频率估计概率,从1200名参赛的学生中随机抽取1人,则该学生成绩不低于90分的概率为0.1
【答案】BCD
【解析】对于A,由,得,故A错误;
对于B,1200名参赛的学生中不及格的人数为,故B正确;
对于C,选取100人的成绩中,成绩落在的人数为,成绩落在的人数为,则成绩落在的人数是成绩落在的人数的,故C正确;
对于D,以频率估计概率,从1200名参赛的学生中随机抽取1人,则该学生成绩不低于90分的概率为,故D正确.
故选:BCD.
10.(2024·辽宁·一模)下图是样本甲与样本乙的频率分布直方图,下列说法判断正确的是( )
A.样本乙的极差一定大于样本甲的极差
B.样本乙的众数一定大于样本甲的众数
C.样本甲的方差一定大于样本乙的方差
D.样本甲的中位数一定小于样本乙的中位数
【答案】BD
【解析】对于选项A:
甲的数据介于[1.5,7.5]之间,极差小于或等于6;乙的数据分布于[2.5,8.5],极差小于或等于6;从而甲和乙的极差可能相等,故A错误;
对于选项B:
根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于(5.5,6.5],故乙的众数大于甲的众数,B正确;
对于选项C:
甲的数据平局分布,乙的数据分布波动较大,故甲的方差小于乙的方差,故C错误;
对于选项D:
对于甲,各组频率依次为:,因为前两组频率之和,前三组频率之和,故中位数位于[3.5,4.5)之间;
同理,对于乙,各组频率依次为:,前三组频率之和,前四组频率之和,故中位数位于[5.5,6.5)之间,所以乙的中位数大于甲的中位数.故D正确.
故选:BD.
11.(2024·高三·江苏扬州·开学考试)某学校为了解高三学生的体重情况,采用分层随机抽样的方法从高三名学生中抽取了一个容量为的样本.其中,男生平均体重为千克,方差为;女生平均体重为千克,方差为,男女人数之比为,下列说法正确的是( )
A.样本为该学校高三的学生B.每一位学生被抽中的可能性为
C.该校高三学生平均体重千克D.该校高三学生体重的方差为
【答案】BCD
【解析】由分层抽样方式可得总体为该学校高三的学生,样本是抽取的名学生,即A错误;
由抽样比为可得每一位学生被抽中的可能性为,即B正确;
由男生、女生体重以及男女人数之比为可得抽取样本学生平均体重为,
因此可由样本估计总体求得该校高三学生平均体重千克,即C正确;
由男、女生样本方差可求得总体样本方差为,
由样本方差为可估计该校高三学生体重的方差为,即D正确;
故选:BCD
12.(2024·高一·江西南昌·期末)某中学高二学生500人,首选科目为物理的300人,首选科目为历史的200人,现对高二年级全体学生进行数学学科质量检测,按照分层抽样的原则抽取了容量为50的样本,经计算得到首选科目为物理的学生该次质量检测的数学平均成绩为95分,方差为154,首选科目为历史的平均成绩为75分,所有样本的标准差为16,下列说法中正确的是( )
A.首选科目为历史的学生样本容量为20
B.所有样本的均值为87分
C.每个首选科目为历史的学生被抽入到样本的概率为
D.首选科目为历史的学生的成绩的标准差为13
【答案】ABD
【解析】设历史类学生抽取人数为,则,
解得,故A正确;
设物理类学生成绩的平均数为,方差为,历史类学生成绩的平均数为,方差为,所以样本的平均数为,方差为,
则由题意可得,,,,
所以所有样本的均值,故B正确;
每个首选科目为历史的学生被抽入到样本的概率为,故C错误;
由方差的计算公式可得,
解得,
所以历史类学生成绩的标准差为,故D正确.
故选:ABD
三、填空题
13.(2024·高一·全国·期末)已知全校共3000名学生,其中有1800名男生,1200名女生,为调查学生的身高情况,按分层随机抽样的方法抽取20名学生的身高作为样本,样本中男生身高的平均数为170,方差为30,女生身高的平均数为160,方差为45,则利用样本估计总体的平均数为 ,估计总体的方差为 .
【答案】 166 60
【解析】由题意得抽取20名学生中,男生有名,女生有名,
因为样本中男生身高的平均数为170,方差为30,女生身高的平均数为160,方差为45,
所以利用样本估计总体的平均数为,
估计总体的方差为.
故答案为:166,60.
14.(2024·高一·江西·开学考试)已知样本的平均数为,方差为,样本,,,的平均数为,方差为,则新样本,,,,,,,的方差为 .
【答案】
【解析】由题意可知,,,,,
故新样本的平均数为,
其方差为
.
故答案为:.
15.(2024·高一·辽宁朝阳·期末)已知互不相等的4个正整数从小到大排序为.若它们的和为12,且这4个数据的极差是中位数的2倍,则这4个数据的第75百分位数为 .
【答案】
【解析】这组数据的极差为,中位数为,
根据题意得,即,
又它们的和为12,所以,解得,.
因为为正整数且互不相等,且,
三个数的平均数即中位数,
则得到,.
因为,
所以这4个数据的第75百分位数为.
故答案是:.
16.(2024·高一·江西南昌·期末)支原体肺炎是学龄前儿童及青年人常见的一种肺炎,全年均可发病,以冬季多见,主要通过飞沫传播,潜伏期较长,近期,某班级出现许多学生感染支原体肺炎的现象,为确保班级的正常教学,该班班主任统计了最近一周5天感染支原体肺炎的学生人数,已知这5天的人数互不相等,且5天数据的平均数为,若最后一天的数据不小心被墨水污染,前4天的数据的平均数为,若,则4天数据的第60百分位数 (填“大于”,“小于”“等于”)这5天数据的第60百分位数.
【答案】大于
【解析】5天数据的平均数为,前4天的数据的平均数为且,
则被污染的数据为,
不妨设5天的数据关系为,其中,
则5天数据的第60百分位数为,
污染后的数据关系为,
则4天数据的第60百分位数为,
显然.
故答案为:大于
四、解答题
17.(2024·高一·江苏·专题练习)某工厂人员及月工资构成如下:
(1)指出这个表格中的众数、中位数、平均数;
(2)这个表格中,平均数能客观地反映该工厂的月工资水平吗?为什么?
【解析】(1)由表格可知,众数为2 000元.
把23个数据按从小到大(或从大到小)的顺序排列,排在中间的数应是第12个数,其值为2 200,故中位数为2 200元.
平均数为(22 000+15 000+11 000+20 000+1 000)÷23=69 000÷23=3 000(元).
(2)虽然月工资的平均数为3 000元,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.
18.(2024·高一·江苏·专题练习)某单位开展“党员在线学习”活动,统计党员某周周一至周日(共7天)学习得分情况,下表是党员甲和党员乙学习得分情况:
党员甲学习得分情况
党员乙学习得分情况
(1)求本周党员乙周一至周日(共7天)学习得分的平均数和方差;
(2)根据本周某一天的数据,将全单位80名党员的学习得分按照,,,,进行分组、绘制成频率直方图.(如图)
已知这一天甲和乙学习得分在80名党员中排名分别为第30和第68名,请确定这是根据哪一天的数据制作的频率直方图.(直接写结果,不需要过程)
【解析】(1)依题意,平均数:,
方差:.
(2)周三.
由直方图知,学习得分落在,,,,区间内的人数依次为:
人,人,人,人,人
由甲学习得分排名第,可知当天甲学习得分在,只有周二、周三和周日;
由乙学习得分排名第,可知当天乙学习得分在,只有周三和周六,
所以周三符合要求.
19.(2024·高一·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生300人,试估计该校高三学生参加社区服务的次数在区间内的人数;
(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)
【解析】(1)由分组对应的频数是10,频率是0.20,知,所以,
所以,解得,所以,;
(2)估计该校高三学生参加社区服务的次数在区间内的人数为;
(3)估计该校高三学生参加社区服务次数的众数是.
因为,所以估计该校高三学生参加社区服务次数的中位数x满足:
,
解得,所以该校高三学生参加社区服务次数的中位数约为18.1,
由,
所以估计该校高三学生参加社区服务次数的平均数是18.3.
20.(2024·四川成都·二模)2024年1月,某市的高二调研考试首次采用了“”新高考模式.该模式下,计算学生个人总成绩时,“”的学科均以原始分记入,再选的“2”个学科(学生在政治、地理、化学、生物中选修的2科)以赋分成绩记入.赋分成绩的具体算法是:先将该市某再选科目原始成绩按从高到低划分为五个等级,各等级人数所占比例分别约为.依照转换公式,将五个等级的原始分分别转换到五个分数区间,并对所得分数的小数点后一位进行“四舍五入”,最后得到保留为整数的转换分成绩,并作为赋分成绩.具体等级比例和赋分区间如下表:
已知该市本次高二调研考试化学科目考试满分为100分.
(1)已知转换公式符合一次函数模型,若学生甲、乙在本次考试中化学的原始成绩分别为84,78,转换分成绩为78,71,试估算该市本次化学原始成绩B等级中的最高分.
(2)现从该市本次高二调研考试的化学成绩中随机选取100名学生的原始成绩进行分析,其频率分布直方图如图所示,求出图中的值,并用样本估计总体的方法,估计该市本次化学原始成绩等级中的最低分.
【解析】(1)设转换公式中转换分关于原始成绩的一次函数关系式为.
则,解得,
转换分的最高分为85,
.解得.
故该市本次化学原始成绩B等级中的最高分为90分.
(2),
.
设化学原始成绩等级中的最低分为,
综上,化学原始成绩等级中的最低分为70.
21.(2024·高一·全国·专题练习)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值;
(2)求样本成绩的第75百分位数;
(3)已知落在的平均成绩是61,方差是7,落在的平均成绩为70,方差是4,求两组成绩的总平均数和总方差.
【解析】(1)由每组小矩形的面积之和为1得,
所以.
(2)成绩落在内的频率为,
落在内的频率为,
显然第75百分位数,由,解得,
所以第75百分位数为84.
(3)由频率分布直方图知,成绩在的市民人数为,
成绩在的市民人数为,所以;
由样本方差计算总体方差公式,得总方差为.
课程标准
学习目标
(1)会计算一组数据的平均数.
(2)会用样本的基本数字特征(平均数、标准差)估计总体的基本数字特征.
(3)体会用样本估计总体的思想.
(4)结合实例,能用样本估计百分位数.
(1)了解平均数为什么是“最理想”的近似值.
(2)会根据频率分布表或频率直方图估计平均数.
(3)理解样本数据方差、标准差的意义,会计算方差、标准差.
(4)用频率直方图估计总体分布.
(5)理解百分位数的统计含义.
得分
6
7
8
9
10
人数
1
2
4
2
1
原来的8个数据
平均数
极差
中位数
18
众数
18
去掉一个最高分和一个最低分后的6个数据
平均数
极差
中位数
18
众数
18
1号
裁判
2号
裁判
3号
裁判
4号
裁判
5号
裁判
6号
裁判
7号
裁判
难度
系数
本轮
得分
a
9.5
9.0
10.0
9.5
10.0
10.0
3.2
92.80
样本分数段
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
5
10
20
a
25
10
人员
经理
管理人员
高级技工
工人
学徒
合计
月工资(元)
22 000
2 500
2 200
2 000
1 000
29 700
人数
1
6
5
10
1
23
合计
22 000
15 000
11 000
20 000
1 000
69 000
日期
周一
周二
周三
周四
周五
周六
周日
得分
10
25
30
13
35
31
25
日期
周一
周二
周三
周四
周五
周六
周日
得分
35
26
15
20
25
17
30
分组
频数
频率
10
0.20
24
n
m
p
2
0.04
合计
M
1
等级
比例
赋分区间
高中数学苏教版 (2019)必修 第二册13.2 基本图形位置关系精品精练: 这是一份高中数学苏教版 (2019)必修 第二册<a href="/sx/tb_c4002211_t7/?tag_id=28" target="_blank">13.2 基本图形位置关系精品精练</a>,文件包含1321平面的基本性质六大题型练习原卷高中数学苏教版必修二docx、1321平面的基本性质六大题型练习解析卷高中数学苏教版必修二docx等2份试卷配套教学资源,其中试卷共68页, 欢迎下载使用。
苏教版 (2019)必修 第二册12.4 复数的三角形式精品课堂检测: 这是一份苏教版 (2019)必修 第二册<a href="/sx/tb_c4002207_t7/?tag_id=28" target="_blank">12.4 复数的三角形式精品课堂检测</a>,文件包含124复数的三角形式六大题型练习原卷高中数学苏教版必修二docx、124复数的三角形式六大题型练习解析卷高中数学苏教版必修二docx等2份试卷配套教学资源,其中试卷共37页, 欢迎下载使用。
苏教版 (2019)必修 第二册12.3 复数的几何意义优秀习题: 这是一份苏教版 (2019)必修 第二册<a href="/sx/tb_c4002206_t7/?tag_id=28" target="_blank">12.3 复数的几何意义优秀习题</a>,文件包含123复数的几何意义六大题型练习原卷高中数学苏教版必修二docx、123复数的几何意义六大题型练习解析卷高中数学苏教版必修二docx等2份试卷配套教学资源,其中试卷共39页, 欢迎下载使用。