资料中包含下列文件,点击文件名可预览资料内容
还剩15页未读,
继续阅读
所属成套资源:备战2024年高考艺术生40天突破数学90分讲义
成套系列资料,整套一键下载
专题27 统计的应用-备战2024年高考艺术生40天突破数学90分讲义
展开
专题27 统计的应用
【考点预测】
一、抽样方法
三种抽样方式的对比
类型
共同点
各自特点
相互关系
使用范围
简单随机抽样
抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率
从总体中随机逐个抽取
总体容量较小
系统抽样
总体均分几段,每段T个,
第一段取a1,
第二段取a1+T,
第三段取a1+2T,
……
第一段简单随机抽样
总体中的个体个数较多
分层抽样
将总体分成n层,每层按比例抽取
每层按简单随机抽样或系统抽样
总体由差异明显的几部分组成
二、样本分析
(1)样本平均值:。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数ni;
②求出每组频率(n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:,s2(aX+b)=a2s2(X)。
【典型例题】
例1.(2023春·浙江绍兴·高三统考开学考试)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照分成9组,制成了如图所示的频率分布直方图.
由直方图可估计本校高三男生100米体能测试成绩小于13.5秒的人数为( )
A.47 B.54 C.67 D.94
【答案】D
【解析】由题意,则,解得,
由图,则本校高三男生100米体能测试成绩小于13.5秒的频率为,
估计本校高三男生100米体能测试成绩小于13.5秒的人数为.
故选:D.
例2.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,
解得.
故选:C
例3.(2023·全国·高三专题练习)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则第四袋牛奶的标号是( )
(下面摘取了某随机数表的第7行至第9行)
A.358 B.301 C.071 D.206
【答案】C
【解析】由题意可知,读取的第一个数据是583,不符合条件,第二个数据是921,不符合条件,第三个数据是206,符合条件;
即随机选取的第一袋牛奶标号是206;
以下数据依次是766,301,647,859,169,555,671,998,301,其中符合题意的数据只有301,169,301三个数据,但是301属于重复数据,继续往后计数;
下一个数是071,符合条件,即前四袋牛奶的标号依次为206,301,169,071;
所以,第四袋牛奶的标号为071.
故选:C.
例4.(2023秋·四川成都·高三成都七中校考阶段练习)年春节影市火爆依旧,《无名》、《满江红》、《交换人生》票房不断刷新,为了解我校高三名学生的观影情况,随机调查了名在校学生,其中看过《无名》或《满江红》的学生共有位,看过《满江红》的学生共有位,看过《满江红》且看过《无名》的学生共有位,则该校高三年级看过《无名》的学生人数的估计值为( )
A. B. C. D.
【答案】C
【解析】以集合表示调查的名在校学生看过《无名》的学生构成的集合,
集合表示调查的名在校学生看过《满江红》的学生构成的集合,如下图所示:
所以,调查的名在校学生看过《无名》的学生人数为,
所以,该校高三年级看过《无名》的学生人数的估计值为,
故选:C.
例5.(多选题)(2023秋·浙江湖州·高三安吉县高级中学校考期末)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【答案】BC
【解析】对A:设骑车时间的中位数为,则,解得,
故骑车时间的中位数的估计值是分钟,A错误;
对B:设坐公交车时间的40%分位数为,则,解得,
故坐公交车时间的40%分位数的估计值是19分钟,B正确;
对C:坐公交车时间的平均数,
骑车时间的平均数,
∵,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C正确;
对D:
坐公交车时间的方差
骑车时间的方差,
∵,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D错误.
故选:BC.
例6.(多选题)(2023·全国·高三专题练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率是
B.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若样本数据的标准差为8,则数据的标准差为32
【答案】AB
【解析】用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为,A正确;
已知一组数据1,2,m,6,7的平均数为4,
所以,解得:,
所以,
则这组数据的方差是,B正确;
数据13,27,24,12,14,30,15,17,19,23共10个数,从小到大排列为12,13,14,15,17,19,23,24,27,30,
由于,故选择第7和第8个数的平均数作为第70百分位数,
即,所以第70百分位数是,C错误;
若样本数据的标准差为8,所以的方差为64,
则数据的方差为,
所以数据的标准差为,D错误.
故选:AB
例7.(2023秋·北京·高三校考期末)在测试中,客观题难度的计算公式为,其中为第题的难度,为答对该题的人数,为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号
1
2
3
4
5
考前预估难度
0.9
0.8
0.7
0.6
0.4
测试后,随机抽取了20名学生的答题数据进行统计,结果如下:
题号
1
2
3
4
5
实测答对人数
16
16
14
14
4
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数学期望;
(3)定义统计量,其中为第题的实测难度,为第题的预估难度.规定:若,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预估是否合理.
【解析】(1)因为20人中答对第5题的人数为4人,因此第5题的实测难度为,
所以估计240人中有人实测答对第5题.
(2)的可能取值是0,1,2.
;;.
的分布列为:
0
1
2
.
(3)第1题的实测难度为,同理可得:第2题的实测难度为,
第3题的实测难度为,第4题的实测难度为,第5题的实测难度为0.2,
故.
因为 ,
所以,该次测试的难度预估是合理的.
例8.(2023秋·河南三门峡·高三统考期末)某果园新采摘了一批苹果,从中随机抽取50个作为样本,称出它们的重量(单位:克),将重量按照进行分组,得到频率分布直方图如图所示(同一组中的数据以该组区间的中点值为代表).
(1)估计这批苹果的重量的平均数;
(2)该果园准备把这批苹果销售给一家超市,据市场行情,有两种销售方案;
方案一:所有苹果混在一起,价格为2.5元/千克;
方案二:将不同重量的苹果分开,重量不小于160克的苹果的价格为3元/千克,重量小于160克的苹果的价格为2元/千克,但果园需支付每1000个苹果5元的分拣费.
分别估计并比较两种方案下果园销售10000个苹果的收入.
【解析】(1)由题意,得,解得,
50个苹果重量的平均数为,
故估计这批苹果的重量的平均数约为159.6克;
(2)若采用方案一,估计销售收入约为(元)
若采用方案二,重量小于160克的苹果的总重量约为
(千克),
重量不小于160克的苹果的总重量约为
(千克),
估计销售收入约为(元),
因为,因此,方案二的销售收入更高.
例9.(2023·高三课时练习)为倡导节能减排,某市计划制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,并绘制成如图所示的频率分布直方图.
(1)求直方图中的a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
【解析】(1)由频率分布直方图可知,月用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1)知,100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以.
由0.50×(x-2)=0.5-0.48,解得x=2.04,可估计居民月均用水量的中位数为2.04吨.
【技能提升训练】
一、单选题
1.(2023·全国·高三专题练习)“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据
【答案】C
【解析】“中国天眼”主要是通过观察获取数据.
故选:C.
2.(2023·全国·高三专题练习)在“世界读书日”前夕,为了了解某地名居民某天的阅读时间,从中抽取了名居民的阅读时间进行统计分析.在这个问题中,名居民的阅读时间的全体是
A.总体 B.个体
C.样本的容量 D.从总体中抽取的一个样本
【答案】A
【解析】从5000份中抽取200份,样本的容量是200,抽取的200份是一个样本,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.所以选A.
【考点定位】统计基本概念.
3.(2023·全国·高三专题练习)某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【答案】A
【解析】根据简单随机抽样及分层随机抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概率都等于
故选:A.
4.(2023·全国·高三专题练习)从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按,,…,进行编号,然后从随机数表第行的第列和第列数字开始从左往右依次选取两个数字,则选出的第个同学的编号为(注:表为随机数表的第行与第行)( )
A. B. C. D.
【答案】A
【解析】按题意,从第一行第5列,两个两个数字取数,抽样编号依次为43,36,47,46,24,第5个是24,
故选:A
5.(2023·上海·高三专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【答案】A
【解析】①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,不满足无放回抽取.
综上可得以上均不满足简单随机抽样的定义,
故选:A.
6.(2023·辽宁·校联考模拟预测)为庆祝中国共产主义青年团成立100周年,某高中团委举办了共青团史知识竞赛(满分100分),其中高一、高二、高三年级参赛的共青团员的人数分别为800,600,600.现用分层抽样的方法从三个年级中抽取样本,经计算可得高一、高二年级共青团员成绩的样本平均数分别为85,90,全校共青团员成绩的样本平均数为88,则高三年级共青团员成绩的样本平均数为( )
A.87 B.89 C.90 D.91
【答案】C
【解析】因为高一、高二、高三年级参赛的共青团员的人数分别为800,600,600,
设利用分层抽样从高一年级抽取人,则从高二年级抽取人,从高三年级抽取人,
设高三年级共青团员成绩的样本平均数为,
则,解得,
故选:C
7.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,
解得.
故选:C
8.(2023秋·辽宁辽阳·高三统考期末)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
A.55 B.57.25 C.58.75 D.60
【答案】C
【解析】因为,
所以该地中学生体重的第75百分位数在内,
设第75百分位数为m,则,解得.
故选:C
9.(2023秋·浙江嘉兴·高三统考期末)在某校的“迎新年”歌咏比赛中,6位评委给某位参赛选手打分,6个分数的平均分为分,方差为,若去掉一个最高分分和一个最低分分,则剩下的4个分数满足( )
A.平均分分,方差 B.平均分分,方差
C.平均分分,方差 D.平均分分,方差
【答案】C
【解析】设这个数分别为,平均数为,方差为,的平均数为,方差为,则
由题意可知,,
所以,即,
所以,
所以,即,
所以,
所以剩下的4个分数满足平均分分,方差.
故选:C.
10.(2023秋·浙江杭州·高三期末)冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超过5人体温高于,则称没有发生群体性发热.根据下列连续7天体温高于人数的统计量,能判定该公司没有发生群体性发热的为( )
①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为.
A.①③ B.③④ C.②③ D.②④
【答案】D
【解析】任意连续7天,每天不超过5人体温高于的人数为2,2,2,3,3,4,6,
则满足中位数是3,众数为2,但第7天是6人高于5人,故①错误;
任意连续7天,每天不超过5人体温高于的人数为0,1,2,4,4,4,6,
则满足均值是3,众数为4,但第7天是6人高于5人,故③错误;
对于②,将个数据从小到大排列为,
,,所以,
由于是自然数,且,
所以都不超过,②正确.
对于④,将个数据从小到大排列为,
,,
,
,
由于是自然数,若自然数大于,则,矛盾,
所以都不超过,④正确.
综上所述,正确的为②④.
故选:D
11.(2023春·河南新乡·高三校联考开学考试)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )
A.800 B.600 C.700 D.750
【答案】C
【解析】由频率分布直方图知,销售价格在内的频率是,
所以1000台汽车中,销售价格在内的车辆台数为.
故选:C
12.(2023·广西桂林·统考模拟预测)有一组样本数据,,…,,由这组数据得到新的样本数据,,…,,其中(,2,…,n),且,则下列说法中错误的是( )
A.新样本数据的平均数是原样本数据平均数的c倍
B.新样本数据的上四分位数是原样本数据上四分位数的c倍
C.新样本数据的方差是原样本数据方差的c倍
D.新样本数据的极差是原样本数据极差的c倍
【答案】C
【解析】对于A,根据平均数的定义知,新样本数据的平均数是原样本数据平均数的c倍,选项A正确;
对于B,根据百分位数的定义知,新样本数据的上四分位数是原样本数据上四分位数的c倍,选项B正确;
对于C,根据方差的计算公式知,新样本数据的方差是原样本数据方差的倍,所以选项C错误;
对于D,根据极差的定义知,新样本数据的极差是原样本数据极差的c倍,选项D正确.
故选:C
13.(2023·全国·模拟预测)已知一组数据:的平均数是4,方差是2,则由和11这四个数据组成的新数据组的方差是( )
A.27 B. C.12 D.11
【答案】B
【解析】因为一组数据,,的平均数是4,方差是2,
所以,
所以,
所以,11的平均数为
,
所以,11的方差为
故选:B
14.(2023·全国·校联考模拟预测)已知某样本的容量为50,平均数为36,方差为48,现发现在收集这些数据时,其中的两个数据记录有误,一个错将24记录为34,另一个错将48记录为38.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )
A. B.
C. D.
【答案】B
【解析】设收集的48个准确数据为,
所以,所以,
所以,又
,
,
故选:B.
15.(2023秋·河南驻马店·高三统考期末)为了让学生了解环保知识,增强环保意识,某班举行了一次环保知识有奖竞答活动,有名学生参加活动.已知这名学生得分的平均数为,方差为.若将当成一个学生的分数与原来的名学生的分数一起,算出这个分数的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】B
【解析】设这名学生得分分别是、、、、,
则,,故,
因为,
,
因为,故.
故选:B.
二、多选题
16.(2023春·江西·高三校联考阶段练习)随着工业自动化和计算机技术的发展,中国机器人进入大量生产和实际应用阶段,下图为2022年中国服务机器人各行业渗透率调查情况.
根据该图,下列结论错误的是( )
A.物流仓储业是目前服务行业中服务机器人已应用占比最高的行业
B.教育业目前在大力筹备应用服务机器人
C.未计划使用服务机器人占比最高的是政务服务业
D.图中八大服务业中服务机器人已应用占比的中位数是33.3%
【答案】ABC
【解析】对A,由图易知,物流仓储业在目前服务行业中服务机器人已应用占比最高,A对;
对B,由图易知,教育业在目前服务行业中服务机器人筹备中占比最高,B对;
对C,由图易知,政务服务业在目前服务行业中服务机器人未计划占比最高,C对;
对D,由图易知,八大服务业中服务机器人已应用占比已经排好序,故中位数是,D错.
故选:ABC
17.(2023春·山东济南·高三统考开学考试)居家学习期间,某学校发起了“畅读经典,欢度新年”活动,根据统计数据可知,该校共有1200名学生,所有学生每天读书时间均在20分钟到100分钟之间,他们的日阅读时间频率分布直方图如图所示.则下列结论正确的是( )
A.该校学生日阅读时间的众数约为70
B.该校学生日阅读时间不低于60分钟的人数约为360
C.该校学生日阅读时间的第50百分位数约为65
D.该校学生日阅读时间的平均数约为64
【答案】ACD
【解析】对于A,由图可知众数约为,故A正确;
对于B,阅读时间不低于60分钟的人数约为(0.02+0.01)×20×1200=720,故B错误;
对于C, [20,60)的频率为(0.005+0.015)×20=0.4, [60,80)的频率为0.02×20=0.4,
∴第50百分位数为 ,故C正确;
对于D,平均值为30×0.005×20+50×0.015×20+70×0.02×20+90×0.01×20=64,故D正确;
故选:ACD
18.(2023秋·江苏泰州·高三统考期末)已知一组数据为:4,1,2,5,5,3,3,2,3,2,则( )
A.标准差为 B.众数为2和3
C.70分位数为 D.平均数为3
【答案】BCD
【解析】,D对.
,方差为,A错.
众数为2和3,B对.
,按大小顺序排为1,2,2,2,3,3,3,4,5,5,第7,8位数的平均数为,C对.
故选:BCD
19.(2023春·广东揭阳·高三校考开学考试)有一组样本数据,其样本平均数为.现加入一个新数据,且,组成新的样本数据,与原样本数据相比,新的样本数据可能( )
A.平均数不变 B.众数不变
C.极差变小 D.第20百分位数变大
【答案】BD
【解析】因为,所以新的样本数据平均数减小,A错误;
加入一个新数据,则众数仍有可能为原数据的众数,B正确;
若加入一个新数据不是最大值也不是最小值,则新数据极差等于原数据极差,
C错误;
若为原数据从小到大排列的第20为后的数,因为样本数增加,所以第20百分位数可能后移,则新数据第20百分位数可能变大.D正确,
故选:BD.
20.(2023春·安徽·高三校联考开学考试)某校为做好疫情防控,每天早中晩都要对学生进行体温检测.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第60百分位数为36.4℃
【答案】ABC
【解析】对于A选项,甲同学体温的极差为℃,故A选项正确;
对于B选项,乙同学体温为,其众数为36.4℃,中位数、平均数均为36.4℃,故B选项正确;
对于C选项,根据图中数据,甲同学的体温平均数为36.4℃,与乙同学的体温平均数相同,但甲同学的体温极差为℃,大于乙同学的体温极差℃,而且从图中容易看出乙同学的数据更集中,故乙同学的体温比甲同学的体温稳定,C选项正确;
对于D选项,甲同学的体温从小到大排序为,,故甲同学体温的第60百分位数为36.5℃,故D选项错误.
故选:ABC
21.(2023春·全国·高三竞赛)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若是这组数据的上四分位数,则可能为( )
A.126 B.127 C.128 D.129
【答案】BCD
【解析】将所给的数据除外按从小到大的顺序排列为:87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
由上四分位数的定义可得:该组数据的上四分位数位于第个,
即该组数据的上四分位数位于第13个和第14个数之间,
而该组数据从小到大的顺序排列后第13个和第14个数分别为127 ,129,
所以,结合选项可能为127,128,129,
故选:BCD.
三、填空题
22.(2023·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约_____________石(结果四舍五入保留整数);
【答案】
【解析】依题意可得米内夹谷的比例为,
所以这批米内有谷子石.
故答案为:.
23.(2023·全国·高三专题练习)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为________石(精确到小数点后一位数字)
【答案】169.1
【解析】由题意可知样本中夹谷的含量为:=,
所以总体中夹谷为:1534 169.1(石).
故答案为:169.1.
24.(2023·全国·高三专题练习)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
【答案】0.98.
【解析】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为.
25.(2023秋·江西景德镇·高三统考阶段练习)嫦娥九号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第4列和第5列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为_______________.
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
【答案】
【解析】依题意可知,选出的个体编号为:等等,
所以选出来的第7个个体的编号为.
故答案为:
26.(2023秋·贵州铜仁·高三统考期末)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为42的样本,那么应抽取女运动员人数是____________.
【答案】18
【解析】女运动员的人数为,
故男女运动员的人数比例为,所以女生应抽取人.
故答案为:18
27.(2023春·湖南长沙·高三长郡中学校考阶段练习)已知甲、乙两组按从小到大顺序排列的数据:
甲组:、、、、、;
乙组:、、、、、.
若这两组数据的第百分位数,第百分位数分别对应相等,则___________.
【答案】
【解析】因为,,
所以,甲组第百分位数为,乙组的第百分位数为,则,
甲组第百分位数为,乙组的第百分位数为,则,可得,
因此,.
故答案为:.
28.(2023春·江苏常州·高三校联考开学考试)数据的第25百分位数是__________.
【答案】
【解析】先按照从小到大排序:,共12个数据,.
第3,4个数据分别为则第25百分位数为,
故答案为:.
29.(2023·甘肃兰州·校考一模)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为_____;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时,980小时,1030小时,估计这个企业所生产的该产品的平均使用寿命为______.
【答案】 50 1015小时
【解析】第一分厂应抽取的件数为100×50%=50;
该产品的平均使用寿命为1020×0.5+980×0.2+1030×0.3=1015(小时).
故答案为:50;1015小时.
四、解答题
30.(2023春·四川泸州·高三四川省泸县第四中学校考开学考试)近几年,每到春寒交替的季节,北京地区的医院呼吸利都人满为患,致病的罪魅祸首就是“雾霜”,私家车排放的可吸人颗粒物PM10和PM2.5是首要污染源为此政府提出“公交优先就是公民优先”引导大家公交出行,但公交车的数量太多会造成资源的浪费,太少又难以满足乘客需求,为此,某市公交公司在某站台的60名候车乘客中进行随机抽样,共抽取10人进行调查反馈,所选乘客情况如下表所示:
组别
候车时间(单位:)
人数
一
1
二
5
三
3
四
1
(1)估计这60名乘客中候车时间少于10分钟的人数;
(2)现从这10人中随机取2人,求恰有一人来自第二组的概率.
【解析】(1)候车时间少于10分钟的人数为(人)
(2)10人取2人的结果数为,一人来自第二组的结果数为,
另外一人来自其他三组的结果数为,故恰有一人来自第二组的概率为
31.(2023·全国·高三专题练习)自2020年初以来,由于新冠疫情的冲击,人们日常购物的方式发生了较大的变化,各种便民的团购群异常活跃,据某微信公众号消息,参团进行团购已逐渐成为一大常规的购物形式,因此外卖员的收入明显提高.为调查某市外卖员的收入,现随机抽取500名外卖员,按照他们投送的距离分类统计得到如图所示的频率分布直方图.将上述调查所得到的频率视为概率.
(1)估计该市外卖员的平均运送距离;
(2)假设外卖平台给外卖员的运送距离与外卖员的收入有关,其中甲平台规定:1000米以内每份2元,1000米至3000米每份5元,3000米以上每份13元.乙平台规定:2000米以内每份3元,2000米至3000米每份6元,3000米至4000米每份12元,4000米以上每份18元,若你暑期打工去送外卖,每天能送50份,并且只考虑每天的平均收入,你会选择哪一家平台?为什么?
【解析】(1)由频率分布直方图可知,平均运送距离为(千米),
所以估计该市外卖员的平均运送距离为2.8千米.
(2)设外卖员在甲平台每份外卖的收入为X元,在乙平台每份外卖的收入为Y元,则可得到X,Y的分布列分别为
X
2
5
13
P
0.05
0.55
0.4
则(元),
(元),即选择甲平台每天的平均收入为402.5元.
Y
3
6
12
18
P
0.25
0.35
0.25
0.15
则(元),
(元),即选择乙平台每天的平均收入为427.5元.因为
故会选择乙平台,因为每天平均收入会高一些.
32.(2023·青海海东·统考一模)网购是目前很流行也很实用的购物方式.某购物网站的销售商为了提升顾客购物的满意度,随机抽取100名顾客进行问卷调查,根据顾客对该购物网站评分的分数(满分:100分),按分成5组,得到的频率分布直方图如图所示.
(1)估计顾客对该购物网站的评分的中位数(结果保留整数);
(2)若采用分层抽样的方法从对该购物网站的评分在和内的顾客中抽取6人,再从这6人中随机抽取2人,求抽取的2人中恰有1人对该购物网站的评分在内的概率.
【解析】(1)因为,
所以顾客对该购物网站的评分的中位数在内.
设顾客对该购物网站的评分的中位数为,则,
解得,即估计顾客对该购物网站的评分的中位数为72.
(2)由频率分布直方图可知顾客评分在和内的频率分别是和,则采用分层抽样的方法抽取的6人中,对该购物网站的评分在内的有4人,记为,对该购物网站的评分在,内的有2人,记为.
从这6人中随机抽取2人的情况有,共15种.
其中符合条件的情况有,共8种,
故所求概率.
33.(2023·上海·高三专题练习)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组
频数
频率
4
0.08
0.16
0.20
16
合计
50
1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【解析】(1)补全频率分布表如下:
分组
频数
频率
4
0.08
8
0.16
10
0.20
16
0.32
12
0.24
合计
50
1.00
(2)频数分布直方图如下图所示:
(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的,
因为成绩在70.5~80.5分的学生频率为0.20,
所以成绩在75.5~80.5分的学生频率为0.10.
成绩在80.5~85.5分的学生占80.5~90.5分的学生的.
因为成绩在80.5~90.5分的学生频率为0.32,
所以成绩在80.5~85.5分的学生频率为0.16,
所以成绩在75.5~85.5分的学生频率为0.26.
∵有900名学生参加了这次竞赛,
∴该校获得二等奖的学生有:0.26×900=234,
∴该校获得二等奖的学生有234人.
34.(2023·全国·高三专题练习)鱼卷是泉州十大名小吃之一,不但本地人喜欢,还深受外来游客的赞赏.小张从事鱼卷生产和批发多年,有着不少来自零售商和酒店的客户.当地的习俗是农历正月没有生产鱼卷,客户正月所需要的鱼卷都会在农历十二月底进行一次性采购.小张把去年年底采购鱼卷的数量x(单位:箱)在[100,200)的客户称为“熟客”,并把他们去年采购的数量绘制成如表:
采购数x(单位:箱)
[100,120)
[120,140)
[140,160)
[160,180)
[180,200)
客户数
10
10
5
20
5
(1)根据表中的数据,在答题卡上补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的“熟客”人数;
(2)若去年年底“熟客”们采购的鱼卷数量占小张去年年底总的销售量的,估算小张去年年底总的销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于鱼卷受到游客们的青睐,小张做了一份市场调查,决定今年年底是否在网上出售鱼卷,若没有在网上出售鱼卷,则按去年的价格出售,每箱利润为20元,预计销售量与去年持平;若计划在网上出售鱼卷,则需把每箱售价下调2至5元,且每下调m元()销售量可增加1000m箱,求小张在今年年底收入Y(单位:元)的最大值.
【解析】(1)由表数据,得到[120,140), [160,180)的频率分别为
补全频率分布直方图,如图:
根据上图,可知采购数在168箱以上的“熟客”人数为:
50×20×(0.005+0.020)=17人,
(2)由图可知,去年年底“熟客”所采购的鱼卷总数大约为:
110×10+130×10+150×5+170×20+190×5=7500(箱),
∴小张去年年底总的销售量为750012000(箱).
(3)若没有在网上出售鱼卷,则今年的年底小张的收入为12000×20=240000(元),
若网上出售鱼卷,则今年的年底的销售量为12000+1000m(箱),每箱的利润为20﹣m(元),
则今年的年底小张的收入为Y=(20﹣m)(12000+1000m)
=1000()=1000256000(元),
当且仅当时等号成立.
∵256000>240000,
∴小张在今年年底收入Y(单位:元)的最大值为256000(元)
35.(2023·上海·高三专题练习)为进一步增强疫情防控期间群众的防控意识,使广大群众充分了解新冠肺炎疫情防护知识,提高预防能力,做到科学防护,科学预防.某组织通过网络进行新冠肺炎疫情防控科普知识问答.共有100人参加了这次问答,将他们的成绩(满分100分)分成,,,,,这六组,制成如图所示的频率分布直方图.
(1)求图中a的值,并估计这100人问答成绩的中位数和平均数;(同一组数据用该组数据的中点值代替)
(2)用分层随机抽样的方法从问答成绩在内的人中抽取一个容量为5的样本,再从样本中任意抽取2人,求这2人的问答成绩均在内的概率.
【解析】(1)由图可知,,解得.
设中位数为x,则,所以.
这100人问答成绩的平均数约为.
(2)用分层随机抽样的方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,
则问答成绩在[60,70)内的有人,分别记为A,B;
问答成绩在[70,80)内的有人分别记为a,b,C.
从中任意抽取2人,则实验的样本空间
W={(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c)},共有10个样本点.
设事件A为2人的问答成绩均在[70,80)内的概率,
则,
所以这2人的间答成绩均在[70,80)内的概率.
36.(2023·广西梧州·统考一模)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,,.
(1)求图中的值和学生成绩的中位数;
(2)从成绩低于60分的学生中随机选取2人,该2人中成绩在50分以下的人数记为,求的分布列与数学期望.
【解析】(1)由频率分布直方图知,解得:.
设成绩的中位数为,有,
解得:.
(2)由频率分布直方图知成绩低于60分的学生人数为,
成绩在50分以下的人数为.因此可能的取值为0,1,2,
,,.
所以的分布列为
0
1
2
故的数学期望为.
【考点预测】
一、抽样方法
三种抽样方式的对比
类型
共同点
各自特点
相互关系
使用范围
简单随机抽样
抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率
从总体中随机逐个抽取
总体容量较小
系统抽样
总体均分几段,每段T个,
第一段取a1,
第二段取a1+T,
第三段取a1+2T,
……
第一段简单随机抽样
总体中的个体个数较多
分层抽样
将总体分成n层,每层按比例抽取
每层按简单随机抽样或系统抽样
总体由差异明显的几部分组成
二、样本分析
(1)样本平均值:。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数ni;
②求出每组频率(n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:,s2(aX+b)=a2s2(X)。
【典型例题】
例1.(2023春·浙江绍兴·高三统考开学考试)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照分成9组,制成了如图所示的频率分布直方图.
由直方图可估计本校高三男生100米体能测试成绩小于13.5秒的人数为( )
A.47 B.54 C.67 D.94
【答案】D
【解析】由题意,则,解得,
由图,则本校高三男生100米体能测试成绩小于13.5秒的频率为,
估计本校高三男生100米体能测试成绩小于13.5秒的人数为.
故选:D.
例2.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,
解得.
故选:C
例3.(2023·全国·高三专题练习)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则第四袋牛奶的标号是( )
(下面摘取了某随机数表的第7行至第9行)
A.358 B.301 C.071 D.206
【答案】C
【解析】由题意可知,读取的第一个数据是583,不符合条件,第二个数据是921,不符合条件,第三个数据是206,符合条件;
即随机选取的第一袋牛奶标号是206;
以下数据依次是766,301,647,859,169,555,671,998,301,其中符合题意的数据只有301,169,301三个数据,但是301属于重复数据,继续往后计数;
下一个数是071,符合条件,即前四袋牛奶的标号依次为206,301,169,071;
所以,第四袋牛奶的标号为071.
故选:C.
例4.(2023秋·四川成都·高三成都七中校考阶段练习)年春节影市火爆依旧,《无名》、《满江红》、《交换人生》票房不断刷新,为了解我校高三名学生的观影情况,随机调查了名在校学生,其中看过《无名》或《满江红》的学生共有位,看过《满江红》的学生共有位,看过《满江红》且看过《无名》的学生共有位,则该校高三年级看过《无名》的学生人数的估计值为( )
A. B. C. D.
【答案】C
【解析】以集合表示调查的名在校学生看过《无名》的学生构成的集合,
集合表示调查的名在校学生看过《满江红》的学生构成的集合,如下图所示:
所以,调查的名在校学生看过《无名》的学生人数为,
所以,该校高三年级看过《无名》的学生人数的估计值为,
故选:C.
例5.(多选题)(2023秋·浙江湖州·高三安吉县高级中学校考期末)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
【答案】BC
【解析】对A:设骑车时间的中位数为,则,解得,
故骑车时间的中位数的估计值是分钟,A错误;
对B:设坐公交车时间的40%分位数为,则,解得,
故坐公交车时间的40%分位数的估计值是19分钟,B正确;
对C:坐公交车时间的平均数,
骑车时间的平均数,
∵,故坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值,C正确;
对D:
坐公交车时间的方差
骑车时间的方差,
∵,故坐公交车时间的方差的估计值大于骑车时间的方差的估计值,D错误.
故选:BC.
例6.(多选题)(2023·全国·高三专题练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率是
B.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若样本数据的标准差为8,则数据的标准差为32
【答案】AB
【解析】用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率为,A正确;
已知一组数据1,2,m,6,7的平均数为4,
所以,解得:,
所以,
则这组数据的方差是,B正确;
数据13,27,24,12,14,30,15,17,19,23共10个数,从小到大排列为12,13,14,15,17,19,23,24,27,30,
由于,故选择第7和第8个数的平均数作为第70百分位数,
即,所以第70百分位数是,C错误;
若样本数据的标准差为8,所以的方差为64,
则数据的方差为,
所以数据的标准差为,D错误.
故选:AB
例7.(2023秋·北京·高三校考期末)在测试中,客观题难度的计算公式为,其中为第题的难度,为答对该题的人数,为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号
1
2
3
4
5
考前预估难度
0.9
0.8
0.7
0.6
0.4
测试后,随机抽取了20名学生的答题数据进行统计,结果如下:
题号
1
2
3
4
5
实测答对人数
16
16
14
14
4
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数学期望;
(3)定义统计量,其中为第题的实测难度,为第题的预估难度.规定:若,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预估是否合理.
【解析】(1)因为20人中答对第5题的人数为4人,因此第5题的实测难度为,
所以估计240人中有人实测答对第5题.
(2)的可能取值是0,1,2.
;;.
的分布列为:
0
1
2
.
(3)第1题的实测难度为,同理可得:第2题的实测难度为,
第3题的实测难度为,第4题的实测难度为,第5题的实测难度为0.2,
故.
因为 ,
所以,该次测试的难度预估是合理的.
例8.(2023秋·河南三门峡·高三统考期末)某果园新采摘了一批苹果,从中随机抽取50个作为样本,称出它们的重量(单位:克),将重量按照进行分组,得到频率分布直方图如图所示(同一组中的数据以该组区间的中点值为代表).
(1)估计这批苹果的重量的平均数;
(2)该果园准备把这批苹果销售给一家超市,据市场行情,有两种销售方案;
方案一:所有苹果混在一起,价格为2.5元/千克;
方案二:将不同重量的苹果分开,重量不小于160克的苹果的价格为3元/千克,重量小于160克的苹果的价格为2元/千克,但果园需支付每1000个苹果5元的分拣费.
分别估计并比较两种方案下果园销售10000个苹果的收入.
【解析】(1)由题意,得,解得,
50个苹果重量的平均数为,
故估计这批苹果的重量的平均数约为159.6克;
(2)若采用方案一,估计销售收入约为(元)
若采用方案二,重量小于160克的苹果的总重量约为
(千克),
重量不小于160克的苹果的总重量约为
(千克),
估计销售收入约为(元),
因为,因此,方案二的销售收入更高.
例9.(2023·高三课时练习)为倡导节能减排,某市计划制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,并绘制成如图所示的频率分布直方图.
(1)求直方图中的a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
【解析】(1)由频率分布直方图可知,月用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),(1.5,2],[2,2.5),[3,3.5),[3.5,4),[4,4.5)的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.
(2)由(1)知,100位居民月均水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以.
由0.50×(x-2)=0.5-0.48,解得x=2.04,可估计居民月均用水量的中位数为2.04吨.
【技能提升训练】
一、单选题
1.(2023·全国·高三专题练习)“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据
【答案】C
【解析】“中国天眼”主要是通过观察获取数据.
故选:C.
2.(2023·全国·高三专题练习)在“世界读书日”前夕,为了了解某地名居民某天的阅读时间,从中抽取了名居民的阅读时间进行统计分析.在这个问题中,名居民的阅读时间的全体是
A.总体 B.个体
C.样本的容量 D.从总体中抽取的一个样本
【答案】A
【解析】从5000份中抽取200份,样本的容量是200,抽取的200份是一个样本,每个居民的阅读时间就是一个个体,5000名居民的阅读时间的全体是总体.所以选A.
【考点定位】统计基本概念.
3.(2023·全国·高三专题练习)某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
【答案】A
【解析】根据简单随机抽样及分层随机抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概率都等于
故选:A.
4.(2023·全国·高三专题练习)从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按,,…,进行编号,然后从随机数表第行的第列和第列数字开始从左往右依次选取两个数字,则选出的第个同学的编号为(注:表为随机数表的第行与第行)( )
A. B. C. D.
【答案】A
【解析】按题意,从第一行第5列,两个两个数字取数,抽样编号依次为43,36,47,46,24,第5个是24,
故选:A
5.(2023·上海·高三专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
【答案】A
【解析】①从无限多个个体中抽取100个个体作为样本,不满足总体个数为有限个;
②从20件玩具中一次性抽取3件进行质量检验,不满足逐个抽取;
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛,不满足随机抽取;
④盒子中共有80个零件,从中选出5个零件进行质量检验,
在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里,不满足无放回抽取.
综上可得以上均不满足简单随机抽样的定义,
故选:A.
6.(2023·辽宁·校联考模拟预测)为庆祝中国共产主义青年团成立100周年,某高中团委举办了共青团史知识竞赛(满分100分),其中高一、高二、高三年级参赛的共青团员的人数分别为800,600,600.现用分层抽样的方法从三个年级中抽取样本,经计算可得高一、高二年级共青团员成绩的样本平均数分别为85,90,全校共青团员成绩的样本平均数为88,则高三年级共青团员成绩的样本平均数为( )
A.87 B.89 C.90 D.91
【答案】C
【解析】因为高一、高二、高三年级参赛的共青团员的人数分别为800,600,600,
设利用分层抽样从高一年级抽取人,则从高二年级抽取人,从高三年级抽取人,
设高三年级共青团员成绩的样本平均数为,
则,解得,
故选:C
7.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,
解得.
故选:C
8.(2023秋·辽宁辽阳·高三统考期末)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
A.55 B.57.25 C.58.75 D.60
【答案】C
【解析】因为,
所以该地中学生体重的第75百分位数在内,
设第75百分位数为m,则,解得.
故选:C
9.(2023秋·浙江嘉兴·高三统考期末)在某校的“迎新年”歌咏比赛中,6位评委给某位参赛选手打分,6个分数的平均分为分,方差为,若去掉一个最高分分和一个最低分分,则剩下的4个分数满足( )
A.平均分分,方差 B.平均分分,方差
C.平均分分,方差 D.平均分分,方差
【答案】C
【解析】设这个数分别为,平均数为,方差为,的平均数为,方差为,则
由题意可知,,
所以,即,
所以,
所以,即,
所以,
所以剩下的4个分数满足平均分分,方差.
故选:C.
10.(2023秋·浙江杭州·高三期末)冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超过5人体温高于,则称没有发生群体性发热.根据下列连续7天体温高于人数的统计量,能判定该公司没有发生群体性发热的为( )
①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为.
A.①③ B.③④ C.②③ D.②④
【答案】D
【解析】任意连续7天,每天不超过5人体温高于的人数为2,2,2,3,3,4,6,
则满足中位数是3,众数为2,但第7天是6人高于5人,故①错误;
任意连续7天,每天不超过5人体温高于的人数为0,1,2,4,4,4,6,
则满足均值是3,众数为4,但第7天是6人高于5人,故③错误;
对于②,将个数据从小到大排列为,
,,所以,
由于是自然数,且,
所以都不超过,②正确.
对于④,将个数据从小到大排列为,
,,
,
,
由于是自然数,若自然数大于,则,矛盾,
所以都不超过,④正确.
综上所述,正确的为②④.
故选:D
11.(2023春·河南新乡·高三校联考开学考试)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )
A.800 B.600 C.700 D.750
【答案】C
【解析】由频率分布直方图知,销售价格在内的频率是,
所以1000台汽车中,销售价格在内的车辆台数为.
故选:C
12.(2023·广西桂林·统考模拟预测)有一组样本数据,,…,,由这组数据得到新的样本数据,,…,,其中(,2,…,n),且,则下列说法中错误的是( )
A.新样本数据的平均数是原样本数据平均数的c倍
B.新样本数据的上四分位数是原样本数据上四分位数的c倍
C.新样本数据的方差是原样本数据方差的c倍
D.新样本数据的极差是原样本数据极差的c倍
【答案】C
【解析】对于A,根据平均数的定义知,新样本数据的平均数是原样本数据平均数的c倍,选项A正确;
对于B,根据百分位数的定义知,新样本数据的上四分位数是原样本数据上四分位数的c倍,选项B正确;
对于C,根据方差的计算公式知,新样本数据的方差是原样本数据方差的倍,所以选项C错误;
对于D,根据极差的定义知,新样本数据的极差是原样本数据极差的c倍,选项D正确.
故选:C
13.(2023·全国·模拟预测)已知一组数据:的平均数是4,方差是2,则由和11这四个数据组成的新数据组的方差是( )
A.27 B. C.12 D.11
【答案】B
【解析】因为一组数据,,的平均数是4,方差是2,
所以,
所以,
所以,11的平均数为
,
所以,11的方差为
故选:B
14.(2023·全国·校联考模拟预测)已知某样本的容量为50,平均数为36,方差为48,现发现在收集这些数据时,其中的两个数据记录有误,一个错将24记录为34,另一个错将48记录为38.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )
A. B.
C. D.
【答案】B
【解析】设收集的48个准确数据为,
所以,所以,
所以,又
,
,
故选:B.
15.(2023秋·河南驻马店·高三统考期末)为了让学生了解环保知识,增强环保意识,某班举行了一次环保知识有奖竞答活动,有名学生参加活动.已知这名学生得分的平均数为,方差为.若将当成一个学生的分数与原来的名学生的分数一起,算出这个分数的平均数为,方差为,则( )
A., B.,
C., D.,
【答案】B
【解析】设这名学生得分分别是、、、、,
则,,故,
因为,
,
因为,故.
故选:B.
二、多选题
16.(2023春·江西·高三校联考阶段练习)随着工业自动化和计算机技术的发展,中国机器人进入大量生产和实际应用阶段,下图为2022年中国服务机器人各行业渗透率调查情况.
根据该图,下列结论错误的是( )
A.物流仓储业是目前服务行业中服务机器人已应用占比最高的行业
B.教育业目前在大力筹备应用服务机器人
C.未计划使用服务机器人占比最高的是政务服务业
D.图中八大服务业中服务机器人已应用占比的中位数是33.3%
【答案】ABC
【解析】对A,由图易知,物流仓储业在目前服务行业中服务机器人已应用占比最高,A对;
对B,由图易知,教育业在目前服务行业中服务机器人筹备中占比最高,B对;
对C,由图易知,政务服务业在目前服务行业中服务机器人未计划占比最高,C对;
对D,由图易知,八大服务业中服务机器人已应用占比已经排好序,故中位数是,D错.
故选:ABC
17.(2023春·山东济南·高三统考开学考试)居家学习期间,某学校发起了“畅读经典,欢度新年”活动,根据统计数据可知,该校共有1200名学生,所有学生每天读书时间均在20分钟到100分钟之间,他们的日阅读时间频率分布直方图如图所示.则下列结论正确的是( )
A.该校学生日阅读时间的众数约为70
B.该校学生日阅读时间不低于60分钟的人数约为360
C.该校学生日阅读时间的第50百分位数约为65
D.该校学生日阅读时间的平均数约为64
【答案】ACD
【解析】对于A,由图可知众数约为,故A正确;
对于B,阅读时间不低于60分钟的人数约为(0.02+0.01)×20×1200=720,故B错误;
对于C, [20,60)的频率为(0.005+0.015)×20=0.4, [60,80)的频率为0.02×20=0.4,
∴第50百分位数为 ,故C正确;
对于D,平均值为30×0.005×20+50×0.015×20+70×0.02×20+90×0.01×20=64,故D正确;
故选:ACD
18.(2023秋·江苏泰州·高三统考期末)已知一组数据为:4,1,2,5,5,3,3,2,3,2,则( )
A.标准差为 B.众数为2和3
C.70分位数为 D.平均数为3
【答案】BCD
【解析】,D对.
,方差为,A错.
众数为2和3,B对.
,按大小顺序排为1,2,2,2,3,3,3,4,5,5,第7,8位数的平均数为,C对.
故选:BCD
19.(2023春·广东揭阳·高三校考开学考试)有一组样本数据,其样本平均数为.现加入一个新数据,且,组成新的样本数据,与原样本数据相比,新的样本数据可能( )
A.平均数不变 B.众数不变
C.极差变小 D.第20百分位数变大
【答案】BD
【解析】因为,所以新的样本数据平均数减小,A错误;
加入一个新数据,则众数仍有可能为原数据的众数,B正确;
若加入一个新数据不是最大值也不是最小值,则新数据极差等于原数据极差,
C错误;
若为原数据从小到大排列的第20为后的数,因为样本数增加,所以第20百分位数可能后移,则新数据第20百分位数可能变大.D正确,
故选:BD.
20.(2023春·安徽·高三校联考开学考试)某校为做好疫情防控,每天早中晩都要对学生进行体温检测.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第60百分位数为36.4℃
【答案】ABC
【解析】对于A选项,甲同学体温的极差为℃,故A选项正确;
对于B选项,乙同学体温为,其众数为36.4℃,中位数、平均数均为36.4℃,故B选项正确;
对于C选项,根据图中数据,甲同学的体温平均数为36.4℃,与乙同学的体温平均数相同,但甲同学的体温极差为℃,大于乙同学的体温极差℃,而且从图中容易看出乙同学的数据更集中,故乙同学的体温比甲同学的体温稳定,C选项正确;
对于D选项,甲同学的体温从小到大排序为,,故甲同学体温的第60百分位数为36.5℃,故D选项错误.
故选:ABC
21.(2023春·全国·高三竞赛)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若是这组数据的上四分位数,则可能为( )
A.126 B.127 C.128 D.129
【答案】BCD
【解析】将所给的数据除外按从小到大的顺序排列为:87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
由上四分位数的定义可得:该组数据的上四分位数位于第个,
即该组数据的上四分位数位于第13个和第14个数之间,
而该组数据从小到大的顺序排列后第13个和第14个数分别为127 ,129,
所以,结合选项可能为127,128,129,
故选:BCD.
三、填空题
22.(2023·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约_____________石(结果四舍五入保留整数);
【答案】
【解析】依题意可得米内夹谷的比例为,
所以这批米内有谷子石.
故答案为:.
23.(2023·全国·高三专题练习)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为________石(精确到小数点后一位数字)
【答案】169.1
【解析】由题意可知样本中夹谷的含量为:=,
所以总体中夹谷为:1534 169.1(石).
故答案为:169.1.
24.(2023·全国·高三专题练习)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
【答案】0.98.
【解析】由题意得,经停该高铁站的列车正点数约为,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为.
25.(2023秋·江西景德镇·高三统考阶段练习)嫦娥九号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第4列和第5列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为_______________.
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
【答案】
【解析】依题意可知,选出的个体编号为:等等,
所以选出来的第7个个体的编号为.
故答案为:
26.(2023秋·贵州铜仁·高三统考期末)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为42的样本,那么应抽取女运动员人数是____________.
【答案】18
【解析】女运动员的人数为,
故男女运动员的人数比例为,所以女生应抽取人.
故答案为:18
27.(2023春·湖南长沙·高三长郡中学校考阶段练习)已知甲、乙两组按从小到大顺序排列的数据:
甲组:、、、、、;
乙组:、、、、、.
若这两组数据的第百分位数,第百分位数分别对应相等,则___________.
【答案】
【解析】因为,,
所以,甲组第百分位数为,乙组的第百分位数为,则,
甲组第百分位数为,乙组的第百分位数为,则,可得,
因此,.
故答案为:.
28.(2023春·江苏常州·高三校联考开学考试)数据的第25百分位数是__________.
【答案】
【解析】先按照从小到大排序:,共12个数据,.
第3,4个数据分别为则第25百分位数为,
故答案为:.
29.(2023·甘肃兰州·校考一模)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为_____;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时,980小时,1030小时,估计这个企业所生产的该产品的平均使用寿命为______.
【答案】 50 1015小时
【解析】第一分厂应抽取的件数为100×50%=50;
该产品的平均使用寿命为1020×0.5+980×0.2+1030×0.3=1015(小时).
故答案为:50;1015小时.
四、解答题
30.(2023春·四川泸州·高三四川省泸县第四中学校考开学考试)近几年,每到春寒交替的季节,北京地区的医院呼吸利都人满为患,致病的罪魅祸首就是“雾霜”,私家车排放的可吸人颗粒物PM10和PM2.5是首要污染源为此政府提出“公交优先就是公民优先”引导大家公交出行,但公交车的数量太多会造成资源的浪费,太少又难以满足乘客需求,为此,某市公交公司在某站台的60名候车乘客中进行随机抽样,共抽取10人进行调查反馈,所选乘客情况如下表所示:
组别
候车时间(单位:)
人数
一
1
二
5
三
3
四
1
(1)估计这60名乘客中候车时间少于10分钟的人数;
(2)现从这10人中随机取2人,求恰有一人来自第二组的概率.
【解析】(1)候车时间少于10分钟的人数为(人)
(2)10人取2人的结果数为,一人来自第二组的结果数为,
另外一人来自其他三组的结果数为,故恰有一人来自第二组的概率为
31.(2023·全国·高三专题练习)自2020年初以来,由于新冠疫情的冲击,人们日常购物的方式发生了较大的变化,各种便民的团购群异常活跃,据某微信公众号消息,参团进行团购已逐渐成为一大常规的购物形式,因此外卖员的收入明显提高.为调查某市外卖员的收入,现随机抽取500名外卖员,按照他们投送的距离分类统计得到如图所示的频率分布直方图.将上述调查所得到的频率视为概率.
(1)估计该市外卖员的平均运送距离;
(2)假设外卖平台给外卖员的运送距离与外卖员的收入有关,其中甲平台规定:1000米以内每份2元,1000米至3000米每份5元,3000米以上每份13元.乙平台规定:2000米以内每份3元,2000米至3000米每份6元,3000米至4000米每份12元,4000米以上每份18元,若你暑期打工去送外卖,每天能送50份,并且只考虑每天的平均收入,你会选择哪一家平台?为什么?
【解析】(1)由频率分布直方图可知,平均运送距离为(千米),
所以估计该市外卖员的平均运送距离为2.8千米.
(2)设外卖员在甲平台每份外卖的收入为X元,在乙平台每份外卖的收入为Y元,则可得到X,Y的分布列分别为
X
2
5
13
P
0.05
0.55
0.4
则(元),
(元),即选择甲平台每天的平均收入为402.5元.
Y
3
6
12
18
P
0.25
0.35
0.25
0.15
则(元),
(元),即选择乙平台每天的平均收入为427.5元.因为
故会选择乙平台,因为每天平均收入会高一些.
32.(2023·青海海东·统考一模)网购是目前很流行也很实用的购物方式.某购物网站的销售商为了提升顾客购物的满意度,随机抽取100名顾客进行问卷调查,根据顾客对该购物网站评分的分数(满分:100分),按分成5组,得到的频率分布直方图如图所示.
(1)估计顾客对该购物网站的评分的中位数(结果保留整数);
(2)若采用分层抽样的方法从对该购物网站的评分在和内的顾客中抽取6人,再从这6人中随机抽取2人,求抽取的2人中恰有1人对该购物网站的评分在内的概率.
【解析】(1)因为,
所以顾客对该购物网站的评分的中位数在内.
设顾客对该购物网站的评分的中位数为,则,
解得,即估计顾客对该购物网站的评分的中位数为72.
(2)由频率分布直方图可知顾客评分在和内的频率分别是和,则采用分层抽样的方法抽取的6人中,对该购物网站的评分在内的有4人,记为,对该购物网站的评分在,内的有2人,记为.
从这6人中随机抽取2人的情况有,共15种.
其中符合条件的情况有,共8种,
故所求概率.
33.(2023·上海·高三专题练习)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组
频数
频率
4
0.08
0.16
0.20
16
合计
50
1.00
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
【解析】(1)补全频率分布表如下:
分组
频数
频率
4
0.08
8
0.16
10
0.20
16
0.32
12
0.24
合计
50
1.00
(2)频数分布直方图如下图所示:
(3)成绩在75.5~80.5分的学生占70.5~80.5分的学生的,
因为成绩在70.5~80.5分的学生频率为0.20,
所以成绩在75.5~80.5分的学生频率为0.10.
成绩在80.5~85.5分的学生占80.5~90.5分的学生的.
因为成绩在80.5~90.5分的学生频率为0.32,
所以成绩在80.5~85.5分的学生频率为0.16,
所以成绩在75.5~85.5分的学生频率为0.26.
∵有900名学生参加了这次竞赛,
∴该校获得二等奖的学生有:0.26×900=234,
∴该校获得二等奖的学生有234人.
34.(2023·全国·高三专题练习)鱼卷是泉州十大名小吃之一,不但本地人喜欢,还深受外来游客的赞赏.小张从事鱼卷生产和批发多年,有着不少来自零售商和酒店的客户.当地的习俗是农历正月没有生产鱼卷,客户正月所需要的鱼卷都会在农历十二月底进行一次性采购.小张把去年年底采购鱼卷的数量x(单位:箱)在[100,200)的客户称为“熟客”,并把他们去年采购的数量绘制成如表:
采购数x(单位:箱)
[100,120)
[120,140)
[140,160)
[160,180)
[180,200)
客户数
10
10
5
20
5
(1)根据表中的数据,在答题卡上补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的“熟客”人数;
(2)若去年年底“熟客”们采购的鱼卷数量占小张去年年底总的销售量的,估算小张去年年底总的销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于鱼卷受到游客们的青睐,小张做了一份市场调查,决定今年年底是否在网上出售鱼卷,若没有在网上出售鱼卷,则按去年的价格出售,每箱利润为20元,预计销售量与去年持平;若计划在网上出售鱼卷,则需把每箱售价下调2至5元,且每下调m元()销售量可增加1000m箱,求小张在今年年底收入Y(单位:元)的最大值.
【解析】(1)由表数据,得到[120,140), [160,180)的频率分别为
补全频率分布直方图,如图:
根据上图,可知采购数在168箱以上的“熟客”人数为:
50×20×(0.005+0.020)=17人,
(2)由图可知,去年年底“熟客”所采购的鱼卷总数大约为:
110×10+130×10+150×5+170×20+190×5=7500(箱),
∴小张去年年底总的销售量为750012000(箱).
(3)若没有在网上出售鱼卷,则今年的年底小张的收入为12000×20=240000(元),
若网上出售鱼卷,则今年的年底的销售量为12000+1000m(箱),每箱的利润为20﹣m(元),
则今年的年底小张的收入为Y=(20﹣m)(12000+1000m)
=1000()=1000256000(元),
当且仅当时等号成立.
∵256000>240000,
∴小张在今年年底收入Y(单位:元)的最大值为256000(元)
35.(2023·上海·高三专题练习)为进一步增强疫情防控期间群众的防控意识,使广大群众充分了解新冠肺炎疫情防护知识,提高预防能力,做到科学防护,科学预防.某组织通过网络进行新冠肺炎疫情防控科普知识问答.共有100人参加了这次问答,将他们的成绩(满分100分)分成,,,,,这六组,制成如图所示的频率分布直方图.
(1)求图中a的值,并估计这100人问答成绩的中位数和平均数;(同一组数据用该组数据的中点值代替)
(2)用分层随机抽样的方法从问答成绩在内的人中抽取一个容量为5的样本,再从样本中任意抽取2人,求这2人的问答成绩均在内的概率.
【解析】(1)由图可知,,解得.
设中位数为x,则,所以.
这100人问答成绩的平均数约为.
(2)用分层随机抽样的方法从问答成绩在[60,80)内的人中抽取一个容量为5的样本,
则问答成绩在[60,70)内的有人,分别记为A,B;
问答成绩在[70,80)内的有人分别记为a,b,C.
从中任意抽取2人,则实验的样本空间
W={(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c)},共有10个样本点.
设事件A为2人的问答成绩均在[70,80)内的概率,
则,
所以这2人的间答成绩均在[70,80)内的概率.
36.(2023·广西梧州·统考一模)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,,.
(1)求图中的值和学生成绩的中位数;
(2)从成绩低于60分的学生中随机选取2人,该2人中成绩在50分以下的人数记为,求的分布列与数学期望.
【解析】(1)由频率分布直方图知,解得:.
设成绩的中位数为,有,
解得:.
(2)由频率分布直方图知成绩低于60分的学生人数为,
成绩在50分以下的人数为.因此可能的取值为0,1,2,
,,.
所以的分布列为
0
1
2
故的数学期望为.
相关资料
更多