


所属成套资源:2025年高考数学一轮复习精品讲义(新高考专用)(原卷版+解析)
2025年高考数学一轮复习讲义(新高考专用)专题55随机抽样、统计图表(原卷版+解析)
展开
这是一份2025年高考数学一轮复习讲义(新高考专用)专题55随机抽样、统计图表(原卷版+解析),共52页。
【知识梳理】2
【真题自测】4
【考点突破】7
【考点1】简单随机抽样7
【考点2】分层随机抽样及其应用9
【考点3】统计图表10
【分层检测】13
【基础篇】13
【能力篇】18
考试要求:
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法.3.理解统计图表的含义.
知识梳理
1.简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
2.总体平均数与样本平均数
3.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为eq \(x,\s\up6(-)),eq \(y,\s\up6(-)),样本平均数为eq \(w,\s\up6(-)),则eq \(w,\s\up6(-))=eq \f(M,M+N)eq \(x,\s\up6(-))+eq \f(N,M+N)eq \(y,\s\up6(-))=eq \f(m,m+n)eq \(x,\s\up6(-))+eq \f(n,m+n)eq \(y,\s\up6(-)).
我们可以用样本平均数eq \(w,\s\up6(-))估计总体平均数eq \(W,\s\up6(-)).
4.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
3.频率分布直方图中小长方形高=eq \f(频率,组距).
真题自测
一、单选题
1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
3.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年B.23年C.25年D.35年
4.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
5.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
二、多选题
6.(2023·全国·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
三、解答题
7.(2023·全国·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
8.(2023·全国·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
考点突破
【考点1】简单随机抽样
一、单选题
1.(2022·黑龙江哈尔滨·三模)为了了解学生上网课期间作息情况,现从高三年级702人中随机抽取20人填写问卷调查,首先用简单随机抽样剔除2人,然后在剩余的700人中再用系统抽样的方法抽取20人,则( )
A.每个学生入选的概率都为B.每个学生人选的概率都为
C.每个学生人选的概率都为D.由于有剔除,学生入选的概率不全相等
2.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A.B.C.D.
二、多选题
3.(2024·广西南宁·模拟预测)给出下列命题,其中错误的命题为( )
A.若样本数据的方差为3,则数据的方差为6.
B.具有相关关系的两个变量x,y的相关系数为r,那么越接近于0,x,y之间的线性相关程度越高;
C.在一个列联表中,根据表中数据计算得到的观测值k,若k的值越大,则认为两个变量间有关的把握就越大;
D.甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
4.(2022·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟D.估计该地区约有1.5%的中学生吸烟
三、填空题
5.(23-24高三上·上海·期中)现利用随机数表发从编号为的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
6.(2022·新疆乌鲁木齐·模拟预测)我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约 石(结果四舍五入保留整数);
反思提升:
1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.
2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
【考点2】分层随机抽样及其应用
一、单选题
1.(2024·江西鹰潭·一模)某单位为了解职工体重情况,采用分层随机抽样的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151;女性平均体重为56千克,方差为159,男女人数之比为,则单位职工体重的方差为( )
A.166B.167C.168D.169
2.(2024·云南·模拟预测)某学校高三年级男生共有个,女生共有个,为调查该年级学生的年龄情况,通过分层抽样,得到男生和女生样本数据的平均数和方差分别为和,已知,则该校高三年级全体学生年龄的方差为( )
A.B.
C.D.
二、多选题
3.(2024·江西宜春·模拟预测)某学校高三年级共有900人,其中男生500人,现采用按性别比例分配的分层抽样抽取了容量为90的样本. 经计算得男生的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法中正确的是( )
A.女生的样本容量为40
B.女生甲被抽到的概率为
C.估计该校高三年级学生身高的均值为166
D.估计该校高三年级学生身高的方差大于19
4.(2023·山西临汾·一模)某学生社团有男生32名,女生24名,从中随机抽取一个容量为7的样本,某次抽样结果为:抽到3名男生和4名女生,则下列说法正确的是( )
A.这次抽样可能采用的是抽签法
B.这次抽样不可能是按性别分层随机抽样
C.这次抽样中,每个男生被抽到的概率一定小于每个女生被抽到的概率
D.这次抽样中,每个男生被抽到的概率不可能等于每个女生被抽到的概率
三、填空题
5.(2024·山东泰安·模拟预测)某高中为了了解学生参加数学建模社团的情况,采用了分层随机抽样的方法从三个年级中抽取了300人进行问卷调查,其中高一、高二年级各抽取了90人.已知该校高三年级共有720名学生,则该校共有学生 人.
6.(2024·陕西安康·模拟预测)杭州亚运会期间,某社区有200人参加协助交通管理的志愿团队,为了解他们参加这项活动的感受,用按比例分配的分层抽样的方法随机抽取了一个容量为40的样本,若样本中女性有16人,则该志愿团队中的男性人数为 .
反思提升:
1.求某层应抽个体数量:按该层所占总体的比例计算.
2.已知某层个体数量,求总体数量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算.
3.在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为eq \f(mx+ny,m+n).
【考点3】统计图表
一、单选题
1.(2022·安徽马鞍山·模拟预测)下图为国家统计局给出的2016-2020年福利彩票销售额、增长率及筹集公益金情况统计图,则下列说法正确的是( )
A.2016-2020年福利彩票销售额呈递减趋势
B.2016-2020年福利彩票销售额的年增长率呈递减趋势
C.2016-2020年福利彩票销售额、筹集公益金均在2018年取得最大值
D.2017-2018年福利彩票销售额增长的最多
2.(2021·广西柳州·一模)空气质量的指标是反映空气质量状况的指数,指数的值越小,表明空气质量越好,指数不超过50,空气质量为优,指数大于50且不超过100,空气质量为良,指数大于100,空气质量为污染,如图是某市2020年空气质量指标的月折线图.下列关于该市2020年空气质量的叙述中不一定正确的是( )
A.全年的平均指数对应的空气质量等级为优或良.
B.每月都至少有一天空气质量为优.
C.空气质量为污染的天数最多的月份是2月份.
D.2月,8月,9月和12月均出现污染天气.
二、多选题
3.(2024·辽宁·二模)下图为某市2023年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7924元,与上一年同比增长4.4%;农村居民人均消费支出4388元,与上一年同比增长7.8%,则关于2023年第一季度该市居民人均消费支出,下列说法正确的是( )
A.2023年第一季度该市居民人均消费支出6393元
B.居住及食品烟酒两项的人均消费支出总和超过了总人均消费支出的50%
C.城乡居民人均消费支出的差额与上一年同比在缩小
D.医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
4.(2021·广东佛山·模拟预测)在“世界杯”足球赛闭幕后,某中学学生会对本校高三年级1000名学生收看比赛的情况用随机抽样方式进行调查,样本容量为50,将数据分组整理后,列表如下:
从表中可以得出正确的结论为( )
A.表中m的数值为16
B.估计全年级观看比赛低于4场的学生约为32人
C.估计全年级观看比赛不低于4场的学生约为360
D.估计全年级观看比赛场数的众数为2
三、填空题
5.(2024·河北石家庄·三模)为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 .
6.(2024·四川成都·模拟预测)某校为了解高三学生身体素质情况,从某项体育测试成绩中随机抽取个学生的成绩进行分析,得到成绩频率分布直方图(如图所示),估计该校高三学生此项体育成绩的中位数为 .(结果保留整数)
反思提升:
(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
(3)频率分布直方图的数据特点:
①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
分层检测
【基础篇】
一、单选题
1.(2024·云南贵州·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01、02、、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
0140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191
A.51B.25C.32D.12
2.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人B.9人C.12人D.18人
3.(2021·全国·模拟预测)在某次射击比赛中,甲、乙两人各射击5次,射中的环数如图,则下列说法正确的是( )
A.,B.,
C.,D.,
4.(2024·湖北黄冈·模拟预测)为了解高中学生每天的体育活动时间,某市教育部门随机抽取高中学生进行调查,把每天进行体育活动的时间按照时长(单位:分钟)分成组:,40,50,50,60,60,70,,.然后对统计数据整理得到如图所示的频率分布直方图,则可估计这名学生每天体育活动时间的第百分位数为( )
A.B.C.D.
二、多选题
5.(2021·江苏南京·三模)面对新冠肺炎疫情冲击,我国各地区各部门统筹疫情防控和经济社会发展均取得显著成效.下表显示的是年月份到月份中国社会消费品零售总额数据,其中同比增长率是指和去年同期相比较的增长率,环比增长率是指与上个月份相比较的增长率,则下列说法正确的是( )
中国社会消费品零售总额
A.年月份到月份,社会消费品零售总额逐月上升
B.年月份到月份,月份同比增长率最大
C.年月份到月份,月份环比增长率最大
D.第季度的月消费品零售总额相比第季度的月消费品零售总额,方差更小
6.(2024·浙江杭州·三模)南丁格尔是一位英国护士、统计学家及社会改革者,被誉为现代护理学的奠基人.1854年,在克里米亚战争期间,她在接到英国政府的请求后,带领由38名志愿女护士组成的团队前往克里米亚救治伤员,并收集士兵死亡原因数据绘制了如下“玫瑰图”.图中圆圈被划分为12个扇形,按顺时针方向代表一年中的各个月份.每个扇形的面积与该月的死亡人数成比例.扇形中的白色部分代表因疾病或其他原因导致的死亡,灰色部分代表因战争受伤导致的死亡.右侧图像为1854年4月至1855年3月的数据,左侧图像为1855年4月至1856年3月的数据.下列选项正确的为( )
A.由于疾病或其他原因而死的士兵远少于战场上因伤死亡的士兵
B.1854年4月至1855年3月,冬季(12月至来年2月)死亡人数相较其他季节显著增加
C.1855年12月之后,因疾病或其他原因导致的死亡人数总体上相较之前显著下降
D.此玫瑰图可以佐证,通过改善军队和医院的卫生状况,可以大幅度降低不必要的死亡
7.(2024·黑龙江·三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
三、填空题
8.(2022·山西临汾·二模)现从某学校450名同学中用随机数表法随机抽取30人参加一项活动.将这450名同学编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被抽到的编号为 .
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
9.(2023·湖南常德·模拟预测)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为 .
10.(2023·广西河池·模拟预测)雅言传承文明,经典浸润人生,南宁市某校每年举办“品经诵典浴书香,提雅增韵享阅读”中华经典诵读大赛,比赛内容有三类:“诵读中国”、“诗教中国”、“笔墨中国”.已知高一、高二、高三报名人数分别为:100人、150人和250人.现采用分层抽样的方法,从三个年级中抽取25人组成校代表队参加市级比赛,则应该从高一年级学生中抽取的人数为 .
四、解答题
11.(2024·陕西渭南·模拟预测)某高中为配合爱国主义教育,开展国防科技知识竞赛,预赛后,将成绩最好的甲、乙两个班学生(每班都是40人)的得分情况做成如下的条形图(20道单项选择题,每题5分,满分100分).记甲、乙两班学生得分的平均数分别为,方差分别为,已求得
(1)分别求出甲、乙两班的学生得分为95分及以上的频率;
(2)试计算,并判断哪个班的学生的成绩波动更小.
12.(2024·陕西西安·模拟预测)某高科技公司组织大型招聘会,全部应聘人员的笔试成绩统计如图所示:
(1)求m的值,并估计全部应聘人员笔试成绩的中位数;
(2)该公司2020—2024年每年招聘的新员工人数逐年增加,且这五年招聘的新员工总人数为500,若用这五年的数据求出每年招聘的新员工人数y关于年份代码x(x=年份-2019)的线性回归方程为,请根据此回归模型预测该公司2026年招聘的新员工人数是否会超过250.
【能力篇】
一、单选题
1.(22-23高三上·浙江杭州·期末)给出下列命题,其中不正确的命题为( )
①若样本数据的方差为3,则数据的方差为6;
②回归方程为时,变量x与y具有负的线性相关关系;
③随机变量X服从正态分布,则;
④甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
A.①③④B.③④C.①②③D.①②③④
二、多选题
2.(2024·贵州黔东南·二模)某学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4000名学生(该校男女生人数之比为)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179.则下列说法正确的是参考公式:总体分为2层,各层抽取的样本量、样本平均数和样本方差分别为:,,,,,.记总的样本平均数为,样本方差为,则( )
参考公式:
A.抽取的样本里男生有60人
B.每一位学生被抽中的可能性为
C.估计该学校学生身高的平均值为170
D.估计该学校学生身高的方差为236
三、填空题
3.(2022·吉林·模拟预测)中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”已从愿景变为现实,中国各地滑雪场的数量也由2015年的1255家增加到2021年的3100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,下列说法中正确的序号是 .
①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高
②2016年至2021年中国滑雪场数量逐年上升
③2016年至2021年中国滑雪场新增数量逐年增加
④2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多
四、解答题
4.(2024·陕西安康·模拟预测)首届中国航协航空大会的一个鲜明的特色是在各个展区中设置了多项互动体验活动,吸引了很多的中小学生,其中模拟飞行体验区是让这些中小学生戴上VR眼镜模拟从起飞到降落,大大激发了他们的兴趣爱好.现从某个有互动体验的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:分钟,时间取整数),将时间分成六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(每组数据以区间的中点值为代表)
(2)为对比展区是否有体验区对中小学生的吸引程度,某工作人员给出了一份该展区中没有体验区的参观时间的随机数据,经计算得到该组数据参观时长平均值为65分钟,方差为,试判断有体验区的参观时长均值比没有体验区的参观时长均值是否有显著提高?(如果,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验展区?请说明理
名称
定义
总体均值
(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq \(Y,\s\up6(-))=eq \f(Y1+Y2+…+YN,N)=eq \f(1,N)eq \(∑,\s\up6(N),\s\d4(i=1))Yi为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式eq \(Y,\s\up6(-))=eq \f(1,N)eq \(∑,\s\up6(k),\s\d4(i=1))fiYi.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq \(y,\s\up6(-))=eq \f(y1+y2+…+yn,n)=eq \f(1,n)eq \(∑,\s\up6(n),\s\d4(i=1))yi为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数eq \(y,\s\up6(-))去估计总体平均数eq \(Y,\s\up6(-));
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
观看场数
0
1
2
3
4
5
6
7
观看人数占调查人数的百分比
8%
10%
20%
26%
m%
12%
6%
2%
月份
零售总额(亿元)
同比增长
环比增长
累计(亿元)
4
28178
-7.50%
6.53%
106758
5
31973
-2.80%
13.47%
138730
6
33526
-1.80%
4.86%
172256
7
32203
-1.10%
-3.95%
204459
8
33571
0.50%
4.25%
238029
9
35295
3.30%
5.14%
273324
10
38576
4.30%
9.30%
311901
11
39514
5.00%
2.43%
351415
12
40566
4.60%
2.66%
391981
专题55 随机抽样、统计图表(新高考专用)
目录
【知识梳理】2
【真题自测】4
【考点突破】11
【考点1】简单随机抽样11
【考点2】分层随机抽样及其应用14
【考点3】统计图表17
【分层检测】22
【基础篇】22
【能力篇】30
考试要求:
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法.3.理解统计图表的含义.
知识梳理
1.简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
2.总体平均数与样本平均数
3.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为eq \(x,\s\up6(-)),eq \(y,\s\up6(-)),样本平均数为eq \(w,\s\up6(-)),则eq \(w,\s\up6(-))=eq \f(M,M+N)eq \(x,\s\up6(-))+eq \f(N,M+N)eq \(y,\s\up6(-))=eq \f(m,m+n)eq \(x,\s\up6(-))+eq \f(n,m+n)eq \(y,\s\up6(-)).
我们可以用样本平均数eq \(w,\s\up6(-))估计总体平均数eq \(W,\s\up6(-)).
4.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频数分布直方图、频率分布直方图等.
(2)频率分布表、频率分布直方图的制作步骤及意义
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.分层随机抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
3.频率分布直方图中小长方形高=eq \f(频率,组距).
真题自测
一、单选题
1.(2024·全国·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
2.(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
3.(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年B.23年C.25年D.35年
4.(2022·全国·高考真题)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
5.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
二、多选题
6.(2023·全国·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
三、解答题
7.(2023·全国·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
8.(2023·全国·高考真题)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为;误诊率是将未患病者判定为阳性的概率,记为.假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率%时,求临界值c和误诊率;
(2)设函数,当时,求的解析式,并求在区间的最小值.
参考答案:
1.C
【分析】计算出前三段频数即可判断A;计算出低于1100kg的频数,再计算比例即可判断B;根据极差计算方法即可判断C;根据平均值计算公式即可判断D.
【详解】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误.
故选;C.
2.C
【分析】根据散点图的特点及经验回归方程可判断ABC选项,根据相关系数的定义可以判断D选项.
【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,
把代入可得,C选项正确;
由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是,D选项错误
故选:C
3.B
【分析】由频率分布直方图可得所求区间的频率,进而可以求得结果.
【详解】全球年平均气温在区间内的频率为,
则全球年平均气温在区间内的有年.
故选:B.
4.B
【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.
【详解】讲座前中位数为,所以错;
讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为,
讲座前问卷答题的正确率的极差为,所以错.
故选:B.
5.D
【分析】根据与的关系图可得正确的选项.
【详解】当,时,,此时二氧化碳处于固态,故A错误.
当,时,,此时二氧化碳处于液态,故B错误.
当,时,与4非常接近,故此时二氧化碳处于固态,对应的是非超临界状态,故C错误.
当,时,因, 故此时二氧化碳处于超临界状态,故D正确.
故选:D
6.BD
【分析】根据题意结合平均数、中位数、标准差以及极差的概念逐项分析判断.
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:因为是最小值,是最大值,
则的波动性不大于的波动性,即的标准差不大于的标准差,
例如:,则平均数,
标准差,
,则平均数,
标准差,
显然,即;故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
7.(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【分析】(1)直接利用平均数公式即可计算出,再得到所有的值,最后计算出方差即可;
(2)根据公式计算出的值,和比较大小即可.
【详解】(1),
,
,
的值分别为: ,
故
(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
8.(1),;
(2),最小值为.
【分析】(1)根据题意由第一个图可先求出,再根据第二个图求出的矩形面积即可解出;
(2)根据题意确定分段点,即可得出的解析式,再根据分段函数的最值求法即可解出.
【详解】(1)依题可知,左边图形第一个小矩形的面积为,所以,
所以,解得:,
.
(2)当时,
;
当时,
,
故,
所以在区间的最小值为.
考点突破
【考点1】简单随机抽样
一、单选题
1.(2022·黑龙江哈尔滨·三模)为了了解学生上网课期间作息情况,现从高三年级702人中随机抽取20人填写问卷调查,首先用简单随机抽样剔除2人,然后在剩余的700人中再用系统抽样的方法抽取20人,则( )
A.每个学生入选的概率都为B.每个学生人选的概率都为
C.每个学生人选的概率都为D.由于有剔除,学生入选的概率不全相等
2.(2024·福建泉州·模拟预测)从一个含有个个体的总体中抽取一容量为的样本,当选取抽签法、随机数法和分层随机抽样三种不同方法时,总体中每个个体被抽中的概率分别为,三者关系可能是( )
A.B.C.D.
二、多选题
3.(2024·广西南宁·模拟预测)给出下列命题,其中错误的命题为( )
A.若样本数据的方差为3,则数据的方差为6.
B.具有相关关系的两个变量x,y的相关系数为r,那么越接近于0,x,y之间的线性相关程度越高;
C.在一个列联表中,根据表中数据计算得到的观测值k,若k的值越大,则认为两个变量间有关的把握就越大;
D.甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
4.(2022·湖北·模拟预测)某地区公共部门为了调查本地区中学生的吸烟情况,对随机抽出的编号为1~1000的1000名学生进行了调查.调查中使用了两个问题,问题1:你的编号是否为奇数?问题2:你是否吸烟?被调查者从设计好的随机装置(内有除颜色外完全相同的白球50个,红球50个)中摸出一个小球(摸完放回):摸到白球则如实回答问题1,摸到红球则如实回答问题2,回答“是”的人在一张白纸上画一个“√”,回答“否”的人什么都不用做,由于问题的答案只有“是”和“否”,而且回答的是哪个问题也是别人不知道的,因此被调查者可以毫无顾忌的给出真实的答案.最后统计得出,这1000人中,共有265人回答“是”,则下列表述正确的是( )
A.估计被调查者中约有15人吸烟B.估计约有15人对问题2的回答为“是”
C.估计该地区约有3%的中学生吸烟D.估计该地区约有1.5%的中学生吸烟
三、填空题
5.(23-24高三上·上海·期中)现利用随机数表发从编号为的20支水笔中随机选取6支,选取方法是从下列随机数表第1行的第9个数字开始由左到右依次选取两个数字,则选出来的第6支水笔的编号为 .
6.(2022·新疆乌鲁木齐·模拟预测)我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约 石(结果四舍五入保留整数);
参考答案:
1.C
【分析】根据简单随机抽和系统抽样都是等可能抽样以及概率公式计算可得结果.
【详解】因为简单随机抽和系统抽样都是等可能抽样,所以每个学生入选的概率都相等,且入选的概率等于.
故选:C.
2.B
【分析】根据抽样的概念,每个个体被抽中的概率是均等的,进而即可选择答案.
【详解】因为在抽签法抽样、随机数法抽样和分层随机抽样中,每个个体被抽中的概率均为,
所以.
故选:B.
3.ABD
【分析】根据方差的性质可判断A;根据相关系数的性质可判断B;根据的性质可判断C;根据简单随机抽样每个个体被抽到的概率是等可能的可判断D。
【详解】若样本数据的方差为3,则数据的方差为,故A错误;
由相关系数的实际意义知越接近于1,x,y之间的线性相关程度越高,故B错误;
的观测值越大,则认为两个变量间有关的把握就越大,故C正确;
简单随机抽样中每个个体被抽到的概率是等可能的,概率等于,故D错误;
故选:ABD
4.BC
【分析】先求出回答问题2且回答的“是”的人数,从而估计出该地区中学生吸烟人数的百分比,即得解.
【详解】随机抽出的1000名学生中,回答第一个问题的概率是,其编号是奇数的概率也是,所以回答问题1且回答的“是”的学生人数为,
回答问题2且回答的“是”的人数为,
从而估计该地区中学生吸烟人数的百分比为,
估计被调查者中吸烟的人数为.
故选:BC.
5.18
【分析】根据随机数表法的读取规则,即可求解.
【详解】依次选出的编号为:
则选出来的第6支水笔的编号为18,
故答案为:.
6.
【分析】求出米内夹谷的比例,再乘以即可得解.
【详解】依题意可得米内夹谷的比例为,
所以这批米内有谷子石.
故答案为:.
反思提升:
1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.
2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
【考点2】分层随机抽样及其应用
一、单选题
1.(2024·江西鹰潭·一模)某单位为了解职工体重情况,采用分层随机抽样的方法从800名职工中抽取了一个容量为80的样本.其中,男性平均体重为64千克,方差为151;女性平均体重为56千克,方差为159,男女人数之比为,则单位职工体重的方差为( )
A.166B.167C.168D.169
2.(2024·云南·模拟预测)某学校高三年级男生共有个,女生共有个,为调查该年级学生的年龄情况,通过分层抽样,得到男生和女生样本数据的平均数和方差分别为和,已知,则该校高三年级全体学生年龄的方差为( )
A.B.
C.D.
二、多选题
3.(2024·江西宜春·模拟预测)某学校高三年级共有900人,其中男生500人,现采用按性别比例分配的分层抽样抽取了容量为90的样本. 经计算得男生的身高均值为170,方差为19,女生样本的身高均值为161,方差为19,则下列说法中正确的是( )
A.女生的样本容量为40
B.女生甲被抽到的概率为
C.估计该校高三年级学生身高的均值为166
D.估计该校高三年级学生身高的方差大于19
4.(2023·山西临汾·一模)某学生社团有男生32名,女生24名,从中随机抽取一个容量为7的样本,某次抽样结果为:抽到3名男生和4名女生,则下列说法正确的是( )
A.这次抽样可能采用的是抽签法
B.这次抽样不可能是按性别分层随机抽样
C.这次抽样中,每个男生被抽到的概率一定小于每个女生被抽到的概率
D.这次抽样中,每个男生被抽到的概率不可能等于每个女生被抽到的概率
三、填空题
5.(2024·山东泰安·模拟预测)某高中为了了解学生参加数学建模社团的情况,采用了分层随机抽样的方法从三个年级中抽取了300人进行问卷调查,其中高一、高二年级各抽取了90人.已知该校高三年级共有720名学生,则该校共有学生 人.
6.(2024·陕西安康·模拟预测)杭州亚运会期间,某社区有200人参加协助交通管理的志愿团队,为了解他们参加这项活动的感受,用按比例分配的分层抽样的方法随机抽取了一个容量为40的样本,若样本中女性有16人,则该志愿团队中的男性人数为 .
参考答案:
1.D
【分析】利用分层抽样的平均数和方差公式即可得解.
【详解】依题意,单位职工平均体重为,
则单位职工体重的方差为.
故选:D.
2.C
【分析】结合分层随机抽样的方差公式可得答案
【详解】学校高三年级男生共有个,所占比例为,女生个,所占比例为,
故该校高三年级全体学生的年龄方差为:,
当时,,,
故选:C
3.ACD
【分析】由题意先得抽样比例,进而得男生和女生的样本容量即可判断A、B,再根据分层随机抽样总样本均值公式和方差公式即可求解.
【详解】由题抽样比例为,故男生被抽到人数为人;女生被抽到人数为人,故A对;
所以女生甲被抽到的概率为,故B错;
由上以及题意得总样本均值为:;
总样本方差为:,故C、D对.
故选:ACD.
4.AB
【分析】根据抽样方法的概念求解即可.
【详解】根据抽样结果,此次抽样可能采用的是抽签法,A正确;
若按分层抽样,则抽得的男女人数应为4人,3人,
所以这次抽样不可能是按性别分层随机抽样,B正确;
若按抽签法,则每个男生被抽到的概率和每个女生被抽到的概率均相等,C,D错误.
故选:AB.
5.1800
【分析】根据按比例分配的分层随机抽样的特点确定抽样的比例即可求解.
【详解】由题意可知从三个年级中抽取的300人进行问卷调查,其中高三有120人,
所以抽取的比例为
设该校共有名学生,可得,
解得人,即该校共有1800名学生.
故答案为:1800.
6.
【分析】根据题意,结合分层抽样的概念和计算方法,即可求解.
【详解】根据题意,结合分层抽样的概念及运算,可得愿团队中的男性人数为.
故答案为:.
反思提升:
1.求某层应抽个体数量:按该层所占总体的比例计算.
2.已知某层个体数量,求总体数量或反之求解:根据分层随机抽样就是按比例抽样,列比例式进行计算.
3.在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为eq \f(mx+ny,m+n).
【考点3】统计图表
一、单选题
1.(2022·安徽马鞍山·模拟预测)下图为国家统计局给出的2016-2020年福利彩票销售额、增长率及筹集公益金情况统计图,则下列说法正确的是( )
A.2016-2020年福利彩票销售额呈递减趋势
B.2016-2020年福利彩票销售额的年增长率呈递减趋势
C.2016-2020年福利彩票销售额、筹集公益金均在2018年取得最大值
D.2017-2018年福利彩票销售额增长的最多
2.(2021·广西柳州·一模)空气质量的指标是反映空气质量状况的指数,指数的值越小,表明空气质量越好,指数不超过50,空气质量为优,指数大于50且不超过100,空气质量为良,指数大于100,空气质量为污染,如图是某市2020年空气质量指标的月折线图.下列关于该市2020年空气质量的叙述中不一定正确的是( )
A.全年的平均指数对应的空气质量等级为优或良.
B.每月都至少有一天空气质量为优.
C.空气质量为污染的天数最多的月份是2月份.
D.2月,8月,9月和12月均出现污染天气.
二、多选题
3.(2024·辽宁·二模)下图为某市2023年第一季度全市居民人均消费支出构成图.已知城镇居民人均消费支出7924元,与上一年同比增长4.4%;农村居民人均消费支出4388元,与上一年同比增长7.8%,则关于2023年第一季度该市居民人均消费支出,下列说法正确的是( )
A.2023年第一季度该市居民人均消费支出6393元
B.居住及食品烟酒两项的人均消费支出总和超过了总人均消费支出的50%
C.城乡居民人均消费支出的差额与上一年同比在缩小
D.医疗保健与教育文化娱乐两项人均消费支出总和约占总人均消费支出的20.6%
4.(2021·广东佛山·模拟预测)在“世界杯”足球赛闭幕后,某中学学生会对本校高三年级1000名学生收看比赛的情况用随机抽样方式进行调查,样本容量为50,将数据分组整理后,列表如下:
从表中可以得出正确的结论为( )
A.表中m的数值为16
B.估计全年级观看比赛低于4场的学生约为32人
C.估计全年级观看比赛不低于4场的学生约为360
D.估计全年级观看比赛场数的众数为2
三、填空题
5.(2024·河北石家庄·三模)为了解全市高三学生的体能素质情况,在全市高三学生中随机抽取了1000名学生进行体能测试,并将这1000名学生的体能测试成绩整理成如下频率分布直方图.则直方图中实数的值为 .
6.(2024·四川成都·模拟预测)某校为了解高三学生身体素质情况,从某项体育测试成绩中随机抽取个学生的成绩进行分析,得到成绩频率分布直方图(如图所示),估计该校高三学生此项体育成绩的中位数为 .(结果保留整数)
参考答案:
1.C
【分析】根据给定的条形图及折线图,逐项分析判断即可.
【详解】对于A,2016-2020年福利彩票销售额先递增后递减,A错误;
对于B,2016-2020年福利彩票销售额的年增长率先递增后递减,B错误;
对于C,2016-2020年福利彩票销售额、筹集公益金均在2018年取得最大值,C正确;
对于D,2017-2018年福利彩票销售额增长75.8亿元,2016-2017年福利彩票销售额增长104.9亿元,D错误.
故选:C
2.C
【分析】根据折线图的信息即可判断出答案.
【详解】对于A,由折线图知平均AQI指数值不超过100 所以A正确;
对于B,通过折线图知平均AQI指数均在50以下,说明至少有一天空气质量为优,所以B正确;
对于C,根据折线图2月份出现最大值,并不表示空气质量为“污染”的天数最多的月份是2月份,所以C错误;
对于D,2月,8月,9月和12月的最大值AQI指数有大于100,空气质量为“污染”,所以D正 确;
故选: C.
3.ABD
【分析】根据消费支出构成图及已知条件分析数据一一判定选项即可.
【详解】2023年第一季度全市居民人均消费支出为(元),故A正确;
易知居住及食品烟酒两项的人均消费支出总和为(元),
占总人均消费支出的,故B正确:
依题意可得2022年第一季度城乡居民人均消费支出的差额为(元),
2023年第一季度城乡居民人均消费支出的差额为(元),
由于,故C错误;
医疗保健与教育文化娱乐两项人均消费支出总和占总人均消费支出的,故D正确.
故选:ABD.
4.AC
【分析】由频率分布表的性质,求出;先由频率分布表求出观看比赛不低于4场的学生所占比率,由此估计观看比赛不低于4场的学生人数;根据频率分布表读出众数.
【详解】解:由频率分布表的性质,得:
,故正确;
观看比赛低于4场的学生所占比率为:,
估计观看比赛低于4场的学生约为:人,故错误,
观看比赛不低于4场的学生所占比率为:,
估计观看比赛不低于4场的学生约为:人,故正确,
出现频率最高的为3.故估计全年级观看比赛场数的众数为,故错误;
故选:.
5.
【分析】利用直方图直方块总面积为,进行运算解出即可.
【详解】由直方图可知:组距为,
所以,
解得.
故答案为:.
6.
【分析】由概率之和为计算出后,结合中位数的定义计算即可得.
【详解】,解得,
由,,
设中位数为,则,
有,解得.
故答案为:.
反思提升:
(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
(3)频率分布直方图的数据特点:
①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
分层检测
【基础篇】
一、单选题
1.(2024·云南贵州·二模)本次月考分答题卡的任务由高三16班完成,现从全班55位学生中利用下面的随机数表抽取10位同学参加,将这55位学生按01、02、、55进行编号,假设从随机数表第1行第2个数字开始由左向右依次选取两个数字,重复的跳过,读到行末则从下一行行首继续,则选出来的第6个号码所对应的学生编号为( )
0627 4313 2432 5327 0941 2512 6317 6323 2616 8045 6011
1410 9577 7424 6762 4281 1457 2042 5332 3732 2707 3607
0140 0523 2617 3726 3890 5124 5179 3014 2310 2118 2191
A.51B.25C.32D.12
2.(2024·河南驻马店·二模)电影《孤注一掷》的上映引发了电信诈骗问题的热议,也加大了各个社区反电信诈骗的宣传力度.已知某社区共有居民480人,其中老年人200人,中年人200人,青少年80人,若按年龄进行分层随机抽样,共抽取36人作为代表,则中年人比青少年多( )
A.6人B.9人C.12人D.18人
3.(2021·全国·模拟预测)在某次射击比赛中,甲、乙两人各射击5次,射中的环数如图,则下列说法正确的是( )
A.,B.,
C.,D.,
4.(2024·湖北黄冈·模拟预测)为了解高中学生每天的体育活动时间,某市教育部门随机抽取高中学生进行调查,把每天进行体育活动的时间按照时长(单位:分钟)分成组:,40,50,50,60,60,70,,.然后对统计数据整理得到如图所示的频率分布直方图,则可估计这名学生每天体育活动时间的第百分位数为( )
A.B.C.D.
二、多选题
5.(2021·江苏南京·三模)面对新冠肺炎疫情冲击,我国各地区各部门统筹疫情防控和经济社会发展均取得显著成效.下表显示的是年月份到月份中国社会消费品零售总额数据,其中同比增长率是指和去年同期相比较的增长率,环比增长率是指与上个月份相比较的增长率,则下列说法正确的是( )
中国社会消费品零售总额
A.年月份到月份,社会消费品零售总额逐月上升
B.年月份到月份,月份同比增长率最大
C.年月份到月份,月份环比增长率最大
D.第季度的月消费品零售总额相比第季度的月消费品零售总额,方差更小
6.(2024·浙江杭州·三模)南丁格尔是一位英国护士、统计学家及社会改革者,被誉为现代护理学的奠基人.1854年,在克里米亚战争期间,她在接到英国政府的请求后,带领由38名志愿女护士组成的团队前往克里米亚救治伤员,并收集士兵死亡原因数据绘制了如下“玫瑰图”.图中圆圈被划分为12个扇形,按顺时针方向代表一年中的各个月份.每个扇形的面积与该月的死亡人数成比例.扇形中的白色部分代表因疾病或其他原因导致的死亡,灰色部分代表因战争受伤导致的死亡.右侧图像为1854年4月至1855年3月的数据,左侧图像为1855年4月至1856年3月的数据.下列选项正确的为( )
A.由于疾病或其他原因而死的士兵远少于战场上因伤死亡的士兵
B.1854年4月至1855年3月,冬季(12月至来年2月)死亡人数相较其他季节显著增加
C.1855年12月之后,因疾病或其他原因导致的死亡人数总体上相较之前显著下降
D.此玫瑰图可以佐证,通过改善军队和医院的卫生状况,可以大幅度降低不必要的死亡
7.(2024·黑龙江·三模)在某市初三年级举行的一次体育考试中(满分100分),所有考生成绩均在[50,100]内,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五组,甲、乙两班考生的成绩占比如图所示,则下列说法错误的是( )
A.成绩在[70,80)的考生中,甲班人数多于乙班人数
B.甲班成绩在[80,90)内人数最多
C.乙班成绩在[70,80)内人数最多
D.甲班成绩的极差比乙班成绩的极差小
三、填空题
8.(2022·山西临汾·二模)现从某学校450名同学中用随机数表法随机抽取30人参加一项活动.将这450名同学编号为001,002,…,449,450,要求从下表第2行第5列的数字开始向右读,则第5个被抽到的编号为 .
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
9.(2023·湖南常德·模拟预测)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为0.5,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为1,则估计该地区中学生每天睡眠时间的方差为 .
10.(2023·广西河池·模拟预测)雅言传承文明,经典浸润人生,南宁市某校每年举办“品经诵典浴书香,提雅增韵享阅读”中华经典诵读大赛,比赛内容有三类:“诵读中国”、“诗教中国”、“笔墨中国”.已知高一、高二、高三报名人数分别为:100人、150人和250人.现采用分层抽样的方法,从三个年级中抽取25人组成校代表队参加市级比赛,则应该从高一年级学生中抽取的人数为 .
四、解答题
11.(2024·陕西渭南·模拟预测)某高中为配合爱国主义教育,开展国防科技知识竞赛,预赛后,将成绩最好的甲、乙两个班学生(每班都是40人)的得分情况做成如下的条形图(20道单项选择题,每题5分,满分100分).记甲、乙两班学生得分的平均数分别为,方差分别为,已求得
(1)分别求出甲、乙两班的学生得分为95分及以上的频率;
(2)试计算,并判断哪个班的学生的成绩波动更小.
12.(2024·陕西西安·模拟预测)某高科技公司组织大型招聘会,全部应聘人员的笔试成绩统计如图所示:
(1)求m的值,并估计全部应聘人员笔试成绩的中位数;
(2)该公司2020—2024年每年招聘的新员工人数逐年增加,且这五年招聘的新员工总人数为500,若用这五年的数据求出每年招聘的新员工人数y关于年份代码x(x=年份-2019)的线性回归方程为,请根据此回归模型预测该公司2026年招聘的新员工人数是否会超过250.
参考答案:
1.A
【分析】根据随机数表按照规则读数即可得解.
【详解】根据随机数表读取,分别抽到的编号为31,32,43,25,12,51,26,04,01,11,
所以选出来的第6个号码所对应的学生编号为51,
故选:A
2.B
【分析】根据题意可以计算出分层随机抽样的抽样比例,进而计算出中年人和青年人的人数,进而可以知道中年人比青少年多多少个.
【详解】设中年人抽取人,青少年抽取人,由分层随机抽样可知,
解得,故中年人比青少年多9人.
故选:B.
3.C
【分析】由图表进行数据分析,得到甲射击5次所得环数分别为:9,8,10,9,10;乙射击5次所得环数分别为:6,9, 9,8,10;利用平均数公式及方差公式计算即可.
【详解】由图可知,甲射击5次所得环数分别为:9,8,10,9,10;
乙射击5次所得环数分别为:6,9, 9,8,10;
故,
,
,
,
故选:C.
4.A
【分析】根据第百分位数的概念,知道它在第二组40,50里.运用概率之和为,构造方程,解出即可.
【详解】第百分位数设为,而,则所求百分位数在第二组,
则可列方程解得.
故选:A.
5.BCD
【分析】根据表格中数据可判断ABC选项的正误,根据表格中第季度的月消费品零售总额相比第季度的月消费品零售总额所分布的区间比较两个季度数据的集中性,可判断D选项的正误.
【详解】对于A选项,月份的零售总额比月份的少,A选项错误;
对于B选项,由表格中数据可知,年月份到月份,月份同比增长率最大,B选项正确;
对于C选项,由表格中数据可知,年月份到月份,月份环比增长率最大,C选项正确;
对于D选项,第季度的零售总额在内,而第季度的零售总额在内,前者数据更集中,方差更小,D选项正确.
故选:BCD.
6.BCD
【分析】根据每个扇形的面积与该月的死亡人数成比例,分析相应的面积大小或面积变化,就能判断出选项A、B、C的正确与否,随着38名志愿女护士的加入,分析未来一年“玫瑰图”每个扇形白色部分面积在逐步的变少,可以判断出因疾病或其他原因导致的死亡的士兵越来越少,是由于志愿女护士的加入,改善了军队和医院的卫生状况,从而降低了不必要的死亡,所以D选项是正确的.
【详解】对于A选项,1854年4月至1855年3月,因为每个扇形白色部分面积远大于灰色部分的面积,
根据每个扇形的面积与该月的死亡人数成比例,可以得出由于疾病或其他原因而死的士兵远大于战场上因伤死亡的士兵;错误;
对于B选项,从右侧图像可以看出,冬季(12月至来年2月)相应的扇形面积,大于其他季节时扇形的面积,表明在冬季死亡人数相较其他季节显著增加,正确;
对于C选项,从左侧图像可以看出,1855年12月之后,每个扇形白色部分的面积较大幅度的在减少,表明因疾病或其他原因导致的死亡人数总体上相较之前显著下降,正确;
对于D选项,随着38名志愿女护士的加入,分析未来一年“玫瑰图”每个扇形白色部分面积、在逐步的变少,可以判断出因疾病或其他原因导致的死亡的士兵越来越少,
因此,可以推断出随着志愿女护士的加入,改善了军队和医院的卫生状况,从而使得因疾病或其他原因导致的死亡的士兵越来越少,大幅度降低了不必要的死亡,正确,
故选:BCD.
7.ACD
【分析】根据折线统计图逐个分析判断即可.
【详解】对于A,由图知,每一组中的成绩占比都是以各自班级的总人数为基数的,
所以每一组中的甲班、乙班人数不能从所占的百分比来判断,故A错误;
对于BC,由图可知甲班成绩主要集中在[80,90),乙班成绩主要集中在[60,70),B正确,C错误;
对于D,由图可知甲班成绩的极差和乙班成绩的极差的大小无法确定,故D错误.
故选:ACD
8.447
【分析】根据随机数表法,依次抽取即可得解.
【详解】根据随机数表的读取方法,依次抽取到的编号分别为:175,331,068,047,447,…,
故第5个被抽到的编号为447,
故答案为:447.
9.
【分析】根据给定条件,求出该地区中学生每天睡眠时间的平均数,再利用分层抽样方差的计算方法求得结果.
【详解】该地区中学生每天睡眠时间的平均数为:
(小时),
该地区中学生每天睡眠时间的方差为:
.
故答案为:
10.5
【分析】根据分层抽样的性质运算求解.
【详解】根据题意可得:高一、高二、高三报名人数之比为,
故从高一年级学生中抽取的人数为.
故答案为:5.
11.(1)0.3,0.425;
(2),甲班学生的成绩波动更小.
【分析】(1)利用条形图计算频率即可;
(2)利用方差公式计算结合及方差的意义判定即可.
【详解】(1)甲班得分为95分及以上的学生有人,故频率为;
乙班得分为95分及以上的学生有人,故频率为
(2)因为,
所以方差
;
显然,所以,甲班学生的成绩波动更小.
12.(1),68
(2)预测该公司2026年招聘的新员工人数不超过250
【分析】(1)根据频率分布直方图中的数据直接进行计算;
(2)根据回归方程过点,先求出线性回归方程,再代入进行预测、比较即可.
【详解】(1)依题意,,
解得,
前两组的频率之和为,
前三组的频率之和为,
所以中位数在区间60,70内,
估计中位数为.
(2)依题意,,
把代入中,有,解得,
故线性回归方程为,
当时,,
故预测该公司2026年招聘的新员工人数不超过250.
【能力篇】
一、单选题
1.(22-23高三上·浙江杭州·期末)给出下列命题,其中不正确的命题为( )
①若样本数据的方差为3,则数据的方差为6;
②回归方程为时,变量x与y具有负的线性相关关系;
③随机变量X服从正态分布,则;
④甲同学所在的某校高三共有5003人,先剔除3人,再按简单随机抽样的方法抽取容量为200的一个样本,则甲被抽到的概率为.
A.①③④B.③④C.①②③D.①②③④
二、多选题
2.(2024·贵州黔东南·二模)某学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4000名学生(该校男女生人数之比为)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179.则下列说法正确的是参考公式:总体分为2层,各层抽取的样本量、样本平均数和样本方差分别为:,,,,,.记总的样本平均数为,样本方差为,则( )
参考公式:
A.抽取的样本里男生有60人
B.每一位学生被抽中的可能性为
C.估计该学校学生身高的平均值为170
D.估计该学校学生身高的方差为236
三、填空题
3.(2022·吉林·模拟预测)中国于2022年2月在北京成功地举办了第二十四届冬季奥林匹克运动会.共赴冰雪之约,共享冬奥机遇,“冰雪经济”逐渐升温,“带动三亿人参与冰雪运动”已从愿景变为现实,中国各地滑雪场的数量也由2015年的1255家增加到2021年的3100家.下面是2016年至2021年中国滑雪场新增数量和滑雪场类型统计图,下列说法中正确的序号是 .
①2021年中国滑雪场产业中大众娱乐型滑雪场占比最高
②2016年至2021年中国滑雪场数量逐年上升
③2016年至2021年中国滑雪场新增数量逐年增加
④2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多
四、解答题
4.(2024·陕西安康·模拟预测)首届中国航协航空大会的一个鲜明的特色是在各个展区中设置了多项互动体验活动,吸引了很多的中小学生,其中模拟飞行体验区是让这些中小学生戴上VR眼镜模拟从起飞到降落,大大激发了他们的兴趣爱好.现从某个有互动体验的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:分钟,时间取整数),将时间分成六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(每组数据以区间的中点值为代表)
(2)为对比展区是否有体验区对中小学生的吸引程度,某工作人员给出了一份该展区中没有体验区的参观时间的随机数据,经计算得到该组数据参观时长平均值为65分钟,方差为,试判断有体验区的参观时长均值比没有体验区的参观时长均值是否有显著提高?(如果,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验展区?请说明理由.
参考答案:
1.A
【分析】根据方差的性质可判断①;根据变量x,y的线性回归方程的系数,判断变量x,y是负相关关系可判断②;利用正态分布的对称性,计算求得结果可判断③;根据简单随机抽样概率均等,计算出每人被抽取的概率可判断④.
【详解】对于①,若,则,故①错误;
对于②,回归方程为,可知,则变量x与y具有负的线性相关关系,故②正确;
对于③,∵,∴,∴,
∴,∴,故③错误;
对于④,根据简单随机抽样概率均等可知,甲被抽到的概率为,故④错误.
故选:A.
2.ABD
【分析】根据分层抽样的公式,以及利用每层样本的平均数和方差公式,代入总体的均值和方差公式,即可判断选项.
【详解】对于项,抽取的样本里男生有人,所以A项正确;
对于B项,由题可知,每一位学生被抽中的可能性为,所以B项正确;
对于C项,估计该学校学生身高的平均值为,所以C项错误;
对于D,估计该学校学生身高的方差为,所以D项正确.
故选:ABD
3.①②④
【分析】根据柱状图和扇形图,分别判断选项.
【详解】由扇形统计图可知,2021年中国滑雪场产业中大众娱乐型滑雪场占比最高,故①正确;
由柱状图可知,2016年至2021年中国滑雪场数量逐年上升,故②正确;
由柱状图可知,2020年比2019年下降了,故③不正确;
由图可知,2021年业余玩家型滑雪场比2020年大众娱乐型滑雪场数量多,故④正确.
故答案为:①②④
4.(1)71,194
(2)有显著提高
(3)答案见解析
【分析】(1)根据频率分布直方图平均数和方差公式计算;
(2)应用公式计算判断即可;
(3)根据结果判断是否设置互动体验展区即可.
【详解】(1)由题得,
所以样本的方差为
(2)由题得,
所以,
所以有体验区的参观时长均值比没有体验区的参观时长均值有显著提高.
从(2)中可知展区应该设置互动体验展区,这样可以吸引更多的参观者进行观看与体验,使他们能更多地了解产品,并能更大程度地激发中小学生的兴趣爱好
名称
定义
总体均值
(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称eq \(Y,\s\up6(-))=eq \f(Y1+Y2+…+YN,N)=eq \f(1,N)eq \(∑,\s\up6(N),\s\d4(i=1))Yi为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式eq \(Y,\s\up6(-))=eq \f(1,N)eq \(∑,\s\up6(k),\s\d4(i=1))fiYi.
样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称eq \(y,\s\up6(-))=eq \f(y1+y2+…+yn,n)=eq \f(1,n)eq \(∑,\s\up6(n),\s\d4(i=1))yi为样本均值,又称样本平均数.
说明:(1)在简单随机抽样中,我们常用样本平均数eq \(y,\s\up6(-))去估计总体平均数eq \(Y,\s\up6(-));
(2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);
(3)一般情况下,样本量越大,估计越准确.
亩产量
[900,950)
[950,1000)
[1000,1050)
[1050,1100)
[1100,1150)
[1150,1200)
频数
6
12
18
30
24
10
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
题号
1
2
3
4
5
6
答案
C
C
B
B
D
BD
题号
1
2
3
4
答案
C
B
ABD
BC
题号
1
2
3
4
答案
D
C
ACD
AB
观看场数
0
1
2
3
4
5
6
7
观看人数占调查人数的百分比
8%
10%
20%
26%
m%
12%
6%
2%
题号
1
2
3
4
答案
C
C
ABD
AC
月份
零售总额(亿元)
同比增长
环比增长
累计(亿元)
4
28178
-7.50%
6.53%
106758
5
31973
-2.80%
13.47%
138730
6
33526
-1.80%
4.86%
172256
7
32203
-1.10%
-3.95%
204459
8
33571
0.50%
4.25%
238029
9
35295
3.30%
5.14%
273324
10
38576
4.30%
9.30%
311901
11
39514
5.00%
2.43%
351415
12
40566
4.60%
2.66%
391981
题号
1
2
3
4
5
6
7
答案
A
B
C
A
BCD
BCD
ACD
题号
1
2
答案
A
ABD
相关试卷
这是一份2025年高考数学一轮复习讲义专题55随机抽样、统计图表(原卷版+解析),共50页。
这是一份专题55 随机抽样、统计图表-2025年高考数学一轮复习讲义(知识梳理+真题自测+考点突破+分层检测)(新高考专用),文件包含专题55随机抽样统计图表-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用原卷版docx、专题55随机抽样统计图表-2025年高考数学一轮复习讲义知识梳理+真题自测+考点突破+分层检测新高考专用解析版docx等2份试卷配套教学资源,其中试卷共54页, 欢迎下载使用。
这是一份专题9.1 随机抽样、统计图表(举一反三)(新高考专用)(含答案) 2025年高考数学一轮复习专练(新高考专用),文件包含专题91随机抽样统计图表举一反三新高考专用教师版2025年高考数学一轮复习专练新高考专用docx、专题91随机抽样统计图表举一反三新高考专用学生版2025年高考数学一轮复习专练新高考专用docx等2份试卷配套教学资源,其中试卷共45页, 欢迎下载使用。
