2023高考数学艺体生一轮复习 专题27 统计的应用(原卷版)
展开专题27 统计的应用
【考点预测】
一、抽样方法
三种抽样方式的对比
类型 | 共同点 | 各自特点 | 相互关系 | 使用范围 |
简单随机抽样 | 抽样过程都是不放回抽样,每个个体被抽到的机会均等,总体容量N,样本容量n,每个个体被抽到的概率 | 从总体中随机逐个抽取 |
| 总体容量较小 |
系统抽样 | 总体均分几段,每段T个, 第一段取a1, 第二段取a1+T, 第三段取a1+2T, …… | 第一段简单随机抽样 | 总体中的个体个数较多 | |
分层抽样 | 将总体分成n层,每层按比例抽取 | 每层按简单随机抽样或系统抽样 | 总体由差异明显的几部分组成 |
二、样本分析
(1)样本平均值:。
(2)样本众数:样本数据中出现次数最多的那个数据。
(3)样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。
(4)样本方差:。
众数、中位数、平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动情况的特征数。
三、频率分布直方图的解读
(1)频率分布直方图的绘制
①由频率分布表求出每组频数ni;
②求出每组频率(n为样本容量);
③列出样本频率分布表;
④画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标为每组频率与组距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。
(2)样本估计总体
步骤:总体→抽取样本→频率分布表→频率分布直方图→估计总体频率分布。
样本容量越大,估计越精细,样本容量无限增大,频率分布直方图无限无限趋近概率分布密度曲线。
(3)用样本平均数估计总体平均数,用样本标准差估计总体标准差。
公式:,s2(aX+b)=a2s2(X)。
【典型例题】
例1.(2023春·浙江绍兴·高三统考开学考试)某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照分成9组,制成了如图所示的频率分布直方图.
由直方图可估计本校高三男生100米体能测试成绩小于13.5秒的人数为( )
A.47 B.54 C.67 D.94
例2.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
例3.(2023·全国·高三专题练习)要考察某公司生产的500克袋装牛奶的质量是否达标,现从500袋牛奶中抽取50袋进行检验,将它们编号为000,001,002,…499,利用随机数表抽取样本,从第8行第5列的数开始,按3位数依次向右读取,到行末后接着从下一行第一个数继续.则第四袋牛奶的标号是( )
(下面摘取了某随机数表的第7行至第9行)
A.358 B.301 C.071 D.206
例4.(2023秋·四川成都·高三成都七中校考阶段练习)年春节影市火爆依旧,《无名》、《满江红》、《交换人生》票房不断刷新,为了解我校高三名学生的观影情况,随机调查了名在校学生,其中看过《无名》或《满江红》的学生共有位,看过《满江红》的学生共有位,看过《满江红》且看过《无名》的学生共有位,则该校高三年级看过《无名》的学生人数的估计值为( )
A. B. C. D.
例5.(多选题)(2023秋·浙江湖州·高三安吉县高级中学校考期末)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则( )
A.骑车时间的中位数的估计值是22分钟
B.坐公交车时间的40%分位数的估计值是19分钟
C.坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值
D.坐公交车时间的方差的估计值小于骑车时间的方差的估计值
例6.(多选题)(2023·全国·高三专题练习)下列说法正确的是( )
A.用简单随机抽样的方法从含有50个个体的总体中抽取一个容量为5的样本,则个体m被抽到的概率是
B.已知一组数据1,2,m,6,7的平均数为4,则这组数据的方差是
C.数据13,27,24,12,14,30,15,17,19,23的第70百分位数是23
D.若样本数据的标准差为8,则数据的标准差为32
例7.(2023秋·北京·高三校考期末)在测试中,客观题难度的计算公式为,其中为第题的难度,为答对该题的人数,为参加测试的总人数.现对某校高三年级240名学生进行一次测试,共5道客观题.测试前根据对学生的了解,预估了每道题的难度,如下表所示:
题号 | 1 | 2 | 3 | 4 | 5 |
考前预估难度 | 0.9 | 0.8 | 0.7 | 0.6 | 0.4 |
测试后,随机抽取了20名学生的答题数据进行统计,结果如下:
题号 | 1 | 2 | 3 | 4 | 5 |
实测答对人数 | 16 | 16 | 14 | 14 | 4 |
(1)根据题中数据,估计这240名学生中第5题的实测答对人数;
(2)从抽样的20名学生中随机抽取2名学生,记这2名学生中第5题答对的人数为X,求X的分布列和数学期望;
(3)定义统计量,其中为第题的实测难度,为第题的预估难度.规定:若,则称该次测试的难度预估合理,否则为不合理.判断本次测试的难度预估是否合理.
例8.(2023秋·河南三门峡·高三统考期末)某果园新采摘了一批苹果,从中随机抽取50个作为样本,称出它们的重量(单位:克),将重量按照进行分组,得到频率分布直方图如图所示(同一组中的数据以该组区间的中点值为代表).
(1)估计这批苹果的重量的平均数;
(2)该果园准备把这批苹果销售给一家超市,据市场行情,有两种销售方案;
方案一:所有苹果混在一起,价格为2.5元/千克;
方案二:将不同重量的苹果分开,重量不小于160克的苹果的价格为3元/千克,重量小于160克的苹果的价格为2元/千克,但果园需支付每1000个苹果5元的分拣费.
分别估计并比较两种方案下果园销售10000个苹果的收入.
例9.(2023·高三课时练习)为倡导节能减排,某市计划制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,并绘制成如图所示的频率分布直方图.
(1)求直方图中的a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)估计居民月均用水量的中位数.
【技能提升训练】
一、单选题
1.(2023·全国·高三专题练习)“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是( )
A.通过调查获取数据 B.通过试验获取数据 C.通过观察获取数据 D.通过查询获得数据
2.(2023·全国·高三专题练习)在“世界读书日”前夕,为了了解某地名居民某天的阅读时间,从中抽取了名居民的阅读时间进行统计分析.在这个问题中,名居民的阅读时间的全体是
A.总体 B.个体
C.样本的容量 D.从总体中抽取的一个样本
3.(2023·全国·高三专题练习)某校要从高一、高二、高三共2 023名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 023名学生中剔除23名,再从剩下的2 000名学生中按分层随机抽样的方法抽取50名,则每名学生入选的可能性( )
A.都相等且为 B.都相等且为
C.不完全相等 D.均不相等
4.(2023·全国·高三专题练习)从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按,,…,进行编号,然后从随机数表第行的第列和第列数字开始从左往右依次选取两个数字,则选出的第个同学的编号为(注:表为随机数表的第行与第行)( )
A. B. C. D.
5.(2023·上海·高三专题练习)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本.
②从20件玩具中一次性抽取3件进行质量检验.
③某班有56个同学,指定个子最高的5名同学参加学校组织的篮球赛.
④盒子中共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.
A.0 B.1 C.2 D.3
6.(2023·辽宁·校联考模拟预测)为庆祝中国共产主义青年团成立100周年,某高中团委举办了共青团史知识竞赛(满分100分),其中高一、高二、高三年级参赛的共青团员的人数分别为800,600,600.现用分层抽样的方法从三个年级中抽取样本,经计算可得高一、高二年级共青团员成绩的样本平均数分别为85,90,全校共青团员成绩的样本平均数为88,则高三年级共青团员成绩的样本平均数为( )
A.87 B.89 C.90 D.91
7.(2023·陕西榆林·统考一模)为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
8.(2023秋·辽宁辽阳·高三统考期末)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是( )
A.55 B.57.25 C.58.75 D.60
9.(2023秋·浙江嘉兴·高三统考期末)在某校的“迎新年”歌咏比赛中,6位评委给某位参赛选手打分,6个分数的平均分为分,方差为,若去掉一个最高分分和一个最低分分,则剩下的4个分数满足( )
A.平均分分,方差 B.平均分分,方差
C.平均分分,方差 D.平均分分,方差
10.(2023秋·浙江杭州·高三期末)冬末春初,人们容易感冒发热,某公司规定:若任意连续7天,每天不超过5人体温高于,则称没有发生群体性发热.根据下列连续7天体温高于人数的统计量,能判定该公司没有发生群体性发热的为( )
①中位数是3,众数为2;②均值小于1,中位数为1;③均值为3,众数为4;④均值为2,标准差为.
A.①③ B.③④ C.②③ D.②④
11.(2023春·河南新乡·高三校联考开学考试)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )
A.800 B.600 C.700 D.750
12.(2023·广西桂林·统考模拟预测)有一组样本数据,,…,,由这组数据得到新的样本数据,,…,,其中(,2,…,n),且,则下列说法中错误的是( )
A.新样本数据的平均数是原样本数据平均数的c倍
B.新样本数据的上四分位数是原样本数据上四分位数的c倍
C.新样本数据的方差是原样本数据方差的c倍
D.新样本数据的极差是原样本数据极差的c倍
13.(2023·全国·模拟预测)已知一组数据:的平均数是4,方差是2,则由和11这四个数据组成的新数据组的方差是( )
A.27 B. C.12 D.11
14.(2023·全国·校联考模拟预测)已知某样本的容量为50,平均数为36,方差为48,现发现在收集这些数据时,其中的两个数据记录有误,一个错将24记录为34,另一个错将48记录为38.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则( )
A. B.
C. D.
15.(2023秋·河南驻马店·高三统考期末)为了让学生了解环保知识,增强环保意识,某班举行了一次环保知识有奖竞答活动,有名学生参加活动.已知这名学生得分的平均数为,方差为.若将当成一个学生的分数与原来的名学生的分数一起,算出这个分数的平均数为,方差为,则( )
A., B.,
C., D.,
二、多选题
16.(2023春·江西·高三校联考阶段练习)随着工业自动化和计算机技术的发展,中国机器人进入大量生产和实际应用阶段,下图为2022年中国服务机器人各行业渗透率调查情况.
根据该图,下列结论错误的是( )
A.物流仓储业是目前服务行业中服务机器人已应用占比最高的行业
B.教育业目前在大力筹备应用服务机器人
C.未计划使用服务机器人占比最高的是政务服务业
D.图中八大服务业中服务机器人已应用占比的中位数是33.3%
17.(2023春·山东济南·高三统考开学考试)居家学习期间,某学校发起了“畅读经典,欢度新年”活动,根据统计数据可知,该校共有1200名学生,所有学生每天读书时间均在20分钟到100分钟之间,他们的日阅读时间频率分布直方图如图所示.则下列结论正确的是( )
A.该校学生日阅读时间的众数约为70
B.该校学生日阅读时间不低于60分钟的人数约为360
C.该校学生日阅读时间的第50百分位数约为65
D.该校学生日阅读时间的平均数约为64
18.(2023秋·江苏泰州·高三统考期末)已知一组数据为:4,1,2,5,5,3,3,2,3,2,则( )
A.标准差为 B.众数为2和3
C.70分位数为 D.平均数为3
19.(2023春·广东揭阳·高三校考开学考试)有一组样本数据,其样本平均数为.现加入一个新数据,且,组成新的样本数据,与原样本数据相比,新的样本数据可能( )
A.平均数不变 B.众数不变
C.极差变小 D.第20百分位数变大
20.(2023春·安徽·高三校联考开学考试)某校为做好疫情防控,每天早中晩都要对学生进行体温检测.某班级体温检测员对一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第60百分位数为36.4℃
21.(2023春·全国·高三竞赛)某学习小组(共18位同学)在一次数学周测中的成绩(单位:分)如下:
87 101 109 112 115 116 118 119
119 121 122 126 127 129 130 135 142
若是这组数据的上四分位数,则可能为( )
A.126 B.127 C.128 D.129
三、填空题
22.(2023·全国·高三专题练习)我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约_____________石(结果四舍五入保留整数);
23.(2023·全国·高三专题练习)我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为________石(精确到小数点后一位数字)
24.(2023·全国·高三专题练习)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.
25.(2023秋·江西景德镇·高三统考阶段练习)嫦娥九号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第4列和第5列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为_______________.
45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 29
32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81
26.(2023秋·贵州铜仁·高三统考期末)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为42的样本,那么应抽取女运动员人数是____________.
27.(2023春·湖南长沙·高三长郡中学校考阶段练习)已知甲、乙两组按从小到大顺序排列的数据:
甲组:、、、、、;
乙组:、、、、、.
若这两组数据的第百分位数,第百分位数分别对应相等,则___________.
28.(2023春·江苏常州·高三校联考开学考试)数据的第25百分位数是__________.
29.(2023·甘肃兰州·校考一模)某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为_____;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1020小时,980小时,1030小时,估计这个企业所生产的该产品的平均使用寿命为______.
四、解答题
30.(2023春·四川泸州·高三四川省泸县第四中学校考开学考试)近几年,每到春寒交替的季节,北京地区的医院呼吸利都人满为患,致病的罪魅祸首就是“雾霜”,私家车排放的可吸人颗粒物PM10和PM2.5是首要污染源为此政府提出“公交优先就是公民优先”引导大家公交出行,但公交车的数量太多会造成资源的浪费,太少又难以满足乘客需求,为此,某市公交公司在某站台的60名候车乘客中进行随机抽样,共抽取10人进行调查反馈,所选乘客情况如下表所示:
组别 | 候车时间(单位:) | 人数 |
一 | 1 | |
二 | 5 | |
三 | 3 | |
四 | 1 |
(1)估计这60名乘客中候车时间少于10分钟的人数;
(2)现从这10人中随机取2人,求恰有一人来自第二组的概率.
31.(2023·全国·高三专题练习)自2020年初以来,由于新冠疫情的冲击,人们日常购物的方式发生了较大的变化,各种便民的团购群异常活跃,据某微信公众号消息,参团进行团购已逐渐成为一大常规的购物形式,因此外卖员的收入明显提高.为调查某市外卖员的收入,现随机抽取500名外卖员,按照他们投送的距离分类统计得到如图所示的频率分布直方图.将上述调查所得到的频率视为概率.
(1)估计该市外卖员的平均运送距离;
(2)假设外卖平台给外卖员的运送距离与外卖员的收入有关,其中甲平台规定:1000米以内每份2元,1000米至3000米每份5元,3000米以上每份13元.乙平台规定:2000米以内每份3元,2000米至3000米每份6元,3000米至4000米每份12元,4000米以上每份18元,若你暑期打工去送外卖,每天能送50份,并且只考虑每天的平均收入,你会选择哪一家平台?为什么?
32.(2023·青海海东·统考一模)网购是目前很流行也很实用的购物方式.某购物网站的销售商为了提升顾客购物的满意度,随机抽取100名顾客进行问卷调查,根据顾客对该购物网站评分的分数(满分:100分),按分成5组,得到的频率分布直方图如图所示.
(1)估计顾客对该购物网站的评分的中位数(结果保留整数);
(2)若采用分层抽样的方法从对该购物网站的评分在和内的顾客中抽取6人,再从这6人中随机抽取2人,求抽取的2人中恰有1人对该购物网站的评分在内的概率.
33.(2023·上海·高三专题练习)为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请根据尚未完成的频率分布表和频数分布直方图,解答下列问题.
分组 | 频数 | 频率 |
4 | 0.08 | |
| 0.16 | |
| 0.20 | |
16 |
| |
|
| |
合计 | 50 | 1.00 |
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5分的学生获得二等奖,问获得二等奖的学生约为多少人?
34.(2023·全国·高三专题练习)鱼卷是泉州十大名小吃之一,不但本地人喜欢,还深受外来游客的赞赏.小张从事鱼卷生产和批发多年,有着不少来自零售商和酒店的客户.当地的习俗是农历正月没有生产鱼卷,客户正月所需要的鱼卷都会在农历十二月底进行一次性采购.小张把去年年底采购鱼卷的数量x(单位:箱)在[100,200)的客户称为“熟客”,并把他们去年采购的数量绘制成如表:
采购数x(单位:箱) | [100,120) | [120,140) | [140,160) | [160,180) | [180,200) |
客户数 | 10 | 10 | 5 | 20 | 5 |
(1)根据表中的数据,在答题卡上补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的“熟客”人数;
(2)若去年年底“熟客”们采购的鱼卷数量占小张去年年底总的销售量的,估算小张去年年底总的销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于鱼卷受到游客们的青睐,小张做了一份市场调查,决定今年年底是否在网上出售鱼卷,若没有在网上出售鱼卷,则按去年的价格出售,每箱利润为20元,预计销售量与去年持平;若计划在网上出售鱼卷,则需把每箱售价下调2至5元,且每下调m元()销售量可增加1000m箱,求小张在今年年底收入Y(单位:元)的最大值.
35.(2023·上海·高三专题练习)为进一步增强疫情防控期间群众的防控意识,使广大群众充分了解新冠肺炎疫情防护知识,提高预防能力,做到科学防护,科学预防.某组织通过网络进行新冠肺炎疫情防控科普知识问答.共有100人参加了这次问答,将他们的成绩(满分100分)分成,,,,,这六组,制成如图所示的频率分布直方图.
(1)求图中a的值,并估计这100人问答成绩的中位数和平均数;(同一组数据用该组数据的中点值代替)
(2)用分层随机抽样的方法从问答成绩在内的人中抽取一个容量为5的样本,再从样本中任意抽取2人,求这2人的问答成绩均在内的概率.
36.(2023·广西梧州·统考一模)某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,,.
(1)求图中的值和学生成绩的中位数;
(2)从成绩低于60分的学生中随机选取2人,该2人中成绩在50分以下的人数记为,求的分布列与数学期望.
备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(解析版): 这是一份备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(解析版),共30页。
备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(原卷版): 这是一份备战2024高考数学艺体生一轮复习40天突破90分讲义word版专题27 统计的应用(原卷版),共18页。
2023高考数学艺体生一轮复习 专题28 统计案例和回归方程(原卷版): 这是一份2023高考数学艺体生一轮复习 专题28 统计案例和回归方程(原卷版),共27页。