新高考数学大一轮复习讲义之方法技巧专题51统计(原卷版+解析)
展开知识点一、抽样
1、抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.
2、简单随机抽样
(1)定义
一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
3、分层抽样
(1)定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点二、用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①eq \f(频率,组距)×组距=频率.
②eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
3、百分位数
(1)定义
一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数
我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
4、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
5、标准差和方差
(1)定义
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(2)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(3)平均数、方差的性质
如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是.
②一组新数据的平均数为,方差是.
③一组新数据的平均数为,方差是.
【题型归纳目录】
题型一:随机抽样、分层抽样
题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
题型三:百分位数
题型四:样本的数字特征
【典例例题】
题型一:随机抽样、分层抽样
例1.(2023·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.623B.328C.253D.007
例2.(2023·全国·高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )
A.总体是36个篮球B.样本是4个篮球
C.样本容量是4D.每个篮球被抽到的可能性不同
例3.(2023·上海宝山·高三阶段练习)某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,则此样本中女生人数为( )
A.40B.36C.34D.32
变式1.(2023·江西·赣源中学高三阶段练习(文))年月日,搭载问天实验舱的长征五号遥三运载火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生人,高二学生人,高三学生人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取人填写问卷调查,则高三年级有多少人被抽中( )
A.16B.18C.20D.24
变式2.(2023·四川省内江市第六中学模拟预测(理))某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是( )
A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大
B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人
C.采用分层抽样比简单随机抽样更合理
D.该问题中的样本容量为100
变式3.(2023·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )
A.58份B.50份C.32份D.19份
变式4.(2023·全国·高三专题练习)利用简单随机抽样的方法,从个个体中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为___________.
变式5.(2023·重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门、部门、部门分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门抽检人数为______.
变式6.(2023·全国·高三专题练习)某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:
(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?
(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取的4个人的编号.(下面摘取了随机数表第7行至第9行)
8442 1753 3157 2455 0688 7704 7447 6721 7633 5026 8392
6301 5316 5916 9275 3816 5821 7071 7512 8673 5807 4439
1326 3321 1342 7864 1607 8252 0744 3815 0324 4299 7931
【方法技巧与总结】
不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
例4.(2023·辽宁朝阳·高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了名学生,他们的身高都在,,,,五个层次内,分男、女生统计得到以下样本分布统计图,则( )
A.样本中层次的女生比相应层次的男生人数多
B.估计样本中男生身高的中位数比女生身高的中位数大
C.层次的女生和层次的男生在整个样本中频率相等
D.样本中层次的学生数和层次的学生数一样多
例5.(2023·黑龙江·佳木斯一中三模(理))如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是( )
A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关
例6.(2023·湖北孝感·高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则( )
备注:同比增长率=,环比增长率=,
A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
变式7.(2023·山西大附中高三阶段练习(文))小王于2015年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还货方式,且截止2019年底,他没有再购买第二套房子.下图是2016年和2019年家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的是( )
A.小王一家2019年用于饮食支出费用与2016年相同
B.小王一家2019年用于其他方面的支出费用是2016年的3倍
C.小王一家2019年的家庭收入比2016年增加了一倍
D.小王一家2019年的房贷支出比2016年减少了
变式8.(2023·全国·高三专题练习)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
变式9.(2023·全国·高三专题练习)法国著名的数学家笛卡尔曾经说过:“阅读优秀的书籍,就是和过去时代中最杰出的人们(书籍的作者)一一进行交谈,也就是和他们传播的优秀思想进行交流,阅读会让精神世界闪光”.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示:
(1)求a;
(2)根据频率分布直方图,估计该地年轻人每天阅读时间的中位数(精确到0.1)(单位:分钟);
(3)为了进一步了解年轻人的阅读方式,研究机构采用分层抽样的方法从每天阅读时间位于分组,和的年轻人中抽取5人,再从中任选3人进行调查,求其中恰好有2人每天阅读时间位于的概率.
变式10.(2023·贵州遵义·三模(理))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.
(1)请根据频率分布折线图,画出频率分布直方图,并根据频率分布直方图估计该班级的平均分;
(2)经相关部门统计,高考分数以上的考生获得高校T“强基计划”入围资格,并制作高校T录取政策和考生录取预测统计表(如表所示).第一轮笔试有2科,学生通过考试获得相应等级的事件相互独立且概率相同.
若该班级考分前10名都已经报考了高校T的“强基计划”,且恰有2人成绩高于690分.求:
①总分高于690分的某位同学没有进入第二轮的概率;
②该班恰有两名同学通过“强基计划”被高校T录取的概率.
变式11.(2023·全国·高三专题练习(理))山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:
(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;
(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.
变式12.(2023·河南·温县第一高级中学高三阶段练习(文))随着新冠肺炎疫情的稳定,各地的经济均呈现缓慢的恢复趋势,为了更进一步做好疫情的防控工作,避免疫情的再度爆发,A地区规定居民出行或者出席公共场合均需佩戴口罩,现将A地区20000个居民一周的口罩使用个数统计如下表所示,其中每周的口罩使用个数在6以上(含6)的有14000人.
(1)求m,n的值;
(2)根据表中数据,完善上面的频率分布直方图;
(3)计算A地区居民一周口罩使用个数的平均数以及方差.
变式13.(2023·全国·高三专题练习)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:
(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由.
(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?
【方法技巧与总结】
(1)利用频率分布直方图求频率、频数;
(2)利用频率分布直方图估计总体.
(3)频率分布直方图的纵坐标是,而不是频率.
题型三:百分位数
例7.(2023·广东·高三阶段练习)为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则( )
A.58或64B.59或64C.58D.59
例8.(2023·湖南·长沙一中高三阶段练习)一学习小组10名学生的某次数学测试成绩的名次由小到大分别是2,4,5,,11,14,15,39,41,50,已知该小组数学测试成绩名次的40%分位数是9.5,则的值是( )
A.6B.7C.8D.9
例9.(2023·湖南岳阳·高三阶段练习)中国青年志愿者协会成立于1994年12月5日,此后广大志愿者、志愿服务组织不断蓬勃发展,目前高校青年志愿者组织就有132个.为了解某大学学生参加志愿者工作的情况,随机抽取某高校志愿者协会的40名成员,就他们2022年第2季度参加志愿服务的次数进行了统计,数据如表所示.则这40名学生本季度参加志愿活动的第40百分数位为( )
A.9B.8C.8.5D.9.5
变式14.(2023·江苏南通·高三开学考试)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:
则这50名学生的借书数量的上四分位数(第75百分位数)是( )
A.8B.8.5C.9D.10
变式15.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
则该单位党员一周学习党史时间的众数及第50百分位数分别是( )
A.8,8.5B.8,8C.9,8D.8,9
变式16.(2023·福建省漳州第一中学模拟预测)树人中学举办以“喜迎二十大、永远跟党走、奋进新征程”为主题的演讲比赛,其中9人比赛的成绩为:85,86,88,88,89,90,92,94,98(单位:分),则这9人成绩的第80百分位数是___________.
变式17.(2023·全国·高三专题练习)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)
【方法技巧与总结】
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
题型四:样本的数字特征
例10.(2023·全国·高三专题练习)上海入夏的标准为:立夏之后,连续五天日平均气温不低于.立夏之后,测得连续五天的平均气温数据满足如下条件,其中能断定上海入夏的是( )
A.总体均值为,中位数为
B.总体均值为,总体方差大于
C.总体中位数为,众数为
D.总体均值为,总体方差为
例11.(2023·全国·高三专题练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
例12.(2023·重庆南开中学高三阶段练习)橙子辅导中学的高一、二、三这三个年级学生的平均身高分别为,若按年级采用分层抽样的方法抽取了一个600人的样本,抽到高一、高二、高三的学生人数分别为100、200、300,则估计该高中学生的平均身高为( )
A.B.C.D.
变式18.(2023·广东佛山·高三阶段练习)已知一组数据的平均数是3,方差是2,则由这5个数据组成的新的一组数据的方差是( )
A.4B.6C.D.
变式19.(2023·全国·高三阶段练习(理))某组样本数据的平方和,平均数,则该组数据的方差( )
A.1B.C.2D.
变式20.(多选题)(2023·福建·高三阶段练习)某环保局对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若连续10天,每天空气质量指数(单位:)不超过100,则认为该地区环境治理达标,否则认为该地区环境治理不达标.根据连续10天检查所得数据的数字特征推断,环境治理一定达标的地区是( )
A.甲地区:平均数为80,方差为40B.乙地区:平均数为50,众数为40
C.丙地区:中位数为50,极差为60D.丁地区:极差为10,80%分位数为90
变式21.(多选题)(2023·广东·仲元中学高三阶段练习)已知一组样本数据,其中,由这组数据得到另一组新的样本数据,,…,,其中,则( ).
A.两组样本数据的样本平均数相同
B.两组样本数据的样本方差相同
C.,,…,样本数据的第30百分位数为
D.将两组数据合成一个样本容量为30的新的样本数据,该样本数据的平均数为5
变式22.(2023·陕西·安康市教学研究室三模(理))从1,2,3,4,5,6中任取4个不同的数,则这4个数的中位数是3的概率为____________.
变式23.(2023·上海市进才中学高三阶段练习)已知等差数列的公差为3,则、、、…、这11个数据的方差______.
变式24.(2023·江苏·南京师大附中高三阶段练习)有一组样本数据,该样本的平均数和方差均为.在该组数据中加入一个数,得到新的样本数据,则新样本数据的方差为__________.
变式25.(2023·全国·高三专题练习)已知一组数的方差是4,则的标准差是__.
【方法技巧与总结】
(1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方.
【过关测试】
一、单选题
1.(2023·福建省福州延安中学高三开学考试)为检查某校学生心理健康情况,市教委从该校名学生中随机抽查名学生,检查他们心理健康程度,则下列说法正确的是( )
A.名学生的心理健康情况是总体B.每个学生是个体
C.名学生是总体的一个样本D.名学生为样本容量
2.(2023·山东·汶上县第一中学高三开学考试)某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为( )
A.8.25B.8.45C.8.65D.8.85
3.(2023·黑龙江·佳木斯一中三模(文))新冠肺炎疫情防控中,测量体温是最简便、最快捷,也是筛查成本比较低、性价比很高的筛查方式,是更适用于大众的普通筛查手段.某班级体温检测员对某一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论不正确的是( )
A.甲同学的体温的极差为0.5℃
B.甲同学的体温的众数为36.3℃
C.乙同学的体温的中位数与平均数不相等
D.乙同学的体温比甲同学的体温稳定
4.(2023·河北邯郸·高三开学考试)某高中2022年的高考考生人数是2021年高考考生人数的倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2022年与2021年的本科达线人数比为6:5
B.该校2022年与2021年的专科达线人数比为6:7
C.2022年该校本科达线人数增加了80%
D.2022年该校不上线的人数有所减少
5.(2023·安徽·高三开学考试)某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最少
B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
C.估计该小区居民在该滑冰馆的锻炼天数的平均值大于14
D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.456
6.(2023·广西·模拟预测(文))2022年6月6日是第27个“全国爱眼日”,为普及科学用眼知识,提高群众健康水平,预防眼疾,某区残联在残疾人综合服务中心开展“全国爱眼日”有奖答题竞赛活动.已知5位评委老师按百分制(只打整数分)分别给出某参赛小队评分,可以判断出一定有评委打满分的是( )
A.平均数为98,中位数为98B.中位数为96,众数为99
C.中位数为97,极差为9D.平均数为98,极差为6
7.(2023·四川·树德中学高三阶段练习(理))比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述错误的是( )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.乙的直观想象能力指标值优于甲的数学建模能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
8.(2023·河南·高三阶段练习(理))已知甲、乙两班各50人,下表为某次数学考试的成绩情况:
各分数段成绩视为均匀分布,有以下结论:①甲班平均成绩低于乙班;②甲班成绩的中位数与乙班相同;③甲班成绩的方差比乙班成绩的方差小.其中正确的序号是( )A.①B.①③C.②③D.①②③
二、多选题
9.(2023·广东广州·高三阶段练习)某校为了解高中学生的身高情况,根据男、女学生所占的比例,采用样本量按比例分配的分层随机抽样分别抽取了男生50名和女生30名,测量他们的身高所得数据(单位:)如下:
根据以上数据,可计算出该校高中学生身高的总样本平均数与总样本方差分别是( )A.B.
C.D.
10.(2023·全国·模拟预测)最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第60百分位数为36.4℃
11.(2023·广东·开平市忠源纪念中学高三阶段练习)某中学组织三个年级的学生进行禁毒知识竞赛.经统计,得到成绩排在前200名学生分布的饼状图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是( )
A.成绩排在前200名的200人中,高二人数比高三人数多10
B.成绩排在第名的50人中,高一人数比高二的多
C.成绩排在第名的100人中,高三人数占比可能超过
D.成绩排在第名的50人中,高二人数肯定多于23
12.(2023·广东茂名·高三阶段练习)下面是某省2016年至2021年乒乓球训练馆新增数量图和乒乓球训练馆类型统计表,则下列说法正确的是( )
A.2021年该省乒乓球训练馆产业中C类型乒乓球训练馆占比量最高
B.2016年至2021年该省乒乓球训练馆数量逐年上升
C.2016年至2021年该省乒乓球训练馆新增数量逐年增加
D.2021年B类型乒乓球训练馆比2020年B类型乒乓球训练馆数量多
三、填空题
13.(2023·全国·高三专题练习)已知四个数1,2,4,a的平均数为4,则这四个数的中位数是 __.
14.(2023·广东广州·高三阶段练习)请写出一组由6个不同的自然数从小到大排列的数据,这组数据要满足以下两个条件:①第70百分位数为6,②极差为6.______.
15.(2023·四川·高三开学考试(理))四川省将于2022年秋季启动实施新高考综合改革,某校开展“新高考”动员大会,参会的有100名教师,1500名学生,1000名家长,为了解大家对推行“新高考”的认可程度,现采用分层抽样调查,抽取了一个容量为n的样本,其中教师与家长共抽取了55名,则n=______.
16.(2023·云南·高三阶段练习)某市某次高中数学统测学生测试成绩频率分布直方图如图所示.现按测试成绩由高到低分成A,B,C,D四个等级,其中等占等占等占等占的比例,规定达到等级及以上才能通过考试,则要通过本次考试的学生分数至少为___________.
四、解答题
17.(2023·全国·高三阶段练习(理))某企业在举行的安全知识竞答活动中,随机抽取了50名员工,统计了他们的成绩,全部介于70到95之间,将成绩按如下方式分成五组:第一组,第二组,第五组,如图是按上述分组方法得到的频率分布直方图
(1)请根据频率分布直方图,求样本数据的平均数和中位数(所有结果均保留两位小数);
(2)从第一组和第五组的员工中,随机抽取4名员工,记这4名员工中来自第五组的员工的人数为,求随机变量的分布列及数学期望.
18.(2023·陕西·安康市教学研究室三模(理))某学校为了解高三尖子班数学成绩,随机抽查了60名尖子生的期中数学成绩,得到如下数据统计表:
若数学成绩超过135分的学生为“特别优秀”,超过120分而不超过135分的学生为“优秀”,已知数学成绩“优秀”的学生与“特别优秀”的学生人数比恰好为.
(1)求x,y,p,q的值;
(2)学校教务为进一步了解这60名学生的学习方法,从数学成绩“优秀”、“特别优秀”的学生中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查.设X为抽取的3人中数学成绩“优秀”的人数,求X的分布列和数学期望.
19.(2023·陕西·咸阳市高新一中高三开学考试(文))在实施“乡村振兴”的进程中,某地政府引领广大农户发展特色农业,种植优良品种柑橘.现在实验基地中种植了相同数量的、两种柑橘.为了比较、两个柑橘品种的优劣,在柑橘成熟后随机选取、两种柑橘各株,并根据株产量(单位:)绘制了如图所示的频率分布直方图(数据分组为:、、、、、):
(1)求、的值;
(2)将频率当做概率,在所有柑橘中随机抽取一株,求其株产量不低于的概率;
(3)求两种柑橘株产量平均数的估计值(同一组数据中的平均数用该组区间的中点值代表),并从产量角度分析,哪个品种的柑橘更好?说明理由.
20.(2023·新疆·新和县实验中学高三阶段练习(理))教育部门去年出台了“双减”政策.即有效减轻义务教育阶段学生过重作业负担和校外培训负担,持续规范校外培训(包括线上培训和线下培训).“双减"政策的出合对校外的培训机构经济效益产生了严重影响.某大型校外培训机构为了规避风险,寻求发展制定科学方案,工作人员对2021年前200名报名学员的消费金额进行了统计整理,其中数据如表.
(1)结合题中给出数据,估计2021年前200名报名学员消费的平均数x(同一区间的花费用区间的中点值替代).
(2)该大型校外培训机构转型方案之一是将文化科主阵地辅导培训向音体美等兴趣爱好培训转移,为了深入了解当前学生的兴趣爱好,工作人员利用分层抽样的方法在消费金额为和的学员中抽取了5人,再从这5人中选取3人进行有奖问卷调查,求抽取的3人中消费金额为的人数的分布列和数学期望.
甲校
乙校
丙校
男生
97
90
x
女生
153
160
y
高考分数
第一轮笔试
学科测试等级
A
B
C
A
B
C
学生通过考试获得相应等级概率
第二轮面试
入围条件
至少有1科,且2科均不低于B
录取条件
全
在第一轮笔试中2科均获得
通过第二轮面试
考生通过概率为
考生通过概率为
采购数x(单位:箱)
客户数
5
10
15
15
5
口罩使用数量
频率
0.2
m
0.3
n
0.1
次数
7
8
9
10
11
人数
6
10
9
8
7
借书数量(单位:本)
5
6
7
8
9
10
频数(单位:人)
5
8
13
11
9
4
党史学习时间(小时)
7
8
9
10
11
党员人数
6
10
9
7
8
分数
段
甲班
人数
1
3
9
16
10
7
4
乙班
人数
3
2
5
14
11
8
7
性别
人数
平均数
方差
男生
50
172
18
女生
30
164
30
2020—2021年乒乓球训练馆类型统计表
类型
2020年
2021年
A类型
24%
21%
B类型
36%
38%
C类型
40%
41%
期中数学成绩(单位:分)
频数
频率
3
0.05
x
p
9
0.15
15
0.25
18
0.30
y
q
合计
60
1.00
消费金额(千元)
人数
30
50
60
20
30
10
专题51 统计
【考点预测】
知识点一、抽样
1、抽样调查
(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.
(2)个体:构成总体的每一个元素叫做个体.
(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.
2、简单随机抽样
(1)定义
一般地,设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本(),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)两种常用的简单随机抽样方法
①抽签法:一般地,抽签法就是把总体中的个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取次,就得到一个容量为的样本.
②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字,,,…,组成,并且每个数字在表中各个位置出现的机会都是一样的.
注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.
(3)抽签法与随机数法的适用情况
抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.
(4)简单随机抽样的特征
①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.
②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.
③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.
④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.
只有四个特点都满足的抽样才是简单随机抽样.
3、分层抽样
(1)定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
分层抽样适用于已知总体是由差异明显的几部分组成的.
(2)分层抽样问题类型及解题思路
①求某层应抽个体数量:按该层所占总体的比例计算.
②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”
注意:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取()个个体(其中是层数,是抽取的样本容量,是第层中个体的个数,是总体容量).
知识点二、用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①eq \f(频率,组距)×组距=频率.
②eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于 .
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
3、百分位数
(1)定义
一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
(3)四分位数
我们之前学过的中位数,相当于是第百分位数.在实际应用中,除了中位数外,常用的分位数还有第百分位数,第百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
4、样本的数字特征
(1)众数、中位数、平均数
①众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.
②中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平.
③平均数:个样本数据的平均数为,反应一组数据的平均水平,公式变形:.
5、标准差和方差
(1)定义
①标准差:标准差是样本数据到平均数的一种平均距离,一般用表示.假设样本数据是,表示这组数据的平均数,则标准差.
②方差:方差就是标准差的平方,即.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差.
(2)数据特征
标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小.
(3)平均数、方差的性质
如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是.
②一组新数据的平均数为,方差是.
③一组新数据的平均数为,方差是.
【题型归纳目录】
题型一:随机抽样、分层抽样
题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
题型三:百分位数
题型四:样本的数字特征
【典例例题】
题型一:随机抽样、分层抽样
例1.(2023·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.623B.328C.253D.007
答案:A
【解析】从第5行第6列开始向又读取数据,
第一个数为253,第二个数是313,第三个数是457,
下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个是623.
故选:A.
例2.(2023·全国·高三专题练习)有甲、乙两箱篮球,其中甲箱27个,乙箱9个,现从这两箱篮球中随机抽取4个,甲箱抽3个,乙箱抽1个.下列说法不正确的是( )
A.总体是36个篮球B.样本是4个篮球
C.样本容量是4D.每个篮球被抽到的可能性不同
答案:D
【解析】依题意,总体是36个篮球,样本是4个篮球,样本容量是4,选项A,B,C都正确;
甲箱抽3个,每个球被抽到的概率为,乙箱抽1个,每个球被抽到的概率为,则每个篮球被抽到的可能性相同,D不正确.
故选:D
例3.(2023·上海宝山·高三阶段练习)某个年级有男生180人,女生160人,用分层抽样的方法从该年级全体学生中抽取一个容量为68的样本,则此样本中女生人数为( )
A.40B.36C.34D.32
答案:D
【解析】由题意得:样本中女生人数为.
故选:D
变式1.(2023·江西·赣源中学高三阶段练习(文))年月日,搭载问天实验舱的长征五号遥三运载火箭,在我国文昌航天发射场成功发射,我国的航天事业又上了一个新的台阶.某校现有高一学生人,高二学生人,高三学生人,为了调查该校学生对我国航天事业的了解程度,现从三个年级中采用分层抽样的方式抽取人填写问卷调查,则高三年级有多少人被抽中( )
A.16B.18C.20D.24
答案:D
【解析】由分层抽样原则可知:高三年级应抽取人.
故选:D.
变式2.(2023·四川省内江市第六中学模拟预测(理))某高中为了了解本校学生考入大学一年后的学习情况,对本校上一年考入大学的同学进行了调查,根据学生所属的专业类型,制成饼图,现从这些同学中抽出100人进行进一步调查,已知张三为理学专业,李四为工学专业,则下列说法不正确的是( )
A.若按专业类型进行分层抽样,则张三被抽到的可能性比李四大
B.若按专业类型进行分层抽样,则理学专业和工学专业应抽取30人和20人
C.采用分层抽样比简单随机抽样更合理
D.该问题中的样本容量为100
答案:A
【解析】对于选项A,张三与李四被抽到的可能性一样大,故A错误;
对于选项B,理学专业应抽取的人数为,
工学专业应抽取的人数为,故B正确;
对于选项C,因为各专业差异比较大,所以采用分层随机抽样更合理,故C正确;
对于选项D,该问题中的样本容量为100,故D正确.
故选:A.
变式3.(2023·上海静安·二模)2022年2月4日至2月20日春节期间,第24届冬奥会在北京市和张家口市联合举行.共有个冬奥村供运动员和代表队官员入住,其中北京冬奥村的容量约为人,延庆冬奥村的容量约人,张家口冬奥村的容量约人.为了解各冬奥村服务质量,现共准备了份调查问卷,采用分层抽样的方法,则需在延庆冬奥村投放的问卷数量是( )
A.58份B.50份C.32份D.19份
答案:C
【解析】在延庆冬奥村投放的问卷数量是份.
故选:C.
变式4.(2023·全国·高三专题练习)利用简单随机抽样的方法,从个个体中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的可能性为___________.
答案:
【解析】第二次抽取时,余下的每个个体被抽取到的概率为,则,
即,则在整个抽样过程中,
每个个体被抽取到的概率为.
故答案为:.
变式5.(2023·重庆南开中学高三阶段练习)某中学为了掌握学校员工身体状况,偶尔会采用抽检的方式来收集各部门员工的健康情况.为了让样本更具有代表性,学校对各部门采用分层抽样的方法进行抽检.已知该校部门、部门、部门分别有40、60、80人,各部门员工不存在交叉任职情况,若共抽检了90人,则部门抽检人数为______.
答案:20
【解析】由题意得从部门抽检人数为(人),
故答案为:20
变式6.(2023·全国·高三专题练习)某市甲、乙、丙三所学校的高三学生共有800名,其中男、女生人数如下表:
(1)现用分层随机抽样的方法从这三所学校的所有高三学生中抽取48人,则应从丙校抽取多少人?
(2)该市模考后,市教研室准备从这三所学校的所有高三学生中利用随机数法抽取100人进行成绩统计分析,将800人按001,002,…,800进行编号,如果从第8行第7列的数开始向右读,请你依次写出最先抽取的4个人的编号.(下面摘取了随机数表第7行至第9行)
8442 1753 3157 2455 0688 7704 7447 6721 7633 5026 8392
6301 5316 5916 9275 3816 5821 7071 7512 8673 5807 4439
1326 3321 1342 7864 1607 8252 0744 3815 0324 4299 7931
【解析】(1)根据题意可得丙校共有人,
根据分层抽样规则可得,应从丙校抽取人.
(2)第8行第7列的数为1,从数1开始向右读,则最先抽取的4个人的编号为165,538,707,175.
【方法技巧与总结】
不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
题型二:频率分布直方图、条形统计图、折线统计图、扇形统计图
例4.(2023·辽宁朝阳·高三阶段练习)某市教育局为得到高三年级学生身高的数据,对高三年级学生进行抽样调查,随机抽取了名学生,他们的身高都在,,,,五个层次内,分男、女生统计得到以下样本分布统计图,则( )
A.样本中层次的女生比相应层次的男生人数多
B.估计样本中男生身高的中位数比女生身高的中位数大
C.层次的女生和层次的男生在整个样本中频率相等
D.样本中层次的学生数和层次的学生数一样多
答案:B
【解析】设样本中女生有人,则男生有人,
设女生身高频率分布直方图中的组距为
由频率分布直方图的性质可得,
所以,
所以女生身高频率分布直方图中层次频率为20%,层次频率为30%,层次频率为25%,层次频率为15%,层次频率为10%
所以样本中层次的女生人数为,男生人数为,由于的取值未知,所以无法比较层次中男,女生人数,A错误;
层次女生在女生样本数中频率为15%,所以在整个样本中频率为,
层次男生在男生样本数中频率为15%,所以在整个样本中频率为,
由于的取值未知,所以无法比较层次的女生和层次的男生在整个样本中频率,C错误;
样本中层次的学生数为,
样本中层次的学生数为,
由于的取值未知,所以无法比较样本中层次的学生数和层次的学生数的大小,D错,
女生中,两个层次的频率之和为50%,所以女生的样本身高中位数为,层次的分界点,而男生,两个层次的频率之和为35%,,,两个层次的频率之和为65%,显然中位数落在C层次内,所以样本中男生身高的中位数比女生身高的中位数大,B正确;
故选:B.
例5.(2023·黑龙江·佳木斯一中三模(理))如图1为某省2019年1~4月份快递业务量统计图,图2为该省2019年1~4月份快递业务收入统计图,对统计图理解不正确的是( )
A.2019年1~4月份快递业务量3月份最高,2月份最低,差值接近2000万件
B.从1~4月份来看,业务量与业务收入有波动,但整体保持高速增长
C.从两图中看,增量与增长速度并不完全一致,但业务量与业务收入变化高度一致
D.2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,和春节后网购迎来喷涨有关
答案:B
【解析】从图(1)的柱形图可得2019年1~4月份快递业务量3月份最高,2月份最低,
3月份比2月份高4397-2411=1986,差值接近2000万件,故A正确.
从1~4月份来看,业务量与业务收入有波动,结合图(1)(2)中的柱形图可得业务量与业务收入在2月份和4月份均下降,故B错误.
从两图中柱状图可得业务量与业务收入变化高度一致,但业务量2月份同比增长,而业务收入2月份同比增长,因此增量与增长速度并不完全一致,故C正确.
从图(1)中可得2019年1~4月份快递业务量同比增长率均超过50%,在3月份最高,这的确和春节后网购迎来喷涨有关,故D正确.
故选:B.
例6.(2023·湖北孝感·高三阶段练习)2021年7月至2022年7月,我国居民消费价格保持平稳,居民消费价格涨跌幅如图所示,则( )
备注:同比增长率=,环比增长率=,
A.2022年1月全国居民消费价格比2021年1月全国居民消费价格有所下降
B.2022年5月全国居民消费价格比2022年4月全国居民消费价格有所上升
C.2021年7月至2022年7月全国居民消费价格同比增长率的40%分位数为1.0%
D.2021年10月至2022年7月全国居民消费价格环比增长率的平均数为0.25%
答案:D
【解析】对A,从图中可以看出2022年1月全国居民消费价格的同比增长率为,
所以2022年1月全国居民消费价格有所上升,故A错误;
对B,由图2022年5月全国居民消费价格环比增长率为,
所以2022年5月全国居民消费价格有所下降,故B错误;
对C,将C选项中的数据由小到大排列得,
,
因为,则同比增长率的40%分位数为第6个数,故C错误;
对D,环比增长率的平均数为
,故D正确.
故选:D
变式7.(2023·山西大附中高三阶段练习(文))小王于2015年底贷款购置了一套房子,根据家庭收入情况,小王选择了10年期每月还款数额相同的还货方式,且截止2019年底,他没有再购买第二套房子.下图是2016年和2019年家庭收入用于各项支出的比例分配图,根据以上信息,判断下列结论中正确的是( )
A.小王一家2019年用于饮食支出费用与2016年相同
B.小王一家2019年用于其他方面的支出费用是2016年的3倍
C.小王一家2019年的家庭收入比2016年增加了一倍
D.小王一家2019年的房贷支出比2016年减少了
答案:B
【解析】对于A,小王一家2019年用于饮食的支出比例与跟2016年相同,但是由于2019年比2016年家庭收入多,小王一家2019年用于饮食的支出费用比2016年多,故A错误;
对于B,设2016年收入为,相同的还款数额在2016年占各项支出的,在2019年占各项支出的,年收入为:,小王一家2019年用于其他方面的支出费用为,小王一家2016年用于其他方面的支出费用为,
小王一家2019年用于其他方面的支出费用是2016年的3倍,故B正确;
对于C,设2016年收入为,则2019年收入为:,故C错误;
对于D,小王一家2019年用于房贷的支出费用与2016年相同,故D错误.
故选:B.
变式8.(2023·全国·高三专题练习)某市政府为了节约生活用水,实施居民生活用水定额管理政策,即确定一个居民月用水量标准x(单位:吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费,并随机抽取部分居民进行调查,抽取的居民月均用水量的频率分布直方图如图所示.(同一组中的数据以该组区间的中点值为代表)
(1)求频率分布直方图中a的值;
(2)试估计该市居民月均用水量的众数、平均数;
(3)如果希望85%的居民月均用水量不超过标准x,那么标准x定为多少比较合理?
【解析】(1)由频率分布直方图中所有矩形的面积之和为1,可得,解得.
(2)由频率分布直方图可知,该市居民月均用水量的众数约为(吨),
由频率分布直方图可知,平均数约为(吨).
(3)由频率分布直方图可知,月均用水量低于2.5吨的居民人数所占的百分比为,月均用水量低于3吨的居民人数所占的百分比为,
所以,由题意可得,解得.
所以如果希望85%的居民月均用水量不超过标准x,那么x定为2.9吨比较合理.
变式9.(2023·全国·高三专题练习)法国著名的数学家笛卡尔曾经说过:“阅读优秀的书籍,就是和过去时代中最杰出的人们(书籍的作者)一一进行交谈,也就是和他们传播的优秀思想进行交流,阅读会让精神世界闪光”.某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图,如图所示:
(1)求a;
(2)根据频率分布直方图,估计该地年轻人每天阅读时间的中位数(精确到0.1)(单位:分钟);
(3)为了进一步了解年轻人的阅读方式,研究机构采用分层抽样的方法从每天阅读时间位于分组,和的年轻人中抽取5人,再从中任选3人进行调查,求其中恰好有2人每天阅读时间位于的概率.
【解析】(1)因为频率分布直方图的所有矩形面积之和为1,
所以,解得.
(2)因为,.
则中位数位于区间内,设中位数为x,
则,解得,
所以估计该地年轻人阅读时间的中位数约为74.4分钟.
(3)由题意,阅读时间位于的人数为,
阅读时间位于的人数为,
阅读时间位于的人数为,
所以在这三组中按照分层抽样抽取5人的抽样比例为,
则抽取的5人中位于区间有1人,设为a,位于区间有2人,设为,,位于区间有2人,设为,.
则从5人中任取3人,样本空间
.
含有10个样本点.
设事件A为“恰有2人每天阅读时间在”,
,含有3个样本点.
所以,
所以恰好有2人每天阅读时间位于的概率为.
变式10.(2023·贵州遵义·三模(理))某中学在2021年高考分数公布后对高三年级各班的成绩进行分析.经统计,某班有50名同学,总分都在区间内,将得分区间平均分成5组,统计频数、频率后,得到了如图所示的“频率分布”折线图.
(1)请根据频率分布折线图,画出频率分布直方图,并根据频率分布直方图估计该班级的平均分;
(2)经相关部门统计,高考分数以上的考生获得高校T“强基计划”入围资格,并制作高校T录取政策和考生录取预测统计表(如表所示).第一轮笔试有2科,学生通过考试获得相应等级的事件相互独立且概率相同.
若该班级考分前10名都已经报考了高校T的“强基计划”,且恰有2人成绩高于690分.求:
①总分高于690分的某位同学没有进入第二轮的概率;
②该班恰有两名同学通过“强基计划”被高校T录取的概率.
【解析】(1)画出频率分布直方图如下图所示:
平均分为:
.
(2)总分大于等于分的同学有人,
其中有人小于等于分,人大于分.
①
.
②设高于分的同学被高校录取为事件,不超过分的同学被高校录取为事件,则
,
.
变式11.(2023·全国·高三专题练习(理))山西运城王过酥梨是国家农产品地理标志保护产品,王过酥梨含有多种对人体有益的钙、铁、磷等微量营养元素,食后清火润肺,止咳化痰,能起到祛病养生之效,一致被人们作为逢年过节走亲访友,馈赠待客及日常生活的必备佳品.某水果批发商小李从事酥梨批发多年,他把去年年底客户采购酥梨在内的数量x(单位:箱)绘制成下表:
(1)根据表中的数据,补充完整这些数据的频率分布直方图,并估计采购数在168箱以上(含168箱)的客户数;
(2)若去年年底采购在内的酥梨数量约占小李去年年底酥梨总销售量的,估算小李去年年底总销售量(同一组中的数据用该组区间的中点值作代表);
(3)在(2)的条件下,由于酥梨受到人们的青睐,小李做了一份市场调查以决定今年年底是否在网上出售酥梨,若没有在网上出售酥梨,则按去年的价格出售,每箱利润为14元,预计销售量与去年持平;若计划在网上出售酥梨,则需把每箱售价下调1至5元(网上、网下均下调),且每下调m元销售量可增加箱,试预计小李在今年年底销售酥梨总利润Y(单位:元)的最大值.
【解析】(1)对应的频率分别为,则对应的频率/组距为,故这些数据的频率分布直方图如下图所示:
由直方图可知,采购数在168箱以上(含168箱)的客户数为(人)
(2)由题意可知,去年年底客户采购酥梨在内的数量为(箱)
则小李去年年底总销售量为(箱)
(3)由题意可得
当时,(元)
变式12.(2023·河南·温县第一高级中学高三阶段练习(文))随着新冠肺炎疫情的稳定,各地的经济均呈现缓慢的恢复趋势,为了更进一步做好疫情的防控工作,避免疫情的再度爆发,A地区规定居民出行或者出席公共场合均需佩戴口罩,现将A地区20000个居民一周的口罩使用个数统计如下表所示,其中每周的口罩使用个数在6以上(含6)的有14000人.
(1)求m,n的值;
(2)根据表中数据,完善上面的频率分布直方图;
(3)计算A地区居民一周口罩使用个数的平均数以及方差.
【解析】(1)由已知,;
(2)频率分布直方图如下:
(3)由频率分布直方图得
一周内使用口罩的平均数为
,
方差为.
变式13.(2023·全国·高三专题练习)已知A,B两家公司的员工月均工资(单位:万元)情况分别如图1,图2所示:
(1)以每组数据的区间中点值为代表,根据图1估计A公司员工月均工资的平均数、中位数,你认为用哪个数据更能反映该公司普通员工的工资水平?请说明理由.
(2)小明拟到A,B两家公司中的一家应聘,以公司普通员工的工资水平作为决策依据,他应该选哪个公司?
【解析】(1)A公司员工月均工资的平均数为
(万元).
由题图1可知A公司员工月均工资在0.6万元以下的比例为,
所以A公司员工月均工资的中位数约为0.6万元.
用中位数更能反映该公司普通员工的工资水平,理由如下:
因为平均数受每一个数据的影响,越离群的数据对平均数的影响越大,该公司少数员工的月收入很高,在这种情况下平均数并不能较好的反映普通员工的收入水平,而中位数不受少数极端数据的影响,可以较好的反映普通员工的收入水平.
(2)B公司员工月均工资的平均数为
(万元)
由题图2知,B公司员工月均工资在0.6万元以下的频率为,在0.8万元以下的频率为.
设B公司员工月均工资的中位数为x万元,
则,得.
小明应选择B公司应聘,理由如下:
B公司员工工资数据较为集中,月均工资的平均数和中位数均能反映该公司普通员工的平均收入水平,B公司员工月均工资平均数为0.69,中位数为0.7,均大于A公司员工月均工资的中位数0.62,所以以公司普通员工的工资水平作为决策依据,小明应该选B公司应聘.
【方法技巧与总结】
(1)利用频率分布直方图求频率、频数;
(2)利用频率分布直方图估计总体.
(3)频率分布直方图的纵坐标是,而不是频率.
题型三:百分位数
例7.(2023·广东·高三阶段练习)为了养成良好的运动习惯,某人记录了自己一周内每天的运动时长(单位:分钟),分别为53,57,45,61,79,49,x,若这组数据的第80百分位数与第60百分位数的差为3,则( )
A.58或64B.59或64C.58D.59
答案:A
【解析】将已知的6个数从小到大排序为45,49,53,57,61,79.
若,则这组数据的第80百分位数与第60百分位数分别为61和57,他们的差为4,不符合条件;
若,则这组数据的第80百分位数与第60百分位数分别为79和61,它们的差为18,不符合条件;
若,则这组数据的第80百分位数与第60百分位数分别为x和61(或61和x),则,
解得或
故选:A
例8.(2023·湖南·长沙一中高三阶段练习)一学习小组10名学生的某次数学测试成绩的名次由小到大分别是2,4,5,,11,14,15,39,41,50,已知该小组数学测试成绩名次的40%分位数是9.5,则的值是( )
A.6B.7C.8D.9
答案:C
【解析】依题意是整数,那么40%分位数9.5就是第,第位数的平均值,于是,解得.
故选:C
例9.(2023·湖南岳阳·高三阶段练习)中国青年志愿者协会成立于1994年12月5日,此后广大志愿者、志愿服务组织不断蓬勃发展,目前高校青年志愿者组织就有132个.为了解某大学学生参加志愿者工作的情况,随机抽取某高校志愿者协会的40名成员,就他们2022年第2季度参加志愿服务的次数进行了统计,数据如表所示.则这40名学生本季度参加志愿活动的第40百分数位为( )
A.9B.8C.8.5D.9.5
答案:C
【解析】∵为整数
∴第40百分数位为第16位和第17位的平均数,即为
故选:C.
变式14.(2023·江苏南通·高三开学考试)“双减”政策实施后,学生的课外阅读增多.某班50名学生到图书馆借书数量统计如下:
则这50名学生的借书数量的上四分位数(第75百分位数)是( )
A.8B.8.5C.9D.10
答案:C
【解析】由,故第75百分位数在借书数量从小到大排序后的第38人,
又,
故四分位数(第75百分位数)是9.
故选:C
变式15.(2023·重庆八中高三开学考试)某单位为了解该单位党员开展学习党史知识活动情况,随机抽取了部分党员,对他们一周的党史学习时间进行了统计,统计数据如下表所示:
则该单位党员一周学习党史时间的众数及第50百分位数分别是( )
A.8,8.5B.8,8C.9,8D.8,9
答案:D
【解析】党员人数一共有,学习党史事件为8小时的人数最多,故学习党史时间的众数为8,
,那么第50百分位数是第20和21个数的平均数,第20,21个数分别为9,9,所以第50百分位数是,
故选:D
变式16.(2023·福建省漳州第一中学模拟预测)树人中学举办以“喜迎二十大、永远跟党走、奋进新征程”为主题的演讲比赛,其中9人比赛的成绩为:85,86,88,88,89,90,92,94,98(单位:分),则这9人成绩的第80百分位数是___________.
答案:94
【解析】,所以从小到大选取第8个数作为80百分位数,即94.
故答案为:94
变式17.(2023·全国·高三专题练习)已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)
答案:【解析】因为,
所以这组数据的第5个数:50为第60百分位数.
观察易知这组数据的众数为50,
所以a和b的大小关系是.
故答案为:
【方法技巧与总结】
计算一组个数据的的第百分位数的步骤
①按从小到大排列原始数据.
②计算.
③若不是整数而大于的比邻整数,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
题型四:样本的数字特征
例10.(2023·全国·高三专题练习)上海入夏的标准为:立夏之后,连续五天日平均气温不低于.立夏之后,测得连续五天的平均气温数据满足如下条件,其中能断定上海入夏的是( )
A.总体均值为,中位数为
B.总体均值为,总体方差大于
C.总体中位数为,众数为
D.总体均值为,总体方差为
答案:D
【解析】对于A,总体均值为,中位数为,可能出现低于的情况,故A不正确;
对于B,当总体方差大于,不知道总体方差的具体数值,因此不能确定数据的波动大小,故B不正确;
对于C,中位数和众数也不能确定,故C不正确:
对于D,当总体均值为,总体方差为,根据方差公式,因为方差为1,,若存在有一天气温低于,则方差定大于1,或者通过假设,则,(另一值舍去),此时即为五天最低温度为度,大于,故D正确.
故选:D.
例11.(2023·全国·高三专题练习)若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )
A.甲同学:平均数为2,众数为1
B.乙同学:平均数为2,方差小于1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
答案:B
【解析】对于A,甲同学:若平均数为2,众数为1,则有1次名次应为4,不符合题意;
对于B,乙同学:平均数为2,设乙同学3次考试的名次分别为,,,
则方差,
则,所以,,均不大于3,符合题意;
对于C,丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;
对于D,丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.
故选:B
例12.(2023·重庆南开中学高三阶段练习)橙子辅导中学的高一、二、三这三个年级学生的平均身高分别为,若按年级采用分层抽样的方法抽取了一个600人的样本,抽到高一、高二、高三的学生人数分别为100、200、300,则估计该高中学生的平均身高为( )
A.B.C.D.
答案:A
【解析】设橙子辅导中学的总人数为,
由题意知,高一、高二、高三的学生总人数分别为:,
所以估计该高中学生的平均身高为:.
故选:A.
变式18.(2023·广东佛山·高三阶段练习)已知一组数据的平均数是3,方差是2,则由这5个数据组成的新的一组数据的方差是( )
A.4B.6C.D.
答案:C
【解析】因为一组数据的平均数是3,方差是2,
所以,,
所以,,
所以的平均数为
,
所以的方差为
,
故选:C
变式19.(2023·全国·高三阶段练习(理))某组样本数据的平方和,平均数,则该组数据的方差( )
A.1B.C.2D.
答案:D
【解析】
,
故选:D
变式20.(多选题)(2023·福建·高三阶段练习)某环保局对辖区内甲、乙、丙、丁四个地区的环境治理情况进行检查督导,若连续10天,每天空气质量指数(单位:)不超过100,则认为该地区环境治理达标,否则认为该地区环境治理不达标.根据连续10天检查所得数据的数字特征推断,环境治理一定达标的地区是( )
A.甲地区:平均数为80,方差为40B.乙地区:平均数为50,众数为40
C.丙地区:中位数为50,极差为60D.丁地区:极差为10,80%分位数为90
答案:AD
【解析】设每天的空气质量指数为,则方差.
对于A选项,由,得,
如果这10天中有1天的空气质量指数超过100,则必有矛盾,
所以这10天每天的空气质量指数都不超过100,A正确.
对于B选项,有天为40,有天为,有天为,此时:平均数为50,众数为40,
但该地区环境治理不达标,所以B选项错误.
对于C选项,第天为,后面天为,此时中位数为50,极差为60,
但该地区环境治理不达标,所以C选项错误.
对于D选项,如果最大值超过100,根据极差为10,则最小值超过90,
这与80%分位数为90矛盾,故最大值不超过100,D正确.
故选:AD
变式21.(多选题)(2023·广东·仲元中学高三阶段练习)已知一组样本数据,其中,由这组数据得到另一组新的样本数据,,…,,其中,则( ).
A.两组样本数据的样本平均数相同
B.两组样本数据的样本方差相同
C.,,…,样本数据的第30百分位数为
D.将两组数据合成一个样本容量为30的新的样本数据,该样本数据的平均数为5
答案:BC
【解析】由题意可得:
∵,则,,故A错误,B正确.
第30百分位数:,故为第5个数.
的排列为:,,,,,……
因此,第30百分位数为,C正确;
新样本的平均数为,D错误.
故选:BC.
变式22.(2023·陕西·安康市教学研究室三模(理))从1,2,3,4,5,6中任取4个不同的数,则这4个数的中位数是3的概率为____________.
答案:
【解析】中位数为3,则中间两个数为2,4,
∴符合条件的有1,2,4,5和1,2,4,6,故概率为.
故答案为:
变式23.(2023·上海市进才中学高三阶段练习)已知等差数列的公差为3,则、、、…、这11个数据的方差______.
答案:90
【解析】∵数列为等差数列,则这11个数据的平均数:
∴这11个数据的方差
故答案为:90.
变式24.(2023·江苏·南京师大附中高三阶段练习)有一组样本数据,该样本的平均数和方差均为.在该组数据中加入一个数,得到新的样本数据,则新样本数据的方差为__________.
答案:
【解析】样本数据,该样本的平均数和方差均为,在该组数据中加入1个数,则新样本数据的平均数,
方差为.
故答案为:.
变式25.(2023·全国·高三专题练习)已知一组数的方差是4,则的标准差是__.
答案:4
【解析】数据的方差为4,
所以数据的方差为,
所以数据的标准差为,
故答案为:4.
【方法技巧与总结】
(1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:或写成,即方差等于原数据平方的平均数减去平均数的平方.
【过关测试】
一、单选题
1.(2023·福建省福州延安中学高三开学考试)为检查某校学生心理健康情况,市教委从该校名学生中随机抽查名学生,检查他们心理健康程度,则下列说法正确的是( )
A.名学生的心理健康情况是总体B.每个学生是个体
C.名学生是总体的一个样本D.名学生为样本容量
答案:A
【解析】对选项A:名学生的心理健康情况是总体,故A正确;
对选项B,每个学生的心理健康情况是个体,故B错误;
对选项C,名学生的心理健康情况是总体的一个样本,故C错误;
对选项D,名学生的心理健康情况为样本容量,故D错.
故选:
2.(2023·山东·汶上县第一中学高三开学考试)某市为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度.为了确定一个比较合理的标准,通过简单随机抽样,获得了100户居民的月均用水量数据(单位:吨),得到如图所示的频率分布直方图.估计该市居民月均用水量的中位数为( )
A.8.25B.8.45C.8.65D.8.85
答案:B
【解析】由频率分布直方图,得月均用水量在5.2吨以下的居民用户所占的比例为,月均用水量在9.2吨以下的居民用户所占的比例为,故中位数落在区间内.
设样本的中位数为,则,
所以,即样本的中位数为,
由样本估计总体的思想,估计该市居民月均用水量的中位数为,
故选:B.
3.(2023·黑龙江·佳木斯一中三模(文))新冠肺炎疫情防控中,测量体温是最简便、最快捷,也是筛查成本比较低、性价比很高的筛查方式,是更适用于大众的普通筛查手段.某班级体温检测员对某一周内甲、乙两名同学的体温进行了统计,其结果如图所示,则下列结论不正确的是( )
A.甲同学的体温的极差为0.5℃
B.甲同学的体温的众数为36.3℃
C.乙同学的体温的中位数与平均数不相等
D.乙同学的体温比甲同学的体温稳定
答案:C
【解析】对于A:甲同学的体温的极差为℃,故A选项正确;
对于B:甲同学的体温从低到高依次为36.1℃,36.1℃,36.3℃,36.3℃,36.3℃,36.5℃,36.6℃,故众数为36.3℃,故B选项正确;
对于C:乙同学的体温从低到高依次为36.2℃,36.3℃,36.3℃,36.4℃,36.5℃,36.5℃,36.6℃,故中位数为36.4℃,而平均数也是36.4℃,故C选项错误;
对于D:从折线图上可以看出,乙同学的体温比甲同学的体温稳定,故D选项正确.
故选:C
4.(2023·河北邯郸·高三开学考试)某高中2022年的高考考生人数是2021年高考考生人数的倍.为了更好地对比该校考生的升学情况,统计了该校2021年和2022年高考分数达线情况,得到如图所示扇形统计图:
下列结论正确的是( )
A.该校2022年与2021年的本科达线人数比为6:5
B.该校2022年与2021年的专科达线人数比为6:7
C.2022年该校本科达线人数增加了80%
D.2022年该校不上线的人数有所减少
答案:C
【解析】不妨设2021年的高考人数为100,则2022年的高考人数为
年本科达线人数为50,2022年本科达线人数为90,得2022年与2021年的本科达线人数比为,本科达线人数增加了,故选项不正确,选项C正确;
2021年专科达线人数为35,2022年专科达线人数为45,所以2022年与2021年的专科达线人数比为,选项B错误;
2021年不上线人数为15,2022年不上线人数也是15,不上线的人数无变化,选项错误.
故选:C
5.(2023·安徽·高三开学考试)某滑冰馆统计了2021年11月1日到30日某小区居民在该滑冰馆的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( )
A.该小区居民在该滑冰馆的锻炼天数在区间内的最少
B.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
C.估计该小区居民在该滑冰馆的锻炼天数的平均值大于14
D.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.456
答案:C
【解析】频率分布直方图中,面积最小的矩形条所在的区间为,即样本中区间内的数据频率最小,频数也最小,故选项错误,
由频率分布直方图可得,前三个小矩形的面积之和为,所以估计该小区居民在该滑冰馆的锻炼天数的中位数小于15,故选项错误;
由频率分布直方图可得,,故选项C正确;
由频率分布直方图可得,该小区居民在该滑冰馆的锻炼天数超过15天的频率为,故锻炼天数超过15天的概率为,
故选项错误.
故选:C.
6.(2023·广西·模拟预测(文))2022年6月6日是第27个“全国爱眼日”,为普及科学用眼知识,提高群众健康水平,预防眼疾,某区残联在残疾人综合服务中心开展“全国爱眼日”有奖答题竞赛活动.已知5位评委老师按百分制(只打整数分)分别给出某参赛小队评分,可以判断出一定有评委打满分的是( )
A.平均数为98,中位数为98B.中位数为96,众数为99
C.中位数为97,极差为9D.平均数为98,极差为6
答案:D
【解析】选项A:当打分结果为时,满足平均数为98,中位数为98,所以A错误;
选项B:当打分结果为时,满足中位数为96,众数为99,所以B错误;
选项C:当打分结果为时,满足中位数为97,极差为9,所以C错误;
选项D:假设没有评委打满分,结合极差为6可得总成绩,
则平均数,与选项不符,故假设不成立,所以平均数为98,极差为6时,一定有评委打满分,
故选:D.
7.(2023·四川·树德中学高三阶段练习(理))比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述错误的是( )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.乙的直观想象能力指标值优于甲的数学建模能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
答案:D
【解析】对于A选项,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,
所以甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值,故选项A正确;
对于B选项,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,
所以乙的直观想象能力指标值优于甲的数学建模能力指标值,故选项B正确;
对于C选项,甲的六维能力指标值的平均值为,
乙的六维能力指标值的平均值为,
所以乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平,所以选项C正确;
对于D选项,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,
所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,所以选项D错误.
故选:D
8.(2023·河南·高三阶段练习(理))已知甲、乙两班各50人,下表为某次数学考试的成绩情况:
各分数段成绩视为均匀分布,有以下结论:①甲班平均成绩低于乙班;②甲班成绩的中位数与乙班相同;③甲班成绩的方差比乙班成绩的方差小.其中正确的序号是( )A.①B.①③C.②③D.①②③
答案:B
【解析】由题可知,,
,
所以甲班的平均成绩低于乙班的平均成绩,故①正确;
因为甲班的中位数位于分数段,乙班的中位数位于分数段,
所以甲班的中位数低于乙班的中位数,故②错误;
因为,
,
所以甲班成绩的方差比乙班成绩的方差小,故③正确.
综上,正确的序号是①③.
故选:B.
二、多选题
9.(2023·广东广州·高三阶段练习)某校为了解高中学生的身高情况,根据男、女学生所占的比例,采用样本量按比例分配的分层随机抽样分别抽取了男生50名和女生30名,测量他们的身高所得数据(单位:)如下:
根据以上数据,可计算出该校高中学生身高的总样本平均数与总样本方差分别是( )A.B.
C.D.
答案:BD
【解析】设总样本量为,由题意得男生样本量为,女生样本量为,假设男生的样本数据为,女生的样本数据为,
则总样本平均数,
总样本方差,
∵,
同理,
∴总样本方差,
故选:BD
10.(2023·全国·模拟预测)最近几个月,新冠肺炎疫情又出现反复,各学校均加强了疫情防控要求,学生在进校时必须走测温通道,每天早中晚都要进行体温检测并将结果上报主管部门.某班级体温检测员对一周内甲乙两名同学的体温进行了统计,其结果如图所示,则下列结论正确的是( )
A.甲同学体温的极差为0.4℃
B.乙同学体温的众数为36.4℃,中位数与平均数相等
C.乙同学的体温比甲同学的体温稳定
D.甲同学体温的第60百分位数为36.4℃
答案:ABC
【解析】观察折线图知,甲同学体温的极差为0.4℃,A正确;
乙同学体温从小到大排成一列:36.3℃,36.3℃,36.4℃,36.4℃,36.4℃,36.5℃,36.5℃,
乙同学体温的众数为36.4℃,中位数为36.4℃,平均数℃,B正确;
乙同学的体温波动较甲同学的小,极差为0.2℃,也比甲同学的小,因此乙同学的体温比甲同学的体温稳定,C正确;
将甲同学的体温从小到大排成一列:36.2℃,36.2℃,36.4℃,36.4℃,36.5℃,36.5℃,36.6℃,
因,则甲同学体温的第60百分位数为36.5℃,D不正确.
故选:ABC
11.(2023·广东·开平市忠源纪念中学高三阶段练习)某中学组织三个年级的学生进行禁毒知识竞赛.经统计,得到成绩排在前200名学生分布的饼状图(图1)和其中的高一学生排名分布的频率条形图(图2).则下列命题正确的是( )
A.成绩排在前200名的200人中,高二人数比高三人数多10
B.成绩排在第名的50人中,高一人数比高二的多
C.成绩排在第名的100人中,高三人数占比可能超过
D.成绩排在第名的50人中,高二人数肯定多于23
答案:AC
【解析】由前200名学生分布的饼状图和高一学生排名分布的频率条形图知:
对于,成绩排在前200名的200人中,高二人数比高三人数多,故A正确;
对于,成绩排在第名的50人中,高一人数为,高二和高三在前200名中共有,高二的具体人数不知道,故B错误;
对于C,成绩排在第名的100人中,高一人数为,高二和高三人数总和为100,所以高三人数占比有可能超过,故C正确;
对于D,成绩排在第名的50人中,高一学生有人,
高二最多有人,故D不正确;
故选:AC.
12.(2023·广东茂名·高三阶段练习)下面是某省2016年至2021年乒乓球训练馆新增数量图和乒乓球训练馆类型统计表,则下列说法正确的是( )
A.2021年该省乒乓球训练馆产业中C类型乒乓球训练馆占比量最高
B.2016年至2021年该省乒乓球训练馆数量逐年上升
C.2016年至2021年该省乒乓球训练馆新增数量逐年增加
D.2021年B类型乒乓球训练馆比2020年B类型乒乓球训练馆数量多
答案:ABD
【解析】由统计表可知,2021年该省乒乓球训练馆产业中C类型乒乒球训练馆占比最高,故A正确;
由图可知,2016年至2021年该省乒乒球训练馆数量逐年上升,故B正确;
由图可知,2020年比2019年下降了,故C错误;
由图和统计表可知,2021年B类型乒乒球训练馆比2020年B类型乒乒球训练馆数量多,故D正确.
故选:ABD.
三、填空题
13.(2023·全国·高三专题练习)已知四个数1,2,4,a的平均数为4,则这四个数的中位数是 __.
答案:3
【解析】由题意可得:,解得:a=9,
则中位数为.
故答案为:3.
14.(2023·广东广州·高三阶段练习)请写出一组由6个不同的自然数从小到大排列的数据,这组数据要满足以下两个条件:①第70百分位数为6,②极差为6.______.
答案:(答案不唯一)
【解析】因为,所以第70百分位数为第个数,
因为第70百分位数为6,所以第个数为,
由于极差为6,所以这组数可以为:,
故答案为:(答案不唯一)
15.(2023·四川·高三开学考试(理))四川省将于2022年秋季启动实施新高考综合改革,某校开展“新高考”动员大会,参会的有100名教师,1500名学生,1000名家长,为了解大家对推行“新高考”的认可程度,现采用分层抽样调查,抽取了一个容量为n的样本,其中教师与家长共抽取了55名,则n=______.
答案:130
【解析】由,得.
故答案为:130.
16.(2023·云南·高三阶段练习)某市某次高中数学统测学生测试成绩频率分布直方图如图所示.现按测试成绩由高到低分成A,B,C,D四个等级,其中等占等占等占等占的比例,规定达到等级及以上才能通过考试,则要通过本次考试的学生分数至少为___________.
答案:24
【解析】由图可知,分数在20分以下的比例为,在40分以下的比例为,因此分位数位于内,由,所以通过本次考试分数至少为24.
故答案为:24.
四、解答题
17.(2023·全国·高三阶段练习(理))某企业在举行的安全知识竞答活动中,随机抽取了50名员工,统计了他们的成绩,全部介于70到95之间,将成绩按如下方式分成五组:第一组,第二组,第五组,如图是按上述分组方法得到的频率分布直方图
(1)请根据频率分布直方图,求样本数据的平均数和中位数(所有结果均保留两位小数);
(2)从第一组和第五组的员工中,随机抽取4名员工,记这4名员工中来自第五组的员工的人数为,求随机变量的分布列及数学期望.
【解析】(1)样本数据的平均数
第一二组的频率为
第一二三组的频率为
所以中位数一定落在第三组,设中位数为,则
解得
(2)据题意,第一组有人,第五组有人,
随机变量的可能取值为
所以的分布列是
所以的数学期望
18.(2023·陕西·安康市教学研究室三模(理))某学校为了解高三尖子班数学成绩,随机抽查了60名尖子生的期中数学成绩,得到如下数据统计表:
若数学成绩超过135分的学生为“特别优秀”,超过120分而不超过135分的学生为“优秀”,已知数学成绩“优秀”的学生与“特别优秀”的学生人数比恰好为.
(1)求x,y,p,q的值;
(2)学校教务为进一步了解这60名学生的学习方法,从数学成绩“优秀”、“特别优秀”的学生中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查.设X为抽取的3人中数学成绩“优秀”的人数,求X的分布列和数学期望.
【解析】(1)根据题意,得
,解得,
所以,
故,
(2)用分层抽样的方法选取5人,则数学成绩“特别优秀”的有人,“优秀”的有人,
故X的可能取值为0,1,2,则
,,,
所以X的分布列为:
故.
19.(2023·陕西·咸阳市高新一中高三开学考试(文))在实施“乡村振兴”的进程中,某地政府引领广大农户发展特色农业,种植优良品种柑橘.现在实验基地中种植了相同数量的、两种柑橘.为了比较、两个柑橘品种的优劣,在柑橘成熟后随机选取、两种柑橘各株,并根据株产量(单位:)绘制了如图所示的频率分布直方图(数据分组为:、、、、、):
(1)求、的值;
(2)将频率当做概率,在所有柑橘中随机抽取一株,求其株产量不低于的概率;
(3)求两种柑橘株产量平均数的估计值(同一组数据中的平均数用该组区间的中点值代表),并从产量角度分析,哪个品种的柑橘更好?说明理由.
【解析】(1)由频率分布直方图可得,解得,,解得.
(2)品种柑橘株产量不低于的频率为,
品种柑橘株产量不低于的频率为,
故株柑橘中产量不低于的频率为,
所以在所有柑橘中随机抽取一株,其株产量不低于的概率为.
(3)A品种柑橘株产量平均数的估计值为,
,
设品种柑橘株产量平均数的估计值为,
,
品种的柑橘更好.理由如下:
方法一:的平均产量大于的平均产量.
方法二:由频率分布直方图可知,品种柑橘株产量在及以上的占比为,
品种柑橘株产量在及以上的占比为,故品种的柑橘更好.
20.(2023·新疆·新和县实验中学高三阶段练习(理))教育部门去年出台了“双减”政策.即有效减轻义务教育阶段学生过重作业负担和校外培训负担,持续规范校外培训(包括线上培训和线下培训).“双减"政策的出合对校外的培训机构经济效益产生了严重影响.某大型校外培训机构为了规避风险,寻求发展制定科学方案,工作人员对2021年前200名报名学员的消费金额进行了统计整理,其中数据如表.
(1)结合题中给出数据,估计2021年前200名报名学员消费的平均数x(同一区间的花费用区间的中点值替代).
(2)该大型校外培训机构转型方案之一是将文化科主阵地辅导培训向音体美等兴趣爱好培训转移,为了深入了解当前学生的兴趣爱好,工作人员利用分层抽样的方法在消费金额为和的学员中抽取了5人,再从这5人中选取3人进行有奖问卷调查,求抽取的3人中消费金额为的人数的分布列和数学期望.
【解析】(1)2021年前200名报名学员消费的平均数为;
(2)由分层抽样可得消费金额为的人数为人,消费金额为的人数为人,
抽取的3人中消费金额为的人数为,则;
所以的分布列为:
所以.
甲校
乙校
丙校
男生
97
90
x
女生
153
160
y
高考分数
第一轮笔试
学科测试等级
A
B
C
A
B
C
学生通过考试获得相应等级概率
第二轮面试
入围条件
至少有1科,且2科均不低于B
录取条件
全
在第一轮笔试中2科均获得
通过第二轮面试
考生通过概率为
考生通过概率为
采购数x(单位:箱)
客户数
5
10
15
15
5
口罩使用数量
频率
0.2
m
0.3
n
0.1
次数
7
8
9
10
11
人数
6
10
9
8
7
借书数量(单位:本)
5
6
7
8
9
10
频数(单位:人)
5
8
13
11
9
4
党史学习时间(小时)
7
8
9
10
11
党员人数
6
10
9
7
8
分数
段
甲班
人数
1
3
9
16
10
7
4
乙班
人数
3
2
5
14
11
8
7
性别
人数
平均数
方差
男生
50
172
18
女生
30
164
30
2020—2021年乒乓球训练馆类型统计表
类型
2020年
2021年
A类型
24%
21%
B类型
36%
38%
C类型
40%
41%
1
2
3
4
期中数学成绩(单位:分)
频数
频率
3
0.05
x
p
9
0.15
15
0.25
18
0.30
y
q
合计
60
1.00
X
0
1
2
P
消费金额(千元)
人数
30
50
60
20
30
10
1
2
3
新高考数学大一轮复习讲义之方法技巧专题50正态分布(原卷版+解析): 这是一份新高考数学大一轮复习讲义之方法技巧专题50正态分布(原卷版+解析),共66页。
新高考数学大一轮复习讲义之方法技巧专题42计数原理(原卷版+解析): 这是一份新高考数学大一轮复习讲义之方法技巧专题42计数原理(原卷版+解析),共24页。
新高考数学大一轮复习讲义之方法技巧专题42概率与统计的综合应用(原卷版+解析): 这是一份新高考数学大一轮复习讲义之方法技巧专题42概率与统计的综合应用(原卷版+解析),共125页。