年终活动
搜索
    上传资料 赚现金
    英语朗读宝

    清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练

    清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练第1页
    清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练第2页
    清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练第3页
    还剩30页未读, 继续阅读
    下载需要10学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练

    展开

    这是一份清单39 抽样方法与总体分布的估计(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练,共33页。试卷主要包含了知识与方法清单,跟踪检测,填空题,解答题等内容,欢迎下载使用。
    清单39 抽样方法与总体分布的估计
    一、知识与方法清单
    1.简单随机抽样
    (1)定义:设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
    【对点训练1】某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是(  )
    A.这次抽样中可能采用的是简单随机抽样
    B.这次抽样一定没有采用系统抽样
    C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率
    D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率
    【答案】A
    【解析】利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D均错误.
    2.(1)最常用的简单随机抽样的方法:抽签法和随机数表法.
    (2)抽签法与随机数表法的区别与联系
    抽签法和随机数表法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而随机数表法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数表法能够快速地完成抽样.
    【对点训练2】一个年级有12个班,每个班有50名学生,随机编号为1~50,为了了解他们课外的兴趣,要求每班第40号学生留下来进行问卷调查,这运用的抽样方法是(  )
    A.分层抽样 B.抽签法 C.随机数表法 D.系统抽样法
    【答案】D
    【解析】由系统抽样的定义知这种抽样方法为系统抽样法.故选D.
    3. 应用简单随机抽样应注意的问题
    (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
    (2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
    【对点训练3】总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )
    7816
    6572
    0802
    6314
    0702
    4369
    9728
    0198
    3204
    9234
    4935
    8200
    3623
    4869
    6938
    7481
    A.08 B.07 C.02 D.01
    【答案】D
    【解析】从选定的两位数字开始向右读,剔除不合题意及与前面重复的编号,得到符合题意的编号分别为08,02,14,07,01,…,因此选出来的第5个个体的编号为01.故选D.
    4.系统抽样的步骤
    假设要从容量为的总体中抽取容量为的样本.
    (1)先将总体的个个体编号.
    (2)确定分段间隔,对编号进行分段,当是整数时,取.如果遇到不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除
    (3)在第1段用简单随机抽样确定第一个个体编号.
    (4)按照一定的规则抽取样本,通常是将加上间隔得到第2个个体编号,再加得到第3个个体编号,依次进行下去,直到获取整个样本.
    【对点训练4】采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为(  )
    A.7 B.9 C.10 D.15
    【答案】C
    【解析】由系统抽样的特点知,抽取号码的间隔为=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n项,显然有729=459+(n-1)×30,解得n=10.所以做问卷B的有10人.
    5.系统抽样适用的条件是总体容量较大,样本容量也较大.起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.
    【对点训练5】某中学教务处采用系统抽样方法,从学校高三年级全体1000名学生中抽50名学生做学习状况问卷调查.现将1000名学生从1到1000进行编号,求得间隔数k=20,即分50组每组20人.在第一组中随机抽取一个号,如果抽到的是17号,则第8组中应抽取的号码是(  )
    A.177 B.157
    C.417 D.367
    【答案】B
    【解析】根据系统抽样的特点可知,抽取出的编号成首项为17,公差为20的等差数列,所以第8组应抽取的号码是17+(8-1)×20=157.
    6.分层抽样的定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
    【对点训练6】某工厂的一、二、三车间在11月份共生产了3600双皮靴,在出厂前检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b,c,且a,b,c成等差数列,则二车间生产的产品数为(  )
    A.800 B.1000
    C.1200 D.1500
    【答案】C
    【解析】因为a,b,c成等差数列,所以2b=a+c,所以从二车间抽取的产品数占抽取产品总数的,根据分层抽样的性质可知,二车间生产的产品数占产品总数的,所以二车间生产的产品数为3600×=1200.故选C.
    7.分层抽样问题类型及解题思路
    (1)求某层应抽个体数量:按该层所占总体的比例计算.
    (2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.
    (3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.
    【对点训练7】某电视台为了调查“爸爸去哪儿”节目的收视率,现用分层抽样的方法从4300人中抽取一个样本,这4300人中青年人1600人,且中年人人数是老年人人数的2倍,现根据年龄采用分层抽样的方法进行调查,在抽取的样本中青年人有320人,则抽取的样本中老年人的人数为(  )
    A.90 B.180
    C.270 D.360
    【答案】B
    【解析】设老年人有x人,从中抽取y人,则1600+3x=4300,得x=900,即老年人有900人,则=,
    得y=180.故选B.
    8. 三种抽样方法的比较

    类别
    共同点
    各自特点
    相互联系
    适用范围
    简单随
    机抽样
    抽样过程中每个个体被抽取的概率相等
    从总体中逐个抽样

    总体中的个体数较少
    系统抽样
    将总体均分成几部分,按事先确定的规则在各部分抽取
    在起始部分抽样时采用简单随机抽样
    总体中的个体数较多
    分层抽样
    将总体分成几层,分层进行抽取
    分层抽样时采用简单随机抽样或系统抽样
    总体由差异明显的几部分组成

    【对点训练8】某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1人,则在采用系统抽样时,需要在总体中先剔除1个个体,求n.
    【解析】总体容量为6+12+18=36.
    当样本容量为n时,由题意知,系统抽样的间隔为,分层抽样的比例是,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,
    所以n应是6的倍数,36的约数,即n=6,12,18.
    当样本容量为(n+1)时,总体容量剔除以后是35人,系统抽样的间隔为,因为必须是整数,
    所以n只能取6,即样本容量n=6.
    9.制作频率分布直方图的步骤
    第一步:求极差,决定组数和组距,组距=;
    第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
    第三步:登记频数,计算频率,列出频率分布表;
    第四步:画频率分布直方图。
    【对点训练9】在技术人员的指导下,某棉花种植基地的棉花产量和质量均有大幅度地提升,已知该棉花种植基地今年产量为,技术人员随机抽取了棉花,测量其马克隆值(棉花的马克隆值是反映棉花纤维细度与成熟度的综合指标,是棉纤维重要的内在质量指标之一,与棉花价格关系密切),得到如下统计表及不完整的频率分布直方图.
    马克隆值









    质量/ t
    0.04
    0.06
    0.12
    0.16
    b
    a
    0.06
    0.03
    0.01

    (1)求表中的值,并补全频率分布直方图;
    (2)根据频率分布直方图,估计样本的马克隆值的众数及中位数;
    (3)根据马克隆值可将棉花分为三个等级,不同等级的棉花价格如下表所示:
    马克隆值



    级别



    价格(万元/t)
    1.6
    1.52
    1.44
    用样本估计总体,估计该棉花种植基地今年的总产值.
    【解析】(1)由题中频率分布直方图知:;
    由统计表得:,
    解得.
    补全的频率分布直方图如图所示:

    (2)由频率分布直方图知:马克隆值落在区间内的频率最大,故众数为.
    ,,中位数在区间内,
    中位数为.
    (3)样本的产值为(万元),
    估计该棉花种植基地今年的总产值为(万元).
    10.解决频率分布直方图问题时要抓住3个要点
    (1)直方图中各小长方形的面积之和为1.
    (2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
    (3)直方图中每组样本的频数为频率×总体数.
    【对点训练10】(2021河南高三月考)某校为了解学生体能素质,随机抽取了名学生,进行体能测试.并将这名学生成绩整理得如下频率分布直方图.根据此频率分布直方图.下列结论中不正确的是( )

    A.这名学生中成绩在内的人数占比为
    B.这名学生中成绩在内的人数有人
    C.这名学生成绩的中位数为
    D.这名学生的平均成绩(同一组中的数据用该组区间的中点值做代表)
    【答案】C
    【解析】根据此频率分布直方图,成绩在内的频率为,所以A正确;
    这名学生中成绩在内的人数为所以B正确;
    根据此频率分布直方图,,,
    可得这名学生成绩的中位数,所以C错误﹔根据频率分布直方图的平均数的计算公式,可得:所以D正确.故选C.
    11.样本的数字特征
    (1)众数
    在一组数据中,出现次数最多的数据叫做这组数据的众数.
    (2)中位数
    将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数
    (3)平均数
    样本数据的算术平均数,即.
    【对点训练11】(2021云南大理模拟预测)在发生某公共卫生事件期间,有专业机构认为该事件在一段事件内没有发生大规模群体感染的标志是“连续日,每天新增疑似病例不超过人”.过去日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
    甲地:总体平均数为,中位数为;
    乙地:总体平均数为,总体方差大于;
    丙地:中位数为,众数为;
    丁地:总体平均数为,总体方差为.
    则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
    A.甲地 B.乙地 C.丙地 D.丁地
    【答案】D
    【解析】对于甲地,若连续日的数据为,则满足平均数为,中位数为,但不符合没有发生大规模群体感染的标志,A错误;
    对于乙地,若连续日的数据为,则满足平均数为,方差大于,但不符合没有发生大规模群体感染的标志,B错误;
    对于丙地,若连续日的数据为,则满足中位数为,众数为,但不符合没有发生大规模群体感染的标志,C错误;
    对于丁地,若总体平均数为,假设有一天数据为人,则方差,不可能总体方差为,则不可能有一天数据超过人,符合没有发生大规模群体感染的标志,D正确.故选D.
    12.方差与标准差
    (1)标准差是样本数据到平均数的一种平均距离.
    (2)方差:(是样本数据,是样本容量,是样本平均数).
    (3)标准差:.
    【对点训练12】(2021河南高三开学考试)某班统计某次数学测验的平均分与方差(成绩不完全相同),计算完后才发现有位同学的分数录入了两次,只好重算一次.已知第一次计算所得平均分和方差分别为,,第二次计算所得平均分和方差分别为,,若此同学的得分恰好为,则( )
    A., B.,
    C., D.,
    【答案】B
    【解析】设这个班有个同学,分数分别是,,,…,,
    假设第个同学的成绩录入了两次,第一次计算时,总分是,方差为

    第二次计算时,,方差为

    故有,.故选B
    13.平均数、方差公式的推广
    若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
    【对点训练13】若样本数据,,…,的标准差为8,则数据,,…,的标准差为___________.
    【答案】8
    【解析】若原数据为,,…,,对应的标准差为,而数据,,…,的方差为,标准差为.
    14.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.
    【对点训练14】粮食安天下安,粮食生产是保障国家安全的重器,只有立足自身才能确保粮食产品安全稳定,把中国人的口粮牢牢地抓在自己手里,以袁隆平、李振声、李登海为代表的农业科学家一次次的把我国的粮食生产提高到一个新的高度.某实验农场种植的甲乙两种水稻,在面积相等的两块稻田中连续6年的年平均产量如表(单位:):
    品种
    第1年
    第2年
    第3年
    第4年
    第5年
    第6年

    900
    920
    900
    850
    910
    920

    900
    960
    950
    860
    860
    900
    根据上述实验结果,下列说法正确的是(  )
    A.甲种水稻平均产量高并且产量稳定
    B.甲种水稻平均产量高但是乙种产量稳定
    C.乙种水稻平均产量高并且产量稳定
    D.乙种水稻平均产量高但是甲种产量稳定
    【答案】D
    【解析】根据平均值的计算公式和方差计算公式,计算平均值与方差得




    由于<,因此乙种水稻平均产量高,但是<,
    所以乙种水稻亩产量高但甲产量稳定,故甲种水稻的质量更好.故选D.
    15.用频率分布直方图估计众数、中位数、平均数的方法
    (1)众数为频率分布直方图中最高矩形底边中点横坐标;
    (2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
    (3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
    【对点训练15】(2021云南·高三月考)某校近几年加大了对学生奥赛的培训力度,为了选择培训的对象,今年5月该校进行了一次化学竞赛.现从参加竞赛的同学中,选取100名同学并将其成绩(百分制,均为整数)分成五组:第1组,第2组,第3组,第4组,第5组.得到如图所示的频率分布直方图,观察图形,回答下列问题:

    (1)求a的值,并求这组数据的中位数(中位数结果保留两位小数);
    (2)已知分数在之间的男生与女生的比例为3:2,从分数在的同学中随机抽取2人,求这2人均为男生的概率.
    【解析】(1)由题意得,解得.
    设该组数据的中位数是x,则,
    经计算,得,故该组数据的中位数约为78.33;
    (2)第1组人数为,则男生3人,女生2人.
    将男生记为a,b,c,女生记为A,B.从这5人中随机抽取2人的情况有(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B),共10种;
    被抽到的2人均为男生情况有(a,b),(a,c),(b,c),共3种.
    故被抽到的2人均为男生的概率.
    16. 茎叶图的画法步骤
    第一步:将每个数据分为茎(高位)和叶(低位)两部分;
    第二步:将最小茎与最大茎之间的数按大小次序排成一列;
    第三步:将各个数据的叶依次写在其茎的两侧.
    【对点训练16】23.(2022·全国·高三专题练习(理))2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是( )

    A.过去的6年,“甲”的极差小于“乙”的极差
    B.过去的6年,“甲”的平均值小于“乙”的平均值
    C.过去的6年,“甲”的中位数小于“乙”的中位数
    D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率
    【答案】B
    【解析】对于A,甲的极差为,乙的极差为,
    所以“甲”的极差小于“乙”的极差,A正确;
    对于B,甲的平均数是,
    乙的平均数为,
    所以“甲”的平均值大于“乙”的平均值,B错误;
    对于C,甲的中位数是,
    乙的中位数是,
    所以,“甲”的中位数小于“乙”的中位数,C正确;
    对于D,设过去6年甲的平均增长率为x,则,解得:,
    即过去6年甲的平均增长率为;
    同理可求乙的平均增长率为:.
    因为,
    所以“甲”的平均增长率小于“乙”的平均增长率,D正确.故选B.
    17.统计图
    统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.
    【对点训练17】(2021山西长治市高三月考)随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领相关户外用品行业市场增长.下面是2013年至2020年中国雪场滑雪人次(万人次)与同比增长率(与上一年相比)的统计情况,则下面结论中正确的是( )

    A.2013年至2020年,中国雪场滑雪人次的同比增长率逐年减少
    B.2013年至2020年,中国雪场滑雪人次逐年增加
    C.2013年至2020年,中国雪场滑雪人次的年增加量相近
    D.2013年到2020年,中国雪场滑雪人次在2020年首次出现负增长
    【答案】D
    【解析】对于A,由折线图可知,2013年至2020年,中国雪场滑雪人次的同比增长率先增长再减小,故A错误;
    对于B,由条形统计图知,2013年至2019年,中国雪场滑雪人次逐年增加,但2020年减少了,故B错误;
    对于C,由条形图知,2013年至2020年,中国雪场滑雪人次的年增加量不相近,故C错误;
    对于D,由条形图和折线图,明显看出2013年到2020年,中国雪场滑雪人次在2020年首次出现负增长,故D正确.故选D
    18.柱状图用于显示一段时间内的数据变化或显示各项之间的比较情况,柱状图也就是条形统计图,注意柱状图与频率分布直方图的区别,柱状图的横坐标刻度为离散型随机变量,纵坐标为频数或频率等,频率分布直方图的横坐标刻度为连续型随机变量,纵坐标刻度为.
    【对点训练18】依照某发展中国家2018年的官方资料,将该国所有家庭按年收入从低到高的顺序平均分为五组,依次为第一组至第五组,各组家庭的年收入总和占该国全部家庭的年收入总和的百分比如图所示.

    以下关于该国2018年家庭收入的判断,一定正确的是
    A.至少有的家庭的年收入都低于全部家庭的平均年收入
    B.收入最低的那的家庭平均年收入为全部家庭平均年收入的
    C.收入最高的那的家庭年收入总和超过全部家庭年收入总和的
    D.收入最低的那的家庭年收入总和超过全部家庭年收入总和的
    【答案】C
    【解析】设所有家庭年收入总和为100,共有5n个家庭,则所有家庭的平均收入为,
    选项A,第四组、第五组家庭的平均收入均超过,故极有可能第四组、第五组全部的家庭的收入均超过全部家庭的年平均收入,虽第三组家庭平均年收入为,由于按年收入从低到高的顺序排列,故仍有可能存在部分家庭年收入超过,这样家庭年收入超过的比率有可能超过,故A选项不正确;
    选项B,收入最低的那的家庭平均年收入,为全部家庭平均收入的,故选项B不正确;
    选项C,收入最高的那的家庭数应为第四组一半家庭数与第五组家庭数的和,由于按年收入从低到高的顺序排列,故总收入大于,收入最高的那的家庭年收入总和超过全部家庭年收入总和的,选项C正确;
    选项D,收入最低的那的家庭数应为第三组家庭数的一半与第一、二组家庭数的和,由于按年收入从低到高的顺序排列,故总收入小于,收入最低的那的家庭年收入总和不会超过全部家庭年收入总和的,选项D不正确.故选C.
    19.折线图
    折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势.折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布.另外,在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来.所以,折线图常用来分析数据随时间的变化趋势,也可用来分析多组数据随时间变化的相互作用和相互影响.例如可用来分析某类商品或是某几类相关的商品随时间变化的销售情况,从而进一步预测未来的销售情况.在折线图中,一般x轴用来表示时间的推移,并且间隔相同;而y轴代表不同时刻的数据的大小.
    【对点训练19】(多选)“十三五”期间,中国科技事业取得历史性成就、发生历史性变革.为提高产品质量,某企业积极推行新工艺,质检部门统计了使用新工艺后前10个月(记月份编号依次1,2,…,10)该企业优等品的月产量(单位:件)与该企业A车间优等品的月产量,得到如图所示的折线图,则下列判断正确的是( )

    A.第4个月该企业生产的优等品中A车间优等品占比不超过
    B.这10个月该企业及A车间优等品的月产量均呈递增趋势
    C.与第5个月相比,第9个月该企业优等品的月产量增加了97件
    D.第9个月该企业及A车间优等品月产量的增长率均大于第8个月优等品月产量的增长率
    【答案】BC
    【解析】对于A,第4个月该企业生产的优等品中A车间优等品占比为,,故A错误;
    对于B,这10个月该企业及A车间优等品的月产量均呈递增趋势,故B正确;
    对于C,与第5个月相比,第9个月该企业优等品的月产量增加了(件),故C正确;
    对于D,第9个月该企业及A车间优等品月产量的增长率分别为,,第8个月该企业及A车间优等品月产量的增长率分别为,,故D错误.故选BC
    20.频率分布折线图和总体密度曲线
    (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
    (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
    【对点训练20】(多选)如图给出的是某高校土木工程系大四55名学生期末考试专业成绩的频率折线图,其中组距为10,且本次考试中最低分为50分,最高分为100分.根据图中所提供的信息,下列结论中正确的是( )

    A.成绩是75分的人数为20
    B.成绩是100分的人数比成绩是50分的人数多
    C.成绩落在内的人数为35
    D.成绩落在内的人数为20
    【答案】CD
    【解析】成绩落在内的人数为,不能说成绩是75分的人数为20,所以A错误,D正确;从频率折线图看不出成绩是100分的人数比成绩是50分的人数多,只能看出成绩落在内的人数和成绩落在内的人数相等,所以B错误;成绩落在内的人数为,所以C正确.故选CD.
    二、跟踪检测
    一、单选题
    1.(2021云南昆明高三月考)袋中装有若干完全相同的球,从中任取10个,做上标记放回,摇晃均匀后,再取出30个球,其中有标记的球有2个,根据以上数据,可估计袋中球的个数为( )
    A.30 B.60 C.100 D.150
    【答案】D
    【解析】设袋子中球的个数为,所以.所以袋子中有150个球.
    故选D
    2.(2021河北保定高三期中)中国互联网络信息中心(CNNIC)发布了第46次《中国互联网络发展状况统计报告》,报告公布了截至2020年6月的中国互联网状况数据与对比数据,根据下图,下面结论不正确的是( )

    A.2020年6月我国网民规模接近9.4亿,相比2020年3月新增网民3625万
    B.2020年6月我国互联网普及率达到67%,相比2020年3月增长2.5%
    C.2018年12月我国互联网普及率不到60%,经过半年后普及率超过60%
    D.2018年6月我国网民规模比2017年6月我国网民规模增加的百分比大于7%
    【答案】D
    【解析】对A,由图可知,新增网民数为:万,正确;
    对B,读图可直接判断正确;对C,读图可直接判断正确;
    对D,2018年6月我国网民规模比2017年6月我国网民规模增加的比例为:
    ,故D错误.故选D
    3.(2021上海市建平中学高三期中)高三年级有名同学参加男子百米竞赛,预赛成绩各不相同,要取前名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道名同学成绩的( )
    A.平均数 B.众数 C.中位数 D.方差
    【答案】C
    【解析】共名同学参加百米竞赛,则成绩的中位数为排名第的同学的成绩,
    若要判断自己是否能进入决赛,只需知道名同学成绩的中位数.故选C.
    4.(2021云南师大附中高三月考)某校高三年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:
    成绩
    [80,90]
    (90,100]
    (100,110]
    (110,120]
    (120,130]
    (130,140]
    (140,150]
    频数
    30
    40
    15
    12
    12
    5
    2
    则以上考生成绩的中位数( )
    A.在(90,100]内 B.在(100,110]内
    C.在(110,120]内 D.在(120,130]内
    【答案】A
    【解析】由表知,考生共有30+(人),在,内有30人,在内有40人,所以及格的所有考生成绩的中位数在,内.故选A.
    5.(2021·天津·南开中学高三月考)在“双11”促销活动中,某网店在11月11日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为42万元,则9时到11时的销售额为( )

    A.9万元 B.18万元 C.24万元 D.30万元
    【答案】D
    【解析】根据频率分布直方图知,12时到14时的频率为0.35,9时到11时的频率为,所以9时到11时的销售额为:(万元).
    故选D
    6.(2021·黑龙江大庆高三月考)某团支部随机抽取甲乙两位同学连续期“青年大学习”的成绩(单位:分),得到如图所示的成绩茎叶图,关于这期的成绩,则下列说法正确的是( )

    A.甲成绩的中位数为
    B.乙成绩的极差为
    C.甲乙两人成绩的众数相等
    D.甲成绩的平均数高于乙成绩的平均数
    【答案】A
    【解析】对A,根据茎叶图可得甲成绩的中位数为32,故A正确;
    对B,乙同学的成绩最高为52,最低为10,所以极差为,故B错误;
    对C,由茎叶图可知甲同学成绩的众数为32,乙同学的成绩的众数为42,不相等,故C错误;
    对D,因为甲成绩的平均数为,乙成绩的平均数为,,故D错误.
    故选A.
    7.(2021河南高三月考)2021年,小李老师的亲戚准备购买一辆新的卡车用来跑运输,可选的车型主要有种.分别为,,,,现在有个指标:维修期限,百升汽油里数,最大载重吨数,价格,可能性,灵敏性来衡量,其中可靠性和灵敏性为评分,如下表.为了统一标准用来分析比较,小李老师将数据做了以下处理:.(表示第行第列的原始数据,表示第行第列的原始数据处理后的数据,表示第列的原始数据)



































    如果用综合指标来做标准,则的综合指标为( )
    A. B. C. D.
    【答案】D
    【解析】根据题意可得,的各项指标分别为,,,,,所以的综合指标.
    故选.
    8.某校为了解学生学习数学的情况,采用分层抽样的方法从高一人、高二人、高三人中,抽取人进行问卷调查,则高一、高二、高三抽取的人数分别是( )
    A.,, B.,, C.,, D.,,
    【答案】B
    【解析】由题意可知,三个年级共有(人),
    则高一抽取的人数为,
    高二抽取的人数为,
    高三抽取的人数为.故选B.
    9.某校的男生、女生人数之比为2:3,按照男女比例通过分层抽样的方法抽到一个样本,样本中男生和女生每天运动时间的平均数分别为100 min和80 min,估计该校全体学生每天运动时间的平均数为( )
    A.98 min B.90 min C.88 min D.85 min
    【答案】C
    【解析】
    由题意,不妨设男生人数为,女生人数为,估计该校全体学生每天运动时间的平均数为(min).故选C.
    10.(2021河南高三月考)茶叶源于中国,至今中国仍然是茶叶最大生产国,下图为年全球主要茶叶生产国调查数据.
    年全球主要茶叶生产国产量分布

    根据该图,下列结论中不正确的是( )
    A.年图中个国家茶叶产量的中位数为
    B.年图中个国家茶叶产量比年增幅最大的是中国
    C.年图中个国家茶叶总产量超过年
    D.年中国茶叶产量超过其他个国家之和
    【答案】B
    【解析】图中,2019年的数据中间的一个是45.9,A正确;
    2020年图中个国家茶叶产量比年增幅最大的是肯尼亚,B错;
    2020年图中个国家茶叶总产量比年总产量的差是,
    C正确;
    年图中,D正确,故选B.
    11.(2022江苏高三专题练习)在发生某公共卫生事件期间,我国有关机构规定:该事件在一段时间没有发生规模群体感染的标志为“连续天每天新增加疑似病例不超过人”.根据过去天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )
    A.甲地总体均值为,中位数为 B.乙地总体均值为,总体方差大于
    C.丙地中位数为,众数为 D.丁地总体均值为,总体方差为
    【答案】D
    【解析】对于A:平均数和中位数不能限制某一天的病例超过7人,
    反例:、、、、、、、、、,满足中位数为,均值为,
    与题意矛盾,A不正确;
    对于B:当总体方差大于0,不知道总体方差的具体数值,因此不能确定数据的波动大小,
    反例:、、、、、、、、、,满足均值为,方差大于,
    与题意矛盾,B不正确;
    对于C:中位数和众数也不能限制某一天的病例超过7人,
    反例:、、、、、、、、、,满足中位数为,众数为,
    与题意矛盾,C不正确;
    对于D:将个数由小到大依次记为、、、、、、、、、,
    假设,若均值为,则方差为,
    矛盾,故,
    假设不成立,故丁地没有发生规模群体感染,D正确.故选D.
    12.(2021陕西·西安中学高三期中)某经济开发区经过五年产业结构调整和优化,经济收入比调整前翻了两翻,为了更好的了解该开发区的经济收入变化情况,统计了该开发区产业结构调整前后的经济收入构成比例,得到如图所示的饼状图,则下列选项正确的是( )

    ①产业结构调整后节能环保的收入与调整前的总收入一样多
    ②产业结构调整后科技研发的收入增幅最大
    ③产业结构调整后纺织服装收入相比调整前有所降低
    ④产业结构调整后食品加工的收入超过调整前纺织服装的收入
    A.②③ B.③④ C.①②③ D.①②④
    【答案】D
    【解析】设产业结构调整前的经济收入为,则产业结构调整后的经济收入为,
    产业结构调整后节能环保的收入为,所以产业结构调整后节能环保的收入与调整前的总收入一样多,所以①正确;
    产业结构调整前科技研发的收入为,产业结构调整后科技研发的收入为,所以选项②正确;
    产业结构调整前纺织服装收入为,产业结构调整后纺织服装收入为,所以③错误;
    产业结构调整后食品加工的收入为,而产业结构调整前纺织服装收入为,所以④正确.
    故选D.
    二、多选题
    13.(2022江苏高三专题练习)从某地区中小学生中抽取部分学生,进行肺活量调查.经了解,该地区小学、初中、高中三个学段学生的肺活量有较大差异,而同一学段男女生的肺活量差异不大.在下面的抽样方法中,不合理的抽样方法是( )
    A.抽签法 B.按性别分层随机抽样
    C.按学段分层随机抽样 D.随机数法
    【答案】ABD
    【解析】∵小学、初中、高中三个学段学生的肺活量有较大差异,
    ∴ 学段对统计结果影响较大;
    ∵同一学段男女生肺活量差异不大 ,
    ∴性别对统计结果无明显影响;
    ∴最合理的抽样方法是按学段分层随机抽样
    故选ABD
    14.(2021江苏南京高三开学考试)房地产市场与城市经济发展密切相关,更与百姓的生活密切相关.按照房地产市场经济理论,房屋销售量与房价有密切关系.下图是某城市过去一年中七个楼盘的新房成交均价与成交面积折线图,则下列结论中正确的是( )

    A.这七个楼盘中,每个楼盘的成交均价都在[88.8,120.0]内
    B.这七个楼盘中,楼盘2的成交总额最大
    C.这七个楼盘﹐成交面积的平均值低于200
    D.这七个楼盘,成交面积与成交均价呈负相关
    【答案】BD
    【解析】对于A:由楼盘的楼盘的成交均价低于88.8,故A错误;
    对于B:楼盘1的成交总额为:万元,
    楼盘2的成交总额为:万元,
    楼盘3的成交总额为:万元,
    楼盘4的成交总额为:万元,
    楼盘5的成交总额为:万元,
    楼盘6的成交总额为:万元,
    楼盘7的成交总额为:万元,所以这七个楼盘中,楼盘2的成交总额最大,故B正确;
    对于C:成交面积的均值,故C错误;
    对于D:个楼盘整体呈现均价越低,则成交面积越大的趋势,D正确.
    故选BD.
    15.数据,,…,的平均数为,方差为,数据,,…,的平均数为,方差为,若为不等于0的常数,,,…,则下列说法正确的是( )
    A. B. C. D.
    【答案】BC
    【解析】由于,所以,且.故选BC
    16.(2021广东广雅中学高三月考)小张一星期的总开支分布如图①所示,一星期的食品开支如图②所示,则以下说法正确的是( )

    A.储蓄金额为300元 B.日常开支比食品中的其他开支多150元
    C.娱乐开支比通信开支多50元 D.肉类开支占总开支的
    【答案】ABC
    【解析】由食品开支图,可知食品开支有元,所以一星期的总开支元,其中储蓄金额为元,故A正确;
    日常开支为元,故日常开支比食品中的其他开支多150元,故B正确;
    娱乐开支比通信开支多元,故C正确;
    肉类开支占总开支的,故D错误;故选ABC
    17.(2021重庆九龙坡高三期中)创新,是一个民族进步的灵魂,是一个国家兴旺发达的不竭源泉.为支持“中小企业”创新发展,国家决定对部分创新型企业的税收进行适当减免,现在全国调查了100家中小企业年收入情况,并根据所得数据画出了样本的频率分布直方图,则下面结论正确的是( )

    A.年收入在万元的中小企业约有16家
    B.样本的中位数大于400万元
    C.估计当地中小型企业年收入的平均数为376万元
    D.样本在区间内的频数为18
    【答案】CD
    【解析】由直方图知:,可得,
    ∴万元的中小企业有家,A错误;
    由图知:前三组的频率,易知中位数在区间,B错误;
    由图知:当地中小型企业年收入的平均数万元,C正确;
    内,D正确.故选CD
    18.下面是国家统计局2021年2月公布的国民经济和社会发展统计公报的部分内容:

    下面对图表数据理解正确的是( )
    A.2016-2020年国内生产总值持续增长
    B.2020年第一产业增加值不超过80000亿元
    C.2020年第三产业增加值相比2019年增长率大于4%
    D.分析2016-2020年三次产业增加值,可知这5年内第三产业平均增长速度最快
    【答案】ABD
    【解析】A选项,由图1可知正确;
    B选项,2020年第一产业增加值为 1015986×7.7%≈78231亿元,小于80000亿元,正确;
    C 选项,2020年第三产业相比2019年增长率,错误;
    D选项,分析 2016—2020 年三次产业增加值可知,第三产业增加值占国内生产总值比重由52.4%持续增长到54.5%;增长幅度最大,而第一产业和第二产业增加值占国内生产总值比重都有所下降,D正确.故选ABD.
    三、填空题
    19.(2021陕西·武功县高三开学考试)满分为100分的测试卷,60分为及格线.若100人参加测试,将这100人的卷面分数按照,,…,分组后绘制的频率分布直方图如图所示,由于及格人数较少,某老师准备将每位学生的卷面得分采用“开方乘以10取整”的方法进行换算以提高及格率(实数a的取整等于不超过a的最大整数).如:某位学生卷面49分,则换算成70分作为他的最终考试成绩.则按照这种方式,这次测试的不及格的人数变为___________人.

    【答案】18
    【解析】设考生实际得分为,若经过换算后还是不及格,则,
    于是,,即小于分的同学,换算后仍不及格.
    根据直方图,即小于分的同学有.
    20.(2022江苏高三专题练习)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标.常用区间,内的一个数来表示,该数越接近10表示满意度越高.甲、乙两位同学分别随机抽取10位本地市民调查他们的幸福感指数,甲得到十位市民的幸福感指数为5,6,6,7,7,7,7,8,8,9,乙得到十位市民的幸福感指数的平均数为8.方差为2.2,则这20位市民幸福感指数的方差为___________
    【答案】1.95
    【解析】设乙得到的十位市民的幸福感指数分别为,,,,
    甲得到的十位市民的幸福感指数分别为,,,,
    由平均数为8,知,
    所以这20位市民的幸福感指数之和为,平均数为.
    由方差定义,乙所得数据的方差,
    由于,解得,
    因为甲得到十位市民的幸福感指数为5,6,6,7,7,7,7,8,8,9,
    所以,
    所以这20位市民的幸福感指数的方差为
    .
    21.(2021北京清华附中模拟预测)下图是国家统计局发布的2020年2月至2021年2月全国居民消费价格涨跌幅折线图.

    说明:(1)在统计学中,同比是指本期统计数据与上一年同期统计数据相比较,例如2021年2月与2020年2月相比较:环比是指本期统计数据与上期统计数据相比较,例如2020年4月与2020年3月相比较.
    (2)同比增长率环比增长率.
    给出下列四个结论:
    ①2020年11月居民消费价格低于2019年同期;
    ②2020年3月至7月居民的消费价格持续增长;
    ③2020年3月的消费价格低于2020年4月的消费价格;
    ④2020年7月的消费价格低于2020年3月的消费价格.
    其中所正确结论的序号是____________.
    【答案】①④
    【解析】①:由国居民消费价格涨跌幅折线图可知:同比增长率为,由题中说明所给同比增长率定义可知:2020年11月居民消费价格低于2019年同期,故本结论正确;
    ②:由国居民消费价格涨跌幅折线图可知:2020年3月至6月环比增长率为负值,由题中所给的环比增长率定义可知:2020年3月至6月居民的消费价格持续下降,所以本结论不正确;
    ③:设2020年3月的消费价格为,2020年4月的消费价格为,
    根据题中所给的环比增长率公式可得:,
    所以,因此本结论不正确;
    ④:设2020年5月的消费价格为,2020年6月的消费价格为,2020年7月的消费价格为,
    根据题中所给的环比增长率公式可得:
    ,,
    ,所以,因此本结论正确;
    四、解答题
    22.(2021重庆市第七中学校高三期中)年月,习近平总书记对制止餐饮浪费行为作出重要指示,要求进一步加强宣传教育,切实培养节约习惯,在全社会营造浪费可耻、节约光荣的氛围.为贯彻总书记指示,大庆市某学校食堂从学生中招募志愿者,协助食堂宣传节约粮食的相关活动.现已有高一人,高二人,高三人报名参加志愿活动.根据活动安排,拟采用分层抽样的方法,从已报名的志愿者中抽取名志愿者,参加为期天的第一期志愿活动.
    (1)第一期志愿活动需从高一、高二、高三报名的学生中各抽取多少人?
    (2)现在要从第一期志愿者中的高二、高三学生中抽取人去粘贴宣传标语,设这人中含有高二学生人,求随机变量的分布列和期望;
    (3)食堂每天约有人就餐,其中一组志愿者的任务是记录学生每天倒掉的剩菜剩饭的重量(单位:公斤),以天为单位来衡量宣传节约粮食的效果.在一个周期内,这组志愿者记录的数据如下:
    前天剩菜剩饭的重量为:;
    后天剩菜剩饭的重量为:,
    借助统计知识,分析宣传节约粮食活动的效果.
    【解析】(1)报名的学生共有126人,抽取的比例为,
    所以高一抽取人,高二抽取人,高三抽取人.
    (2)
    随机变量X的取值为2,3,4,
    ,,.
    所以随机变量X的分布列为

    2
    3
    4





    (3)


    所以前10天的平均值为,后10天的平均值为,且,
    所以宣传节约粮食活动的效果很好
    23.(2021广西·南宁市东盟中学模拟预测)某城市计划兴建一座至多安装3台污水处理设备的城市污水处理厂,根据过去统计资料显示,污水每天需处理量X(单位:万立方米)都在[20,80]之间,现统计了过去一个月每天需处理的污水量(单位:万立方米),其频率分布直方图如图:

    污水处理厂希望安装的设备尽可能运行,但每天设备最多可运行台数受每天需处理的污水量X限制并有如下关系:
    每天污水量X



    设备最多可运行台数ξ
    1
    2
    3
    将每天污水量在以上三段的频率作为相应段的概率,
    (1)根据直方图,估计每天需处理污水量的平均值;
    (2)若某台设备运行,则该台设备每天产生利润5万元;若某台设备未运行,则该台设备每天亏损0.8万元.设某一天污水处理厂的利润为Y(单位:万元),当安装3台设备时,写出Y的所有可能值,并估计Y>8的概率;
    【解析】(1),
    可以估计每天需处理污水量的平均值为45.8万立方米
    (2)当时,,

    当时,,;
    当时,,;
    所以Y的所有可能值为3.4、9.2、15;
    可以估计
    24.(2021重庆西南大学附中高三月考)在“十三五”期间,我国的扶贫工作进入了“精准扶贫”阶段.到2020年底,全国830个贫困县全部脱贫摘帽,最后4335万贫困人口全部脱贫,这是我国脱贫攻坚史上的一大壮举.重庆市奉节县作为国家贫困县之一,于2019年4月顺利脱贫摘帽.因地制宜发展特色产业,是奉节脱贫攻坚的重要抓手.奉节县规划发展了以高山烟叶、药材、反季节蔬菜;中山油橄榄、养殖;低山脐橙等为主的产业格局,各类特色农产品已经成为了当地村民的摇钱树.尤其是奉节脐橙,因“果皮中厚、脆而易剥,肉质细嫩化渣、无核少络,酸甜适度,汁多爽口,余味清香”而闻名.为了防止返贫,巩固脱贫攻坚成果,各职能部门对脐橙种植、销售、运输、改良等各方面给予大力支持.已知脐橙分类标准:果径为一级果,果径为二级果,果径或以上为三级果.某农产品研究所从种植园采摘的大量奉节脐橙中随机抽取1000个,测量这些脐橙的果径(单位:),得到如图所示的频率分布直方图.

    (1)试估计这1000个奉节脐橙的果径的中位数;
    (2)在这1000个脐橙中,按分层抽样的方法在果径中抽出9个脐橙,为进一步测量其他指标,在抽取的9个脐橙中再抽出3个,求抽到的一级果个数的分布列与数学期望;
    (3)以样本估计总体,用频率代替概率,某顾客从种植园的这批脐橙中随机购买100个,其中一级果的个数为,记一级果的个数为的概率为,写出的表达式,并求出当为何值时,最大?
    【解析】(1)果径的频率为,
    果径的频率为,
    故果径的中位数在,不妨设为,则,
    解得中位数.
    (2)果径,,的频率之比为,
    所以分层抽样过程中,一级果、二级果、三级果个数分别为4,3,2个,
    故随机变量,




    所以的分布列为

    0
    1
    2
    3





    期望.
    (3)这批果实中一级果的概率,每个果实相互独立,则,
    则,题目即求为何值时,最大,
    令,解得,
    故当时,,即…,当时,,即…,所以,
    即一级果的个数最有可能为30个.


    相关试卷

    清单39 抽样方法与总体分布的估计(原卷版)-2022年新高考数学一轮复习知识方法清单与跟踪训练:

    这是一份清单39 抽样方法与总体分布的估计(原卷版)-2022年新高考数学一轮复习知识方法清单与跟踪训练,共20页。试卷主要包含了知识与方法清单,跟踪检测,填空题,解答题等内容,欢迎下载使用。

    清单33 抛物线(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练:

    这是一份清单33 抛物线(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练,共31页。试卷主要包含了知识与方法清单,跟踪检测,填空题,解答题等内容,欢迎下载使用。

    清单32 双曲线(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练:

    这是一份清单32 双曲线(解析版)-2022年新高考数学一轮复习知识方法清单与跟踪训练,共31页。试卷主要包含了知识与方法清单,跟踪检测,填空题,解答题等内容,欢迎下载使用。

    欢迎来到教习网
    • 900万优选资源,让备课更轻松
    • 600万优选试题,支持自由组卷
    • 高质量可编辑,日均更新2000+
    • 百万教师选择,专业更值得信赖
    微信扫码注册
    qrcode
    二维码已过期
    刷新

    微信扫码,快速注册

    手机号注册
    手机号码

    手机号格式错误

    手机验证码 获取验证码

    手机验证码已经成功发送,5分钟内有效

    设置密码

    6-20个字符,数字、字母或符号

    注册即视为同意教习网「注册协议」「隐私条款」
    QQ注册
    手机号注册
    微信注册

    注册成功

    返回
    顶部
    Baidu
    map