![高一数学分层训练AB卷(人教A版2019必修第二册)第九章统计(知识通关详解)【单元测试卷】(原卷版+解析)第1页](http://img-preview.51jiaoxi.com/3/3/16143170/0-1725680843923/0.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![高一数学分层训练AB卷(人教A版2019必修第二册)第九章统计(知识通关详解)【单元测试卷】(原卷版+解析)第2页](http://img-preview.51jiaoxi.com/3/3/16143170/0-1725680843967/1.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
![高一数学分层训练AB卷(人教A版2019必修第二册)第九章统计(知识通关详解)【单元测试卷】(原卷版+解析)第3页](http://img-preview.51jiaoxi.com/3/3/16143170/0-1725680844008/2.jpg?x-oss-process=image/resize,w_794,m_lfit,g_center/sharpen,100)
所属成套资源:高一数学分层训练AB卷(人教A版2019必修第二册)【单元测试AB卷】(原卷版+解析)
高一数学分层训练AB卷(人教A版2019必修第二册)第九章统计(知识通关详解)【单元测试卷】(原卷版+解析)
展开
这是一份高一数学分层训练AB卷(人教A版2019必修第二册)第九章统计(知识通关详解)【单元测试卷】(原卷版+解析),共50页。
第九章统计(知识通关详解)1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.例1:1.从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按、、、进行编号,然后从随机数表第一行的第列和第列数字开始往右依次选取两个数字,则选出的第个同学的编号为( )(注:表中的数据为随机数表第一行和第二行)A. B. C. D.2.我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A.133石 B.159石 C.336石 D.168石举一反三1.为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是( )A.100 B.100名学生C.100名学生的学习情况 D.600名学生的学习情况2.(多选)对于简单随机抽样,下列说法正确的是( )A.它要求被抽取样本的总体的个体数有限B.它是从总体中逐个进行抽取的,在实践中操作起来也比较方便C.它是一种有放回的抽样D.它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公平性3.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第7列和第8列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.第1行:78 16 62 32 08 02 62 42 01 52 53 69 97 28 01 98第2行:32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 812.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.分层抽样的步骤(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.例2.1.某地区有高中生人,初中生有人,小学生人,此地区教育部门为了了解本地区中小学生的近视情况及形成原因,要从本地区的中小学生中抽取部分学生进行调查,已知抽取的高中生人数为人,则该地区教育部门共抽取了人进行调查( )A. B.C. D.2.某工厂有男员工56人,女员工42人,用分层抽样的方法,从全体员工中抽出一个容量为28的样本进行工作效率调查,其中男员工应抽的人数为( )A.16 B.14 C.28 D.12举一反三1.为了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )A.总体指的是该市参加升学考试的全体学生B.个体指的是名学生中的每一名学生C.样本容量指的是名学生D.样本是指名学生的数学升学考试成绩2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民,对其该天的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本4.获取数据的途径普查:指一个国家或一个地区专门组织的一次大规模的全面调查.普查:对象很少时;抽样:按照一定的方法从调查对象中抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断.抽样:对象很多,或检验对象具有破坏性.例3:1.从某地参加计算机水平测试的5000名学生的成绩中抽取200名学生的成绩进行统计分析,在这个问题中,200名学生的成绩是( )A.总体 B.个体C.从总体中所取的一个样本 D.总体的容量2.下列调查中属于抽查的是( )①每隔10年进行一次人口普查;②某商品的质量优劣;③某报社对某个事情进行舆论调查;④高考考生的身体检查.A.②③ B.①④ C.③④ D.①②举一反三1.下列说法不正确的是( )A.普查是要对所有的对象进行调查B.样本不一定是从总体中抽取的,没抽取的个体也是样本C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,则要耗费大量的人力、物力和财力D.普查不是在任何情况下都能实现的2.某市为了调研全市10800名高一学生期中考试的答题习惯,共轴取25袋答题卡,每袋都装有30份答题卡,则本次抽样的样本量是________________.频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(3)在频率分布直方图中,纵轴表示eq \f(频率,组距),数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.例4.1.某中学举行了一次“网络信息安全”知识竞赛,将参赛的100名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )A.15名 B.20名 C.25名 D.40名2.为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )A.频率分布直方图中的值为0.004B.估计这20名学生考试成绩的第60百分位数为75C.估计这20名学生数学考试成绩的众数为80D.估计总体中成绩落在内的学生人数为150举一反三1.某学校组织学生参加数学测试,某班成绩的频率分布直方图如下图,数据的分组依次为,,,.若不低于60分的人数是35人,则该班的学生人数是( )A.45 B.50 C.55 D.602.一个容量为100的样本,其数据的分组与各组的频数如下:则样本数据落在[10,40)上的频率为( )A.0.13 B.0.39C.0.52 D.0.64二、其它统计图扇形统计图用整个圆的面积表示总数,用圆的一部分的扇形面积表示各部分占总数的百分数,这样的统计图称“扇形统计图”.又称“百分比较图”或“圆形图”.该图可清楚地表示各部分同总数间的关系.条形统计图用一个单位长度表示一定的数量,并根据各个数量的多少画出长短不同而宽度相同的直条,然后把这些直条按照一定的顺序排列起来所构成的统计图.条形统计图一般简称“条形图”,也叫“长条图”、“直条图”.条形图可画成竖条,也可画成横条.从条形统计图可直观地看出各个数量的多少.折线统计图用一个单位长度表示一定的数量,根据所统计的数量的多少,依一定的次序,描出相应的各点,然后把各点用线段顺次连结成一条折线,这样的统计图称为“折线统计图”.折线统计图的纵、横向的单位长度可相等,也可不等.从图中折线的每条线段的上升或下降以及它的倾斜度,可清楚地看出数量的增减变化的幅度或发展趋势.制图步骤制作条形统计图的步骤是:1.根据统计资料整理数据.2.作图定标尺.先画纵轴,确定一定的比例(即标尺),作为长度单位;再画横轴,纵、横轴的长短要适中.3.画直条.条形的宽度、间隔要一致.4.写上条形统计图的总标题、制图日期及数量单位.制作折线统计图的步骤是:1.根据统计资料整理数据.2.先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.3.根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.制作扇形统计图的步骤是:1.根据统计资料,整理或计算出必要的数据(包括部分占整体的百分数).2.根据数据,算出各部分扇形圆心角的度数.3.根据需要,取适当的半径画圆,用量角器依次按圆心角把圆分成几个扇形.4.标上每部分的内容及占总体的百分数.用虚线、实线或不同颜色将各部分区分开来.例5:1.在“万众创业”的大背景下,“直播电商”已经成为我国当前经济发展的新增长点,已知某电商平台的直播间经营化妆品和食品两大类商品,2022年前三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则( )A.该直播间第三季度总收入是第一季度总收入的3倍;B.该直播间第三季度化妆品收入是第一季度化妆品收入的6倍;C.该直播间第三季度化妆品收入是第二季度化妆品收入的3倍;D.该直播间第三季度食品收入低于前两个季度的食品收入之和.2.据统计,我国牛、羊肉集贸市场价格在2019年波动幅度较大,2020年开始逐渐趋于稳定.如下图分别为2019年1月至2020年3月,我国牛肉、羊肉集贸市场月平均价格大致走势图,下列说法不正确的是( )A.2019年1月至2020年3月,牛肉与羊肉月平均价格的涨跌情况基本一致B.2019年3月开始至当年末,牛肉与羊肉的月平均价格都一直持续上涨C.2019年7月至10月牛肉月平均价格的平均增量高于2020年1至2月的增量D.同期相比,羊肉的月平均价格一定高于牛肉的月平均价格举一反三1.某学校对间学生公寓的卫生情况进行综合评比,依考核分数分为,,,四个等级.其中分数在的为等级;分数在的为等级;分数在的为等级;分数在的为等级.考核评估后,得其频率折线图如图所示,估计这间学生公寓评估得分为等级,的比评估得分为等级,的多( )A.间 B.间C.间 D.间2(多选).十项全能是田径运动中全能项目的一种,是由跑、跳、投等个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图,这是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是( ) A.在米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大百分位数:如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如,处于p%位置的值称第p百分位数。计算步骤下面的步骤来说明如何计算第p百分位数。第1步:以递增顺序排列原始数据(即从小到大排列)。第2步:计算指数i=np%第3步:l)若 i 不是整数,将 i 向上取整。大于i的毗邻整数即为第p百分位数的位置。2) 若i是整数,则第p百分位数是第i项与第(i+l)项数据的平均值。除了以上方法,再介绍另外一种方法,这种方法是SPSS所用方法,也是SAS所用方法之一。第一步:将n个变量值从小到大排列,X(j)表示此数列中第j个数。第二步:计算指数,设(n+1)P%=j+g,j为整数部分,g为小数部分。第三步:1)当g=0时:P百分位数=X(j);2)当g≠0时:P百分位数=g*X(j+1)+(1-g)*X(j)=X(j)+g*[X(j+1)-X(j)]。例6:1.(多选)中央广播电视总台《2023年春节联欢晩会》以温暖人心的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华人送上了一道红红火火的文化大䝳.某机构随机调查了18位观众对2023年春晩节目的满意度评分情况,得到如下数据:.若恰好是这组数据的上四分位数,则的值可能为( )A.83 B.84 C.85 D.872.棉花的纤维长度是棉花质量的重要指标,在一批棉花中随机抽到50根棉花的纤维长度(单位:mm),按从小到大排序结果如下:28 33 50 52 58 60 61 62 82 86 113 140 143 146 170 175202 206 233 236 238 260 263 264 265 293 294 296 301 302 303305 306 321 323 325 328 340 343 346 348 352 355 357 357358 370 380 383 385.请你估算这批棉花的第90百分位数是____________.举一反三1.某校学生参与“保护地球”知识问答活动,满分20分,根据学生的作答成绩绘制的频率分布直方图如图所示,请据此估计学生成绩的第60百分位数为___________.2.一组数的分位数指的是满足下列条件的一个数值:至少有的数据不大于该值,且至少有的数据不小于该值.直观来说,一组数的分位数指的是,将这组数按照从小到大的顺序排列后,处于位置的数.例如:中位数就是一个50%分位数.2023年3月,呼和浩特市为创建文明城市,随机从某小区抽取10位居民调查他们对自己目前生活状态的满意程度,该指标数越接近10表示满意程度越高.他们的满意度指标数分别是8,4,5,6,9,8,9,7,10,10,则这组数据的分位数是________.3.近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是.我国成人的BMI数值标准为:为偏瘦,为正常,为偏胖,为肥胖.为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,利用分层抽样得到15名员工的BMI数据如下:23.5,21.6,30.6,22.1,23.7,20.6,25.5,23.9,20.8,21.5,21.8,18.2,25.2,21.5,19.1.则该组数据的第70百分位数为______________.中位数、众数、平均数众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数中位数----把n个数据按大小顺序排列,处于最中间位置的一个数据(或)叫做这组数据的中位数(median).中位数则仅与数据排列位置有关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数)。平均数: 一般地,如果n个数 ,那么, 叫做这n个数的平均数例7:1.如图所示的表格记录了高三(1)班第一组和第二组各五名学生在一次英语听力测试训练中的成绩(单位:分),若这两组数据的中位数均为15,平均值相等,则( )A.36 B.6 C.26 D.162.沙糖桔网店2019年全年的月收支数据如图所示,则针对2019年这一年的收支情况,下列说法中错误的是( )A.月收入的最大值为90万元,最小值为30万元 B.这一年的总利润超过400万元C.这12个月利润的中位数与众数均为30 D.7月份的利润最大3.郑州地铁1号线的开通运营,极大方便了市民的出行.某时刻从二七广场站驶往博学路站的过程中,10个车站上车的人数统计如下:70,60,60,60,50,40,40,30,30,10.这组数据的平均数,众数,90%分位数的和为( )A.125 B.135 C.165 D.170举一反三1.下图为2021年上半年中国火锅消费频率扇形图及地域分析条形图根据所给统计图,下列结论中不正确的是( )A.2021年上半年中国消费者每天都要吃火锅的占比为5.0%B.2021年上半年中国消费者每月都要吃火锅的超过70%C.2021年上半年西南与华东地区消费者每周吃两次及以上的超过70%D.2021年上半年七个区域中国消费者每周吃两次及以上频率的平均数超过25%2.将某射击运动员的十次射击成绩(环数)按从小到大的顺序(相等数据相邻排列)排列为:8.1,8.4,8.4,8.7,x,y,9.3,9.4,9.8,9.9,已知总体的中位数为9,则的最小值为__________.3.某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,27,31,36,40,45,50,51,51,58,63,65,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间,,,内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数.(2)用样本估计总体,经销商参考以下两种销售方案进行销售:方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如下表所示:请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.在频率分布直方图中求平均数、中位数、众数众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和例7:1.某校随机抽取100名学生进行“绿色环保知识”问卷测试.测试结果发现这100名学生的得分都在内,按得分情况分成5组:,,,,,得到如图所示的频率分布直方图.则下列说法错误的是( )A.这100名学生得分的中位数是72.5B.这100名学生得分的平均数是72.5C.这100名学生得分小于70分的有50人D.这100名学生得分不小于90分的有5人2.中国共产党建党100周年华诞之际,某社区响应党和国家的号召,通过“增强防疫意识,激发爱国情怀”知识宣讲活动,来回顾中国共产党从成立到发展壮大的心路历程,表达对建党100周年以来的丰功伟绩的传颂.现从参与宣讲者中随机选出200人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则估计参与者的平均年龄为___________岁.(每组数据以区间的中点值为代表)3.年月日是中国共产党百年华诞,习近平总书记七·一的重要讲话在全国掀起学习党史的热潮.某学校为了解该校师生党史的学习情况,用分层抽样的方式从名师生中抽取名师生进行党史知识测试,得到如图所示的频率分布直方图,其中分组的区间为,,,,,则名师生测试成绩的中位数是______.(结果保留整数部分)举一反三1.某班进行了一次数学测试,全班学生的成绩都落在区间内,其成绩的频率分布直方图如图所示,若该班学生这次数学测试成绩的中位数的估计值为,则的值为( )A. B. C. D.2.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为________.3.某高校调查了本校n名大学生每周的自习时间(单位:小时),由调查结果得到如下频数分布表和频率分布直方图,其中自习时间的是,样本数据分组为:(1)分别求出的值;(2)根据频率分布直方图,估计该校大学生自习时间的平均数与中位数.样本方差与标准差设样本的元素为x1,x2,…,xn,样本的平均数为eq \x\to(x),(1)样本方差:s2=eq \f(1,n)[(x1-eq \x\to(x))2+(x2-eq \x\to(x))2+…+(xn-eq \x\to(x))2].(2)样本标准差:s= eq \r(\f(1,n)[(x1-\x\to(x))2+(x2-\x\to(x))2+…+(xn-\x\to(x))2])例8:1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续天,每天新增疑似病例不超过人”根据过去天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体均值为,中位数为B.乙地:总体均值为,总体方差大于C.丙地:中位数为,众数为D.丁地:总体均值为,总体方差为2.小明用某款手机性能测试app对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,95,97,99,已知总体的中位数为90,若要使该总体的标准差最小,则_________.3.已知一组数据,,…,的平均数,方差,则另外一组数据,,…,的平均数为______,方差为______.举一反三1.甲,乙两组数据的频率分布直方图如图所示,两组数据采用相同的分组方法,用和分别表示甲、乙的平均数,,分别表示甲、乙的方差,则( )A., B.,C., D.,2.现有一组数据:1,3,4,6,7,7,21,设中位数为a,众数为b,方差为,则______.3.为了了解某体育院校新生的体能情况,该校随机抽查了名学生,测试1分钟引体向上的成绩(次数),成绩均在内,按次数分成4组,第一组:,第二组:,第三组:,第四组:,得到如图所示的频率分布直方图,已知第一组有5人.(1)求的值;(2)以每组数据的中点值作为该组数据的代表值,估计新生引体向上的成绩的平均数和方差.课外阅读1.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号分段,当eq \f(N,n)(n是样本容量)是整数时,取k=eq \f(N,n);(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.例1.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )A.63 B.64C.65 D.662.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从编号,若第1组抽出的号码为6,则第6组中抽取的号码是( )A.66 B.56 C.46 D.1263.茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.1.甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )A.极差 B.方差C.平均数 D.中位数2.已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,的值分别为().A.2,5 B.5,5 C.5,8 D.8,80347437386369647366146986371629774246292428114572042533237321676获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象借助专业测量设备通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗”数据去伪存真分组[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数1213241516137学生成绩第一组8121526第二组9141826等级一级二级三级四级售价(万元/吨)21.81.51.2自习时间(小时学生人数105080a20第九章统计(知识通关详解)1.简单随机抽样(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.例1:1.从某班名同学中选出人参加户外活动,利用随机数表法抽取样本时,先将名同学按、、、进行编号,然后从随机数表第一行的第列和第列数字开始往右依次选取两个数字,则选出的第个同学的编号为( )(注:表中的数据为随机数表第一行和第二行)A. B. C. D.【答案】D【分析】利用随机数表法可得结果.【详解】从随机数表第一行第列和第列数字开始往右依次选:、、、,选出的第个同学的编号为,故选:D.2.我国古代数学名著《数书九章》中有“米谷粒分”题:粮仓开仓收粮,有人送来米1524石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )A.133石 B.159石 C.336石 D.168石【答案】D【分析】根据254粒内夹谷28粒可得比例,即可解决.【详解】由题意得,这批米内夹谷约为石,故选:D举一反三1.为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是( )A.100 B.100名学生C.100名学生的学习情况 D.600名学生的学习情况【答案】C【分析】直接根据样本的概念得答案.【详解】为了了解某校600名学生的学习情况,随机抽取了100名学生进行调查,在这个问题中样本是100名学生的学习情况.故选:C.2.(多选)对于简单随机抽样,下列说法正确的是( )A.它要求被抽取样本的总体的个体数有限B.它是从总体中逐个进行抽取的,在实践中操作起来也比较方便C.它是一种有放回的抽样D.它是一种等可能抽样,在整个抽样过程中,每个个体被抽到的机会相等,从而保证了这种抽样方法的公平性【答案】ABD【分析】由简单随机抽样的特点逐项分析判断.【详解】对于A:简单随机抽样要求样本的总体个数有项,这样才能保证样本能够很好地代表总体,所以A正确;对于B:由于总体数量是有限的,所以为了让数据具有代表性需要从总体中逐个地进行抽取,以便在抽取实践中进行操作,所以B正确;对于C:在抽样过程中,为了保证抽取的公平性,样本数据是一种不放回的抽样,所以C错误;对于D:在随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑,所以D正确.故选:ABD.3.总体由编号01,02,…,29,30的30个个体组成.利用下面的随机数表选取5个个体,选取方法是从如下随机数表的第1行的第7列和第8列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为__________.第1行:78 16 62 32 08 02 62 42 01 52 53 69 97 28 01 98第2行:32 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81【答案】04【分析】根据随机数表读取编号在01,02,…,29,30之中的,重复的去掉即可求解.【详解】从第1行的第7列和第8列数字开始由左到右依次选取两个数字满足要求的编号有:08,02,01,28,04,23…,所以第5个个体的编号为,04,故答案为:042.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.分层抽样的步骤(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.例2.1.某地区有高中生人,初中生有人,小学生人,此地区教育部门为了了解本地区中小学生的近视情况及形成原因,要从本地区的中小学生中抽取部分学生进行调查,已知抽取的高中生人数为人,则该地区教育部门共抽取了人进行调查( )A. B.C. D.【答案】D【分析】利用分层抽样中的等比例原则即可求总抽取人数.【详解】由地区高中生人,初中生有人,小学生人,设共抽取了人,若抽取的高中生人数为人,根据分层抽样知:,解之得,故选:D2.某工厂有男员工56人,女员工42人,用分层抽样的方法,从全体员工中抽出一个容量为28的样本进行工作效率调查,其中男员工应抽的人数为( )A.16 B.14 C.28 D.12【答案】A【分析】用样本容量乘以男员工所占的比例,即为所求.【详解】男员工所占的比例为,故男员工应抽的人数为,故选:A.【点睛】本题考查分层抽样,重点考查理解,计算能力,属于基础题型.举一反三1.为了解某市高三毕业生升学考试中数学成绩的情况,从参加考试的学生中随机地抽查了名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )A.总体指的是该市参加升学考试的全体学生B.个体指的是名学生中的每一名学生C.样本容量指的是名学生D.样本是指名学生的数学升学考试成绩【答案】D【分析】利用总体、个体、样本和样本容量的定义,逐一判断选项的正误即可.【详解】在本题研究的这个问题中,总体是该市高三毕业生的数学成绩,不是全体学生,个体是指每名学生的成绩,不是每一名学生,样本容量是,不是1000名学生,故ABC错误;了解某市高三毕业生升学考试中学生的数学成绩的情况,因此样本是指随机抽取的这名学生的数学成绩,D正确.故选:D.2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民,对其该天的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本【答案】A【分析】由抽样中总体的概念可得答案.【详解】解:由题意:调查的目的是“了解某地5000名居民某天的阅读时间”,所以“5000名居民的阅读时间”是调查的总体,故选:A.【点睛】本题主要考查抽样中相关知识,属于基础知识的考查,属于基础题.4.获取数据的途径普查:指一个国家或一个地区专门组织的一次大规模的全面调查.普查:对象很少时;抽样:按照一定的方法从调查对象中抽取一部分,进行调查或观测,获取数据,并以此对调查对象的某项指标做出推断.抽样:对象很多,或检验对象具有破坏性.例3:1.从某地参加计算机水平测试的5000名学生的成绩中抽取200名学生的成绩进行统计分析,在这个问题中,200名学生的成绩是( )A.总体 B.个体C.从总体中所取的一个样本 D.总体的容量【答案】C【分析】根据总体,个体,样本,总体容量的概念判断即可解决.【详解】由题知,总体是5000名学生的成绩,个体是每一名学生的成绩,200名学生的成绩是从总体中所取的一个样本,总体的容量为5000.故选:C2.下列调查中属于抽查的是( )①每隔10年进行一次人口普查;②某商品的质量优劣;③某报社对某个事情进行舆论调查;④高考考生的身体检查.A.②③ B.①④ C.③④ D.①②【答案】A【分析】根据普查和抽样调查的概念即可得出结果.【详解】人口普查和高考考生的身体检查都属于普查,调查某商品的质量优劣和对某个事情进行舆论调查只能是抽样调查,故选:A.举一反三1.下列说法不正确的是( )A.普查是要对所有的对象进行调查B.样本不一定是从总体中抽取的,没抽取的个体也是样本C.当调查的对象很少时,普查是很好的调查方式,但当调查的对象很多时,则要耗费大量的人力、物力和财力D.普查不是在任何情况下都能实现的【答案】B【分析】根据普查的概念判断A,根据样本的概念判断B,根据普查的适用条件判断C,根据普查的局限性判断D.【详解】选项A:普查是为特定目的而专门组织的一次性全面调查,要对所有的对象进行调查,说法正确;选项B:样本必须是从总体中抽取的,没抽取的个体不是样本,说法错误;选项C:由于普查需要对所有对象进行调查,所以当调查对象较少时,普查是很好的调查方式,但当调查的对象很多时,则要耗费大量的人力、物力和财力,说法正确;选项D:当调查对象很多,或调查具有破坏性时,不适合用普查,说法正确;故选:B2.某市为了调研全市10800名高一学生期中考试的答题习惯,共轴取25袋答题卡,每袋都装有30份答题卡,则本次抽样的样本量是________________.【答案】750【分析】根据样本量的定义即可得解.【详解】样本量指样本中包含的个体数,所以本次抽样的样本量是.故答案为:.频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(3)在频率分布直方图中,纵轴表示eq \f(频率,组距),数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.例4.1.某中学举行了一次“网络信息安全”知识竞赛,将参赛的100名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )A.15名 B.20名 C.25名 D.40名【答案】B【分析】先根据频率分布直方图的性质,求得的值,再根据样本中成绩在区间内的频率×参赛的100名学生即可求解.【详解】由频率分布直方图可知,得,所以成绩在区间内的学生有名.故选:B.2.为宣传我国第三艘航空母舰“中国人民解放军海军福建舰”正式服役,增强学生的国防意识,某校组织1000名学生参加了“逐梦深蓝,山河荣耀”国防知识竞赛,从中随机抽取20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )A.频率分布直方图中的值为0.004B.估计这20名学生考试成绩的第60百分位数为75C.估计这20名学生数学考试成绩的众数为80D.估计总体中成绩落在内的学生人数为150【答案】D【分析】由频率分布直方图的性质逐一计算即可【详解】由频率分布直方图可得:,解得,故A错误;前三个矩形面积为,即第60百分位数为80,故B错误;估计这二十人的众数为,故C错误;总体中成绩落在内的学生人数为:,故D正确.故选:D举一反三1.某学校组织学生参加数学测试,某班成绩的频率分布直方图如下图,数据的分组依次为,,,.若不低于60分的人数是35人,则该班的学生人数是( )A.45 B.50 C.55 D.60【答案】B【分析】根据频率分布直方图计算的频率,然后根据不低于60分的人数计算即可.【详解】由题知:不低于60分的频率为:,又不低于60分的人数是35人,所以该班的学生人数是.故选:B2.一个容量为100的样本,其数据的分组与各组的频数如下:则样本数据落在[10,40)上的频率为( )A.0.13 B.0.39C.0.52 D.0.64【答案】C【分析】根据频率分布表求区间频率即可.【详解】由题意,频数在[10,40)的有13+24+15=52个,所以频率为=0.52.故选:C二、其它统计图扇形统计图用整个圆的面积表示总数,用圆的一部分的扇形面积表示各部分占总数的百分数,这样的统计图称“扇形统计图”.又称“百分比较图”或“圆形图”.该图可清楚地表示各部分同总数间的关系.条形统计图用一个单位长度表示一定的数量,并根据各个数量的多少画出长短不同而宽度相同的直条,然后把这些直条按照一定的顺序排列起来所构成的统计图.条形统计图一般简称“条形图”,也叫“长条图”、“直条图”.条形图可画成竖条,也可画成横条.从条形统计图可直观地看出各个数量的多少.折线统计图用一个单位长度表示一定的数量,根据所统计的数量的多少,依一定的次序,描出相应的各点,然后把各点用线段顺次连结成一条折线,这样的统计图称为“折线统计图”.折线统计图的纵、横向的单位长度可相等,也可不等.从图中折线的每条线段的上升或下降以及它的倾斜度,可清楚地看出数量的增减变化的幅度或发展趋势.制图步骤制作条形统计图的步骤是:1.根据统计资料整理数据.2.作图定标尺.先画纵轴,确定一定的比例(即标尺),作为长度单位;再画横轴,纵、横轴的长短要适中.3.画直条.条形的宽度、间隔要一致.4.写上条形统计图的总标题、制图日期及数量单位.制作折线统计图的步骤是:1.根据统计资料整理数据.2.先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.3.根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.制作扇形统计图的步骤是:1.根据统计资料,整理或计算出必要的数据(包括部分占整体的百分数).2.根据数据,算出各部分扇形圆心角的度数.3.根据需要,取适当的半径画圆,用量角器依次按圆心角把圆分成几个扇形.4.标上每部分的内容及占总体的百分数.用虚线、实线或不同颜色将各部分区分开来.例5:1.在“万众创业”的大背景下,“直播电商”已经成为我国当前经济发展的新增长点,已知某电商平台的直播间经营化妆品和食品两大类商品,2022年前三个季度,该直播间每个季度的收入都比上一季度的收入翻了一番,其前三季度的收入情况如图所示,则( )A.该直播间第三季度总收入是第一季度总收入的3倍;B.该直播间第三季度化妆品收入是第一季度化妆品收入的6倍;C.该直播间第三季度化妆品收入是第二季度化妆品收入的3倍;D.该直播间第三季度食品收入低于前两个季度的食品收入之和.【答案】C【分析】设该直播间第一季度总收入为单位1,结合图中数据对四个选项一一进行判断.【详解】A选项,设该直播间第一季度总收入为单位1,则设该直播间第二季度总收入为单位2,该直播间第三季度总收入为单位4,所以第三季度总收入是第一季度总收入的4倍,故A错误;B选项,因为第三季度总收入是第一季度总收入的4倍,设该直播间第一季度总收入为单位1,故该直播间第三季度化妆品收入是第一季度化妆品收入的倍,B错误;C选项,设该直播间第一季度总收入为单位1,故直播间第三季度化妆品收入是第二季度化妆品收入的倍,C正确;D选项,设该直播间第一季度总收入为单位1,则该直播间第三季度食品收入为,前两个季度的食品收入之和为,因为,故该直播间第三季度食品收入高于前两个季度的食品收入之和,D错误.故选:C2.据统计,我国牛、羊肉集贸市场价格在2019年波动幅度较大,2020年开始逐渐趋于稳定.如下图分别为2019年1月至2020年3月,我国牛肉、羊肉集贸市场月平均价格大致走势图,下列说法不正确的是( )A.2019年1月至2020年3月,牛肉与羊肉月平均价格的涨跌情况基本一致B.2019年3月开始至当年末,牛肉与羊肉的月平均价格都一直持续上涨C.2019年7月至10月牛肉月平均价格的平均增量高于2020年1至2月的增量D.同期相比,羊肉的月平均价格一定高于牛肉的月平均价格【答案】D【分析】根据图像数据分析即可求解.【详解】根据图像的大致走势即可判断牛肉与羊肉月平均价格的涨跌情况基本一致,故选项A正确;根据图像中的数据比较可知2019年3月开始至当年末,牛肉与羊肉的月平均价格,数据越来越大,都一直持续上涨,故选项B正确;2019年7月至10月牛肉月平均价格的平均增量为,2020年1至2月牛肉增量为,故选项C正确;2019年8月牛肉月平均价格为,2019年8月羊肉月平均价格为,所以同期相比,羊肉的月平均价格也可能会低于牛肉的月平均价格,故选项D错误.故选:D.举一反三1.某学校对间学生公寓的卫生情况进行综合评比,依考核分数分为,,,四个等级.其中分数在的为等级;分数在的为等级;分数在的为等级;分数在的为等级.考核评估后,得其频率折线图如图所示,估计这间学生公寓评估得分为等级,的比评估得分为等级,的多( )A.间 B.间C.间 D.间【答案】C【分析】根据频率折线图分别求出分数为等级的频率,再根据总数作差即可.【详解】由频率折线图可知,分数为等级的频率为;分数为等级的频率为;分数为等级的频率为;分数为等级的频率为,所以,即评估得分为等级,的比评估得分为等级,的多间.故选:C.2(多选).十项全能是田径运动中全能项目的一种,是由跑、跳、投等个田径项目组成的综合性男子比赛项目,比赛成绩是按照国际田径联合会制定的专门田径运动会全能评分表将各个单项成绩所得的评分加起来计算的,总分多者为优胜者.如图,这是某次十项全能比赛中甲、乙两名运动员的各个单项得分的雷达图,则下列说法正确的是( ) A.在米跑项目中,甲的得分比乙的得分低B.在跳高和标枪项目中,甲、乙水平相当C.甲的各项得分比乙的各项得分更均衡D.甲的各项得分的极差比乙的各项得分的极差大【答案】BD【分析】根据雷达图对选项进行分析,从而确定正确答案.【详解】由雷达图可知,400米跑项目中,甲的得分比乙的得分高,A错误;在跳高和标枪项目中,甲、乙得分一样,即甲、乙水平相当,B正确;甲各项得分的波动较大,乙的各项得分均在内,波动较小,C错误;甲的各项得分最高1000,最低介于400与500之间,甲的极差大于500,乙的各项得分的极差小于200,D正确.故选:BD百分位数:如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如,处于p%位置的值称第p百分位数。计算步骤下面的步骤来说明如何计算第p百分位数。第1步:以递增顺序排列原始数据(即从小到大排列)。第2步:计算指数i=np%第3步:l)若 i 不是整数,将 i 向上取整。大于i的毗邻整数即为第p百分位数的位置。2) 若i是整数,则第p百分位数是第i项与第(i+l)项数据的平均值。除了以上方法,再介绍另外一种方法,这种方法是SPSS所用方法,也是SAS所用方法之一。第一步:将n个变量值从小到大排列,X(j)表示此数列中第j个数。第二步:计算指数,设(n+1)P%=j+g,j为整数部分,g为小数部分。第三步:1)当g=0时:P百分位数=X(j);2)当g≠0时:P百分位数=g*X(j+1)+(1-g)*X(j)=X(j)+g*[X(j+1)-X(j)]。例6:1.(多选)中央广播电视总台《2023年春节联欢晩会》以温暖人心的精品节目、亮点满满的技术创新、美轮美奂的舞美效果为全球华人送上了一道红红火火的文化大䝳.某机构随机调查了18位观众对2023年春晩节目的满意度评分情况,得到如下数据:.若恰好是这组数据的上四分位数,则的值可能为( )A.83 B.84 C.85 D.87【答案】ABC【分析】先求出18个数据的上四分位数为第14个数.将剩余17个数,从小到大排列,结合已知即可得出.【详解】由于上四分位数即第75百分位数,于是,将这些数据按照从小到大排列后,第14个数为上四分位数,所以应该是18个数据从小到大排列后的第14个数,显然不是最小的数.而除去后,从小到大排列得到的第13个数为83,第14个数为85,所以.故选:ABC.2.棉花的纤维长度是棉花质量的重要指标,在一批棉花中随机抽到50根棉花的纤维长度(单位:mm),按从小到大排序结果如下:28 33 50 52 58 60 61 62 82 86 113 140 143 146 170 175202 206 233 236 238 260 263 264 265 293 294 296 301 302 303305 306 321 323 325 328 340 343 346 348 352 355 357 357358 370 380 383 385.请你估算这批棉花的第90百分位数是____________.【答案】357.5【分析】计算,确定第90百分位数为第45个数和第46个数的平均数,得到答案.【详解】因为,第90百分位数为第45个数和第46个数的平均数,即为.故答案为:357.5举一反三1.某校学生参与“保护地球”知识问答活动,满分20分,根据学生的作答成绩绘制的频率分布直方图如图所示,请据此估计学生成绩的第60百分位数为___________.【答案】14【分析】利用百分位数的定义进行求解即可.【详解】由图可知第一组的频率为,前两组的频率之和为,则可知其第60百分位数在内,设为,则,解得.故答案为:14.2.一组数的分位数指的是满足下列条件的一个数值:至少有的数据不大于该值,且至少有的数据不小于该值.直观来说,一组数的分位数指的是,将这组数按照从小到大的顺序排列后,处于位置的数.例如:中位数就是一个50%分位数.2023年3月,呼和浩特市为创建文明城市,随机从某小区抽取10位居民调查他们对自己目前生活状态的满意程度,该指标数越接近10表示满意程度越高.他们的满意度指标数分别是8,4,5,6,9,8,9,7,10,10,则这组数据的分位数是________.【答案】6【分析】首先将数据从小到大排列,再根据百分位数计算规则计算可得.【详解】依题意这个数据从小到大排列为、、、、、、、、、,又,所以这组数据的分位数是第个数.故答案为:3.近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(BMI)来衡量人体胖瘦程度以及是否健康,其计算公式是.我国成人的BMI数值标准为:为偏瘦,为正常,为偏胖,为肥胖.为了解某公司员工的身体肥胖情况,研究人员从公司员工体检数据中,利用分层抽样得到15名员工的BMI数据如下:23.5,21.6,30.6,22.1,23.7,20.6,25.5,23.9,20.8,21.5,21.8,18.2,25.2,21.5,19.1.则该组数据的第70百分位数为______________.【答案】23.7【分析】把15个数据由小到大排列,求出第70百分位数作答.【详解】15名员工的BMI数据由小到大排列为:18.2,19.1,20.6,20.8,21.5,21.5,21.6,21.8,22.1,23.5,23.7,23.9,25.2,25.5,30.6,由,所以该组数据的第70百分位数是第11个数23.7.故答案为:23.7中位数、众数、平均数众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数中位数----把n个数据按大小顺序排列,处于最中间位置的一个数据(或)叫做这组数据的中位数(median).中位数则仅与数据排列位置有关,当一组数据从小到大排列后,最中间的数据为中位数(偶数个数据的最中间两个的平均数)。平均数: 一般地,如果n个数 ,那么, 叫做这n个数的平均数例7:1.如图所示的表格记录了高三(1)班第一组和第二组各五名学生在一次英语听力测试训练中的成绩(单位:分),若这两组数据的中位数均为15,平均值相等,则( )A.36 B.6 C.26 D.16【答案】A【解析】【分析】根据题意进行数据分析,分别求出x、y,即可求出.【详解】因为这两组数据的中位数均为15,所以.因为这两组数据的平均值相等,所以,解得,故.故选:A.2.沙糖桔网店2019年全年的月收支数据如图所示,则针对2019年这一年的收支情况,下列说法中错误的是( )A.月收入的最大值为90万元,最小值为30万元 B.这一年的总利润超过400万元C.这12个月利润的中位数与众数均为30 D.7月份的利润最大【答案】B【解析】【分析】根据图形和中位数、众数的概念依次判断选项即可.【详解】A:由图可知,月收入的最大值为90,最小值为30,故A正确;B:各个月的利润分别为20,30,20,10,30,30,60,40,30,30,50,30,所以总利润为20+30+20+10+30+30+60+40+30+30+50+30=380(万元),故B错误;C:这12个月利润的中位数与众数均为30,故C正确;D:7月份的利润最大,为60万元,故D正确.故选:B3.郑州地铁1号线的开通运营,极大方便了市民的出行.某时刻从二七广场站驶往博学路站的过程中,10个车站上车的人数统计如下:70,60,60,60,50,40,40,30,30,10.这组数据的平均数,众数,90%分位数的和为( )A.125 B.135 C.165 D.170【答案】D【解析】【分析】利用公式可求平均数和90%分位数,再求出众数后可得所求的和.【详解】这组数据的平均数为,而,故90%分位数,众数为,故三者之和为,故选:D.举一反三1.下图为2021年上半年中国火锅消费频率扇形图及地域分析条形图根据所给统计图,下列结论中不正确的是( )A.2021年上半年中国消费者每天都要吃火锅的占比为5.0%B.2021年上半年中国消费者每月都要吃火锅的超过70%C.2021年上半年西南与华东地区消费者每周吃两次及以上的超过70%D.2021年上半年七个区域中国消费者每周吃两次及以上频率的平均数超过25%【答案】C【解析】【分析】根据统计中相关知识,结合图形和频数、平均数等概念对各选项逐一分析即可.【详解】对于A,由扇形图可知2021年上半年中国消费者每天都吃火锅的占比为5.0%,故A正确;对于B,2021年上半年中国消费者每月都要吃火锅的占比为,故B正确;对于C,设2021年上半年西南与华东地区消费者分别为x人,y人,则2021年上半年西南与华东地区消费者每周吃两次及以上的占比为,故C错误;对于D,由平均数定义得2021年上半年七个区域中国消费者每周吃两次及以上频率的平均数为,故D正确.故选:C2.将某射击运动员的十次射击成绩(环数)按从小到大的顺序(相等数据相邻排列)排列为:8.1,8.4,8.4,8.7,x,y,9.3,9.4,9.8,9.9,已知总体的中位数为9,则的最小值为__________.【答案】【解析】【分析】由中位数的概念结合基本不等式可得.【详解】因为总体的中位数为9.所以,则,当且仅当时等号成立.故答案为:3.某经销商采购了一批水果,根据某些评价指标进行打分,现从中随机抽取20筐(每筐1kg),得分数据如下:17,23,27,31,36,40,45,50,51,51,58,63,65,68,71,78,79,80,85,95.根据以往的大数据认定:得分在区间,,,内的分别对应四级、三级、二级、一级.(1)试求这20筐水果得分的平均数.(2)用样本估计总体,经销商参考以下两种销售方案进行销售:方案1:将得分的平均数换算为等级,按换算后的等级出售;方案2:分等级出售.不同等级水果的售价如下表所示:请从经销商的角度,根据售价分析采用哪种销售方案较好,并说明理由.【答案】(1)55.65(2)采用方案1较好,理由见解析【解析】【分析】(1)直接利用平均数的计算公式即可求解;(2)分别计算出这两种方案的单价,进行比较,即可下结论.(1)这20筐水果得分的平均数为.(2)方案1:由于得分的平均数,所以可以估计这批水果的销售单价为1.8万元/吨.方案2:设这批水果售价的平均值为万元/吨,由已知数据得,得分在内的有17,23,共2个,所以估计四级水果所占比例为,得分在内的有27,31,36,40,45,50,共6个,所以估计三级水果所占比例为,得分在内的有51,51,58,63,65,68,71,共7个,所以估计二级水果所占比例为,得分在内的有78,79,80,85,95,共5个,所以估计一级水果所占比例为,则(万元/吨).所以从经销商的角度考虑,采用方案1的售价较高,所以采用方案1较好在频率分布直方图中求平均数、中位数、众数众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标平均数在样本数据的频率分布直方图中,等于频率分布图中每个小长方形面积乘以小矩形底边中点的横坐标之和例7:1.某校随机抽取100名学生进行“绿色环保知识”问卷测试.测试结果发现这100名学生的得分都在内,按得分情况分成5组:,,,,,得到如图所示的频率分布直方图.则下列说法错误的是( )A.这100名学生得分的中位数是72.5B.这100名学生得分的平均数是72.5C.这100名学生得分小于70分的有50人D.这100名学生得分不小于90分的有5人【答案】C【解析】【分析】根据频率分布直方图求中位数、平均数、频数的计算方法即可求解.【详解】解:对A:根据频率分布直方图, 设这100名同学得分的中位数为,则有,解得,故选项A正确;对B:根据频率分布直方图,可得100名学生得分的平均数是,故选项B正确;对C:这100名学生得分小于70分的有人,故选项C错误;对D:这100名学生得分不小于90分的有人,故选项D正确.故选:C.2.中国共产党建党100周年华诞之际,某社区响应党和国家的号召,通过“增强防疫意识,激发爱国情怀”知识宣讲活动,来回顾中国共产党从成立到发展壮大的心路历程,表达对建党100周年以来的丰功伟绩的传颂.现从参与宣讲者中随机选出200人,并将这200人按年龄分组,得到的频率分布直方图如图所示,则估计参与者的平均年龄为___________岁.(每组数据以区间的中点值为代表)【答案】41.5【解析】【分析】根据给定的频率分布直方图求出a,再利用频率分布直方图求平均数的方法步骤计算作答.【详解】由频率分布直方图知:,解得,因此,各组的频率依次为:0.1,0.15,0.35,0.3,0.1,,所以参与者的平均年龄约为41.5.故答案为:41.53.年月日是中国共产党百年华诞,习近平总书记七·一的重要讲话在全国掀起学习党史的热潮.某学校为了解该校师生党史的学习情况,用分层抽样的方式从名师生中抽取名师生进行党史知识测试,得到如图所示的频率分布直方图,其中分组的区间为,,,,,则名师生测试成绩的中位数是______.(结果保留整数部分)【答案】【解析】【分析】利用中位数左边的矩形面积之和为可列等式求出中位数的值.【详解】由频率分布直方图知前三组频率之和,前四组频率之和,所以中位数在第四组,设中位数为,则,解得.故答案为:.举一反三1.某班进行了一次数学测试,全班学生的成绩都落在区间内,其成绩的频率分布直方图如图所示,若该班学生这次数学测试成绩的中位数的估计值为,则的值为( )A. B. C. D.【答案】A【解析】【分析】根据已知条件可得出关于、的方程组,解出这两个量的值,即可求得结果.【详解】由题意有,得,又由,得,解得,,有.故选:A.2.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获药监局批准附条件上市,其保护效力达到世界卫生组织及药监局相关标准要求,现已对18至59岁的人提供.根据某地接种年龄样本的频率分布直方图(如图)估计该地接种年龄的中位数为________.【答案】38【解析】【分析】根据中位数左右频率之和都为0.5即可求得答案.【详解】根据题意,年龄位于的频率为,年龄位于的频率为,于是设中位数为,所以,所以中位数为38.故答案为:38.3.某高校调查了本校n名大学生每周的自习时间(单位:小时),由调查结果得到如下频数分布表和频率分布直方图,其中自习时间的是,样本数据分组为:(1)分别求出的值;(2)根据频率分布直方图,估计该校大学生自习时间的平均数与中位数.【答案】(1),,(2)平均数估计值为,中位数估计值为【解析】【分析】(1)利用的频率求得,从而求得,进而求得.(2)根据频率分布直方图求平均数和中位数的方法,求得平均数和中位数.(1)由,解得,;于是由,解得.(2)设该校大学生上自习的时间中位数估计值为x,则有:,解得:.∴ 该校大学生上自习时间的平均数估计值为:.样本方差与标准差设样本的元素为x1,x2,…,xn,样本的平均数为eq \x\to(x),(1)样本方差:s2=eq \f(1,n)[(x1-eq \x\to(x))2+(x2-eq \x\to(x))2+…+(xn-eq \x\to(x))2].(2)样本标准差:s= eq \r(\f(1,n)[(x1-\x\to(x))2+(x2-\x\to(x))2+…+(xn-\x\to(x))2])例8:1.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生规模群体感染的标志为“连续天,每天新增疑似病例不超过人”根据过去天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A.甲地:总体均值为,中位数为B.乙地:总体均值为,总体方差大于C.丙地:中位数为,众数为D.丁地:总体均值为,总体方差为【答案】D【解析】【分析】利用平均数、中位数、方差的计算公式以及含义,对四个选项逐一分析判断即可.【详解】因为平均数和中位数不能限制某一天的病例超过人,故A不正确;乙地:总体均值为,说明乙地过去天新增疑似病例例,总体方差大于,有可能存在一天新增疑似病例超过人,故B不正确;中位数和众数也不能限制某一天的病例超过人,故C不正确;当总体平均数是,若有一个数据超过,则方差就超过,故D正确,故选:D.2.小明用某款手机性能测试app对10部不同品牌的手机的某项性能进行测试,所得的分数按从小到大的顺序(相等数据相邻排列)排列为:81,84,84,87,x,y,93,95,97,99,已知总体的中位数为90,若要使该总体的标准差最小,则_________.【答案】0【解析】【分析】根据中位数得到,即可得到平均数,要标准差最小,即最小,利用基本不等式求其最值即可.【详解】因为总体的中位数为90,所以,平均数为,要使该总体的标准差最小,即方差最小,即最小,又,当且仅当时,即时等号成立,故.故答案为:03.已知一组数据,,…,的平均数,方差,则另外一组数据,,…,的平均数为______,方差为______.【答案】 11 54【解析】【分析】由平均数与方差的性质即可求解.【详解】解:由题意,数据,,…,的平均数为,方差为.故答案为:11,54.举一反三1.甲,乙两组数据的频率分布直方图如图所示,两组数据采用相同的分组方法,用和分别表示甲、乙的平均数,,分别表示甲、乙的方差,则( )A., B.,C., D.,【答案】B【解析】【分析】由频率分布直方图中平均数的计算方法、数据的集中程度即可判断作答.【详解】因甲,乙两组数据采用相同的分组方法,则它们的分组各个中点值对应相同,设第1组到5组的中点值依次为,由两个频率分布直方图知,它们都关于过最中间一个小矩形下底边的中点且垂直于横轴的直线对称,即,令甲组数据从第一组到第五组的频率依次为,且,乙组数据从第一组到第五组的频率依次为,且,则,同理,因此,,由频率分布直方图知,乙组数据比甲组数据相对于平均数更集中,甲组数据波动较乙的大,则有,所以,.故选:B2.现有一组数据:1,3,4,6,7,7,21,设中位数为a,众数为b,方差为,则______.【答案】【解析】【分析】先求出中位数和众数,再求方差,然后可得结果.【详解】由题意可知中位数是6,众数是7,即,;平均数为,所以,所以.故答案为:.3.为了了解某体育院校新生的体能情况,该校随机抽查了名学生,测试1分钟引体向上的成绩(次数),成绩均在内,按次数分成4组,第一组:,第二组:,第三组:,第四组:,得到如图所示的频率分布直方图,已知第一组有5人.(1)求的值;(2)以每组数据的中点值作为该组数据的代表值,估计新生引体向上的成绩的平均数和方差.【答案】(1)50(2)平均数的估计值为26,方差的估计值为20.25【解析】【分析】(1)根据频数总数频率即可求解;(2)由频率分布直方图求平均数的公式及方差公式即可求解.(1)解:根据频率分布直方图得第一组的频率为,所以,所以.(2)解:新生引体向上的成绩的平均数为,新生引体向上的成绩的方差为,所以新生引体向上的成绩的平均数的估计值为26,方差的估计值为20.25.课外阅读1.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)编号:先将总体的N个个体编号;(2)分段:确定分段间隔k,对编号分段,当eq \f(N,n)(n是样本容量)是整数时,取k=eq \f(N,n);(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);(4)获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.例1.一个总体中有100个个体,随机编号为0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,…,10.现抽取一个容量为10的样本,规定如果在第1组中随机抽取的号码为m,那么在第k组中抽取的号码的个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是( )A.63 B.64C.65 D.66【答案】A【分析】由题意知m=6时在第7组中抽取的号码个位数字为3,由分组的规则即可知第7组中编号,进而可得抽取的号码.【详解】由题设知,若m=6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号依次为60,61,62,63,…,69,故在第7组中抽取的号码是63.故选:A.2.用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从编号,若第1组抽出的号码为6,则第6组中抽取的号码是( )A.66 B.56 C.46 D.126【答案】C【分析】按照系统抽样的方法,将160名学生分成组,间隔为,利用简单随机抽样每组抽一个,若第1组抽出的号码为6,第六组抽的为,即可求解.【详解】按照系统抽样的方法,将160名学生分成组,间隔为,利用简单随机抽样每组抽一个,若第1组抽出的号码为6,第六组抽的为,故选:C3.茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.1.甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )A.极差 B.方差C.平均数 D.中位数【答案】C【分析】根据茎叶图中数据的波动情况,可直接判断方差不同;根据茎叶图中的数据,分别计算极差、中位数、平均数,即可得出结果.【详解】由茎叶图可得:甲的数据更集中,乙的数据较分散,所以甲与乙的方差不同;甲的极差为;乙的极差为,所以甲与乙的极差不同;甲的中位数为,乙的中位数为,所以中位数不同;甲的平均数为,乙的平均数为,所以甲、乙的平均数相同;故选:C.2.已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,的值分别为().A.2,5 B.5,5 C.5,8 D.8,8【答案】C【分析】根据茎叶图以及平均数、中位数的概念计算可得结果.【详解】乙组数据平均数为,∴;甲组数据可排列成:9,12,,24,27.所以中位数为:,∴.故选:C.【点睛】关键点点睛:识别茎叶图是解题关键.0347437386369647366146986371629774246292428114572042533237321676获取数据的基本途径适用类型注意问题通过调查获取数据对于有限总体问题,一般通过抽样调查或普查的方法获取数据要充分有效地利用背景信息选择或创建更好的抽样方法,并有效地避免抽样过程中的人为错误通过试验获取数据没有现存的数据可以查询严格控制试验环境,通过精心的设计安排试验,以提高数据质量通过观察获取数据自然现象借助专业测量设备通过长久的持续观察获取数据通过查询获得数据众多专家研究过,其收集的数据有所存储必须根据问题背景知识“清洗”数据去伪存真分组[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数1213241516137学生成绩第一组8121526第二组9141826等级一级二级三级四级售价(万元/吨)21.81.51.2自习时间(小时学生人数105080a20
![文档详情页底部广告位](http://img.51jiaoxi.com/images/257d7bc79dd514896def3dc0b2e3f598.jpg)