资料中包含下列文件,点击文件名可预览资料内容
还剩15页未读,
继续阅读
第九章 第一节 随机抽样与样本估计总体-备战2022年(新高考)数学一轮复习考点讲解+习题练习学案
展开这是一份第九章 第一节 随机抽样与样本估计总体-备战2022年(新高考)数学一轮复习考点讲解+习题练习学案,文件包含第九章第一节随机抽样与样本估计总体原卷版docx、第九章第一节随机抽样与样本估计总体解析版docx等2份学案配套教学资源,其中学案共43页, 欢迎下载使用。
(1)简单随机抽样
①定义:一般地,从个体数为N的总体中逐个不放回地取出n个个体作为样本(n
(2)分层抽样
①定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.
②分层抽样的应用范围:
当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.
2.用样本的频率分布估计总体分布
(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.
(2)①频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图.
②总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
3.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:eq \x\t(x)=eq \f(x1+x2+…+xn,n),反映了一组数据的平均水平.
(4)标准差:是样本数据到平均数的一种平均距离,s=eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]).
(5)方差:s2=eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2](xn是样本数据,n是样本容量,eq \x\t(x)是样本平均数).
课前检测
1.某学校高一年级共有200名学生,为了了解这些学生的身高状况,从中抽取了15名学生进行测量.在这个问题中,200名学生的身高是()
A.总体
B.个体
C.样本的容量
D.从总体中抽取的一个样本
A
200名学生的身高是指总体,15名学生的身高从总体中抽取的是样本,15是样本容量,每一名学生的身高是个体.故选A.
随机抽样,总体、个体、样本、样本容量.
为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )
A.总体 B.个体
C.从总体中抽取的一个样本D.样本容量
【答案】选C 根据随机抽样的概念可知选C.
3.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )
A.33,34,33 B.25,56,19
C.20,40,30 D.30,50,20
答案 B
解析 设在不到35岁的员工抽取x人,则eq \f(100,500)=eq \f(x,125),所以x=25,同理可得这三个年龄段抽取人数分别为25,56,19.
4.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
【答案】选B 统计问题中,体现数据的稳定程度的指标为数据的方差或标准差.故选B.
5.(多选)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:
则下列判断中正确的是( )
A.该公司2019年度冰箱类电器销售亏损
B.该公司2019年度小家电类电器营业收入和净利润相同
C.该公司2019年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低
答案 ACD
解析 根据表中数据知,该公司2019年度冰箱类电器销售净利润占比为-0.48%,是亏损的,A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,B错误;该公司2019年度空调类电器净利润占比为95.80%,是主要利润来源,C正确;所以剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低,D正确.故选ACD.
6.(2020·惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,这320名学生中每周的自习时间不足22.5小时的人数是( )
A.70 B.72 C.248 D.200
答案 B
解析 由频率分布直方图可得,320名学生中每周的自习时间不足22.5小时的人数是320×(0.02+0.07)×2.5=72(人).故选B.
7.若数据x1,x2,x3,…,xn的平均数eq \x\t(x)=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.
答案 16,18
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴eq \f(x1+x2+x3+…+xn,n)=5,
∴eq \f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
课中讲解
考点一.抽样方法
例1.(1)下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0 B.1 C.2 D.3
(2)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )
eq \f (7816 6572 0802 6314 0702 4369 9728 0198,3204 9234 4935 8200 3623 4869 6938 7481)
A.08 B.07 C.02 D.01
(3)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( )
A.9 B.10 C.12 D.13
(1)A (2)D (3)D
(1)①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;
②不是简单随机抽样.因为它是有放回抽样;
③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;
④不是简单随机抽样.因为不是等可能抽样.故选A.
(2)从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01,故选D.
(3)因为丙车间生产60件,抽取了3件,
抽取比例为eq \f (1,20),所以n=eq \f (1,20)×(120+80+60)=13,故选D.
变式1.(1)利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )
A.73B.78
C.77D.76
【答案】选B 样本的分段间隔为eq \f(80,16)=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.
(2)某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:
电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )
A.25,25,25,25B.48,72,64,16
C.20,40,30,10D.24,36,32,8
【答案】选D 因为抽样比为eq \f(100,20 000)=eq \f(1,200),所以每类人中应抽取的人数分别为4 800×eq \f(1,200)=24,7 200×eq \f(1,200)=36,6 400×eq \f(1,200)=32,1 600×eq \f(1,200)=8.
(3).某校要从高一、高二、高三共2 012名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2 012名学生中剔除12名,再从剩下的2 000名学生中按分层抽样的方法抽取50名,则下面对每名学生入选的概率描述正确的是________.(填序号)
①都相等且为eq \f(50,2 012);②都相等且为eq \f(1,40);③不完全相等.
答案 ①
解析 根据分层抽样的定义可得,每个个体被抽到的概率都等于eq \f(50,2 012).
考点二.统计图的应用
例1.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
【答案】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,
解得a=0.30.
(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,
前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,
所以2.5≤x<3.
由0.30×(x-2.5)=0.85-0.73,
解得x=2.9.
所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
变式1. (2019·南昌调研)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图.
(1)直方图中x的值为________;
(2)在这些用户中,月用电量落在区间[100,250)内的户数为________.
答案 (1)0.004 4 (2)70
解析 (1)由频率分布直方图知数据落在[200,250)内的频率为1-(0.002 4+0.003 6+0.006 0+0.002 4+0.001 2)×50=0.22,于是x=eq \f(0.22,50)=0.004 4.
(2)因为数据落在[100,250)内的频率为(0.003 6+0.006 0+0.004 4)×50=0.7,所以所求户数为0.7×100=70.
例2.(2020·广东模拟)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图12.35所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中有误的是( )
A.成绩在[70,80]分的考生人数最多
B.不及格的考生人数为1000人
C.考生竞赛成绩的平均分约70.5分
D.考生竞赛成绩的中位数为75分
图12.35
D
由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为4000×0.25=1000,故B正确;由频率分布直方图可得:平均分等于45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5,故C正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为70+10×eq \f (0.05,0.3)≈71.67,故D错误.故选D.
变式2.(1)(2019·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )
A.15 B.18
C.20D.25
【答案】选A 根据频率分布直方图,得第二小组的频率是0.040×10=0.4,∵频数是40,∴样本容量是eq \f(40,0.4)=100,又成绩在80~100分的频率是(0.010+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.
(2)某网络营销部门随机抽查了某市200名网友在2018年11月11日的网购金额,所得数据如下表:
已知网购金额不超过3千元与超过3千元的人数比恰为3∶2.
(1)试确定x,y,p,q的值,并补全频率分布直方图(如图);
(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?
【答案】(1)根据题意有eq \b\lc\{\rc\ (\a\vs4\al\c1(16+24+x+y+16+14=200,,\f(16+24+x,y+16+14)=\f(3,2),))
解得eq \b\lc\{\rc\ (\a\vs4\al\c1(x=80,,y=50,))∴p=0.40,q=0.25.
补全频率分布直方图如图所示.
(2)根据题意,抽取网购金额在(1,2]内的人数为
eq \f(24,24+16)×5=3(人).
抽取网购金额在(4,5]内的人数为eq \f(16,24+16)×5=2(人).
故此2人来自不同群体的概率P=eq \f(C\\al(1,3)C\\al(1,2),C\\al(2,5))=eq \f(3,5).
例3.(1)(2020•内江)新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考)。其中“选择考”,成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级,某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到:如下图表
针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是
A.获得A等级的人数减少 B.获得B等级的人数增加了1.5倍
C.获得D等级的人数减少了一半 D.获得E等级的人数相同
【答案】:B
(2).(武邑市期中)如图是一位发烧病人的体温记录折线图,下列说法不正确的是( )
A.病人在5月13日12时的体温是 B.从体温上看,这个病人的病情在逐渐好转
C.病人体温在5月14日0时到6时下降最快 D.病人体温在5月15日18时开始逐渐稳定
【答案】C
【解析】由该发烧病人的体温记录折线图,可知
对于A,病人在5月13日12时的体温是,故A正确;
对于B,从体温上看,这个病人的体温逐渐趋于正常,说明病情在逐渐好转,故B正确;
对于C,病人体温在5月13日6时到12时下降最快,故C错误;
对于D,病人体温在5月15日18时开始逐渐稳定,故D正确.
综上可知,C为错误选项,
变式3.(1) (2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 设新农村建设前,农村的经济收入为a,则新农村建设后,农村的经济收入为2a.新农村建设前后,各项收入的对比如下表:
故选A.
(2) (2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
答案 A
解析 对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;
对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;
对于选项C,D,由图可知显然正确.
故选A.
变式4.(1)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
答案 A
解析 由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,
抽取的高中生人数为2 000×2%=40(人),
则近视人数为40×0.5=20(人),
故选A.
(2)(多选)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2017年9月到2018年2月这半年来,某个关键词的搜索指数变化的统计图.
根据该统计图判断,下列结论不正确的是( )
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化
B.这半年来,网民对该关键词相关的信息关注度不断减弱
C.从该关键词的搜索指数来看,2017年10月的方差小于11月的方差
D.从该关键词的搜索指数来看,2017年12月的平均值大于2018年1月的平均值
答案 ABC
解析 由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,A项错误;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,B项错误;由统计图可知,2017年10月该关键词的搜索指数波动较大,11月的波动较小,所以2017年10月的方差大于11月的方差,C项错误;由统计图可知,2017年12月该关键词的搜索指数大多高于10 000,该月平均值大于10 000,2018年1月该关键词的搜索指数大多低于10 000,该月平均值小于10 000,D项正确,故选ABC.
考点三.用样本的数据特征估计总体的数据特征
例1.(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
A
设9位评委评分按从小到大排列为x1
变式1.(2019·全国Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
答案 A
解析 记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.
例2.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分情况如图所示,假设得分值的中位数为me,平均数为eq \x\t(x),众数为m0,则( )
A.me=m0=eq \x\t(x) B.me=m0
解析 由图知m0=5.
由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以me=eq \f(5+6,2)=5.5.
eq \x\t(x)=eq \f(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2,30)
≈5.97>5.5,
所以m0
(1)估计总体的众数;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女学生人数相等.试估计总体中男生和女生人数的比例.
【答案】(1)由频率分布直方图可估计总体的众数为eq \f(70+80,2)=75.
(2)由频率分布直方图可知,样本中分数在区间[50,90)内的人数为(0.01+0.02+0.04+0.02)×10×100=90.
因为样本中分数小于40的学生有5人,
所以样本中分数在区间[40,50)内的人数为100-90-5=5.
设总体中分数在区间[40,50)内的人数为x,
则eq \f(5,100)=eq \f(x,400),解得x=20,
故估计总体中分数在区间[40,50)内的人数为20.
(3)由频率分布直方图可知,样本中分数不小于70的人数为(0.04+0.02)×10×100=60.
因为样本中分数不小于70的男女学生人数相等,
所以样本中分数不小于70的男生人数为30.
因为样本中有一半男生的分数不小于70,所以样本中男生的人数为60,女人的人数为40.
由样本估计总体,得总体中男生和女生人数的比例约为3∶2.
例3.(2019·全国Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
答案 0.98
解析 经停该站高铁列车所有车次的平均正点率的估计值为eq \f(10×0.97+20×0.98+10×0.99,10+20+10)=0.98.
变式3.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 甲
解析 由题意可得eq \x\t(x)甲=eq \x\t(x)乙=9,
又∵seq \\al(2,甲)=eq \f(1,5)×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=eq \f(2,5),
seq \\al(2,乙)=eq \f(1,5)×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=eq \f(6,5)>seq \\al(2,甲),∴甲更稳定,故最佳人选应是甲.
课后习题
单选题
1.(2018·石家庄模拟)某校一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为( )
A.80 B.120
C.160D.240
【答案】选A 因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×eq \f(4,4+3)=80,故选A.
2.一个总体中有600个个体,随机编号为001,002,…,600,利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为( )
A.056,080,104B.054,078,102
C.054,079,104D.056,081,106
【答案】选D 系统抽样的间隔为eq \f(600,24)=25,
编号为051~125之间抽得的编号为
006+2×25=056,006+3×25=081,006+4×25=106.
3.为确保食品安全,某市质检部门检查了1 000袋方便面的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )
A.总体是指这1 000袋方便面
B.个体是1袋方便面
C.样本是按2%抽取的20袋方便面
D.样本容量为20
答案 D
解析 总体是指这1 000袋方便面的质量,A中说法错误;个体是指1袋方便面的质量,B中说法错误;样本是指按照2%抽取的20袋方便面的质量,C中说法错误;样本容量为20,D中说法正确.
4.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150 C.200 D.250
答案 A
解析 方法一 由题意可得eq \f(70,n-70)=eq \f(3 500,1 500),解得n=100.
方法二 由题意,得抽样比为eq \f(70,3 500)=eq \f(1,50),总体容量为3 500+1 500=5 000,故n=5 000×eq \f(1,50)=100.
5.(2020·镇江模拟)如图为某省高考数学(理)卷近三年难易程度的对比图(图中数据为分值).根据对比图,给出正面三个结论:①近三年容易题分值逐年增加;②近三年中档题分值所占比例最高的年份是2017年;③2018年的容易题与中档题的分值之和占总分的90%以上.其中正确结论的个数为( )
A.0 B.1 C.2 D.3
答案 C
解析 根据对比图得,2016年,2017年,2018年容易题分值分别为40,55,96,逐年增加,①正确;近三年中档题分值所占比例最高的年份是2016年,②错误;2018年的容易题与中档题的分值之和为96+42=138,eq \f(138,150)=0.92>90%,③正确.故选C.
6.(2019·全国Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5 B.0.6 C.0.7 D.0.8
答案 C
解析 根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:
所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为eq \f(70,100)=0.7.
7.高三学生李丽在一年的五次数学模拟考试中的成绩(单位:分)为:x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为( )
A.15 B.16
C.17 D.18
答案 D
解析 由题意得,eq \f(x+y+105+109+110,5)=108,①
eq \f(x-1082+y-1082+9+1+4,5)=35.2,②
由①②解得eq \b\lc\{\rc\ (\a\vs4\al\c1(x=99,,y=117))或eq \b\lc\{\rc\ (\a\vs4\al\c1(x=117,,y=99,))
所以|x-y|=18.故选D.
8.若数据x1,x2,…,xn的平均数为eq \x\t(x),方差为s2,则2x1+3,2x2+3,…,2xn+3的平均数和方差分别为( )
A.eq \x\t(x)和s2 B.2eq \x\t(x)+3和4s2
C.2eq \x\t(x)+3和s2 D.2eq \x\t(x)+3和4s2+12s+9
答案 B
解析 方法一 平均数为eq \f(1,n)(2x1+3+2x2+3+…+2xn+3)=eq \f(1,n)[2(x1+x2+…+xn)+3n]=2eq \x\t(x)+3;方差为eq \f(1,n){[(2x1+3)-(2eq \x\t(x)+3)]2+[(2x2+3)-(2eq \x\t(x)+3)]2+…+[(2xn+3)-(2eq \x\t(x)+3)]2}=eq \f(1,n)[4(x1-eq \x\t(x))2+4(x2-eq \x\t(x))2+…+4(xn-eq \x\t(x))2]=4s2.
方法二 原数据乘以2加上3得到一组新数据,则由平均数、方差的性质可知得到的新数据的平均数和方差分别是2eq \x\t(x)+3和4s2.
9.(2019·昆明调研)如图是1951~2016年我国的年平均气温变化的折线图.根据图中信息,下列结论正确的是( )
A.1951年以来,我国的年平均气温逐年增高
B.1951年以来,我国的年平均气温在2016年再创新高
C.2000年以来,我国每年的年平均气温都高于1981~2010年的平均值
D.2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值
【答案】选D 由图可知,1951年以来,我国的年平均气温变化是有起伏的,不是逐年增高的,所以选项A错误;1951年以来,我国的年平均气温最高的不是2016年,所以选项B错误;2012年的年平均气温低于1981~2010年的平均值,所以选项C错误;2000年以来,我国的年平均气温的平均值高于1981~2010年的平均值,所以选项D正确.故选D.
10.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.100,20B.200,20
C.200,10D.100,10
【答案】选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.
11.(2019·榆林模拟)为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2017年1月至2018年7月的调查数据得出的中国仓储指数,绘制出如下折线图.
根据该折线图,下列结论正确的是( )
A.2017年各月的仓储指数最大值是在3月份
B.2018年1月至7月的仓储指数的中位数为55
C.2018年1月与4月的仓储指数的平均数为52
D.2017年1月至4月的仓储指数相对于2018年1月至4月,波动性更大
答案 D
解析 2017年各月的仓储指数最大值是在11月份,所以A错误;由图可知,2018年1月至7月的仓储指数的中位数约为53,所以B错误;2018年1月与4月的仓储指数的平均数为eq \f(51+55,2)=53,所以C错误;由图可知,2017年1月至4月的仓储指数比2018年1月至4月的仓储指数波动更大,故选D.
多选题
12.(多选)“微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号,用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是( )
A.月跑步里程逐月增加
B.月跑步里程最大值出现在10月
C.月跑步里程的中位数为5月份对应的里程数
D.1月至5月的月跑步里程相对于6月至11月波动性更小,变化比较平稳
答案 BCD
解析 在A中,2月跑步里程比1月的小,8月跑步里程比7月的小,11月跑步里程比10月的小,故A错误;
在B中,月跑步里程10月最大,故B正确;
在C中,月跑步里程高峰期大致在9,10月,从小到大依次为2月、8月、3月、4月、1月、5月、7月、6月、11月、9月、10月,故C正确;
在D中,1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳,故D正确.
故选BCD.
13.(多选)(2020·山东模拟)下图为某地区2006年~2018年地方财政预算内收入、城乡居民储蓄年末余额折线图.
根据该折线图可知,该地区2006年~2018年( )
A.财政预算内收入、城乡居民储蓄年末余额均呈增长趋势
B.财政预算内收入、城乡居民储蓄年末余额的逐年增长速度相同
C.财政预算内收入年平均增长量高于城乡居民储蓄年末余额年平均增长量
D.城乡居民储蓄年末余额与财政预算内收入的差额逐年增大
答案 AD
解析 由图可以看出两条曲线均在上升,选项A正确;图中两曲线间隔越来越大,说明年增长速度不同,差额逐年增大,选项B错误,选项D正确;又从图中可以看出财政预算内收入年平均增长量应该小于城乡居民储蓄年末余额年平均增长量,选项C错误.故选AD.
14.(多选)(2020·广东华附、省实、广雅、深中四校联考)随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,下图是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是( )
A.1月至8月空气合格天数超过20天的月份有5个
B.第二季度与第一季度相比,空气合格天数的比重下降了
C.8月是空气质量最好的一个月
D.6月的空气质量最差
答案 ABC
解析 1月至8月空气合格天数超过20天的月份有:1月,2月,6月,7月,8月,共5个,所以A是正确的;第一季度合格天数的比重为eq \f(22+26+19,31+29+31)≈0.736 3,第二季度合格天数的比重为eq \f(19+13+25,30+31+30)≈0.626 4,所以第二季度与第一季度相比,空气质量合格的天数的比重下降了,所以B是正确的;8月空气质量合格天气达到30天,是空气质量最好的一个月,所以C是正确的;5月空气质量合格天气只有13天,5月份的空气质量最差,所以D是错误的,故选ABC.
填空题
15.设某总体是由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第3列数字开始从左到右依次选取两个数字,则选出来的第6个个体编号为________.
1818 0792 4544 1716 5809 7983 8619
6206 7650 0310 5523 6405 0526 6238
【答案】由题意可得,选取的这6个个体分别为18,07,17,16,09,19,故选出的第6个个体编号为19.
答案:19
16.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.
【答案】设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=eq \f(5+15+25,0.75)=60.
答案:60
17.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则样本中三等品的件数为________.
答案 100
解析 由题意得,三等品的长度在区间[10,15),[15,20)和[35,40]内,
根据频率分布直方图可得三等品的频率为(0.012 5+0.025 0+0.012 5)×5=0.25,
∴样本中三等品的件数为400×0.25=100.
18.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 甲
解析 由题意可得eq \x\t(x)甲=eq \x\t(x)乙=9,
又∵seq \\al(2,甲)=eq \f(1,5)×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=eq \f(2,5),
seq \\al(2,乙)=eq \f(1,5)×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=eq \f(6,5)>seq \\al(2,甲),∴甲更稳定,故最佳人选应是甲.
19.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.
答案 10
解析 设5个班级中参加的人数分别为x1,x2,x3,x4,x5,则由题意知eq \f(x1+x2+x3+x4+x5,5)=7,
(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20,
五个整数的平方和为20,则必为0+1+1+9+9=20,
由|x-7|=3可得x=10或x=4.
由|x-7|=1可得x=8或x=6.
由上可知参加的人数分别为4,6,7,8,10,
故最大值为10.
20.气象意义上从春季进入夏季的标志为:连续5天每天日平均温度不低于22 ℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数,单位: ℃).
①甲地:5个数据的中位数为24,众数为22;
②乙地:5个数据的中位数为27,平均数为24;
③丙地:5个数据中有一个数据是32,平均数为26,方差为10.2.
则肯定进入夏季的地区有________个.
答案 2
解析 甲地肯定进入夏季,因为众数为22,所以22 ℃至少出现两次,若有一天低于22 ℃,则中位数不可能为24;丙地肯定进入,10.2×5-(32-26)2≥(26-x)2,所以15≥(26-x)2,若x≤22不成立;乙地不一定进入,如13,23,27,28,29,故答案为2.
解答题
21.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如表:(月均用水量的单位:吨)
(1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;
(2)估计样本的中位数是多少;
(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?
【答案】(1)频率分布表与相应的频率分布直方图和频率分布折线图如下:
(2)设中位数为x,因为月均用水量在[0.5,4.5)内的频率是0.12+0.24=0.36,月均用水量在[0.5,6.5)内的频率是0.12+0.24+0.40=0.76,所以x∈[4.5,6.5),则(x-4.5)×0.2=0.5-0.36,解得x=5.2.
故中位数是5.2.
(3)该乡每户月均用水量估计为
1.5×0.12+3.5×0.24+5.5×0.40+7.5×0.18+9.5×0.06=5.14,
由5.14×1 200=6 168,知上级支援该乡的月调水量是6 168吨.
22.共享单车入驻某市一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:
表(一)
表(二)
表(三)
(1)依据上述表格完成下列三个统计图:
(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.
解 (1)
(2)由表(一)可知:年龄在26岁~35岁之间的有40人,占总抽取人数的一半,用样本估计总体的思想可知,某城区30万人口中年龄在26岁~35岁之间的约有30×eq \f(1,2)=15(万人);又年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的eq \f(1,4),用样本估计总体的思想可知,城区年龄在26岁~35岁之间每月使用共享单车在7~14次之间的约有15×eq \f(1,4)=eq \f(15,4)(万人),所以年龄在26岁~35岁之间,每月使用共享单车在7~14次之间的人数约为eq \f(15,4)万人.
空调类
冰箱类
小家电类
其它类
营业收入占比
90.10%
4.98%
3.82%
1.10%
净利润占比
95.80%
-0.48%
3.82%
0.86%
最喜爱
喜爱
一般
不喜欢
4 800
7 200
6 400
1 600
网购金额(单位:千元)
人数
频率
(0,1]
16
0.08
(1,2]
24
0.12
(2,3]
x
p
(3,4]
y
q
(4,5]
16
0.08
(5,6]
14
0.07
总计
200
1.00
新农村
建设前
新农村
建设后
新农村建设
后变化情况
结论
种植收入
60%a
37%×2a=74%a
增加
A错
其他收入
4%a
5%×2a=10%a
增加了一倍以上
B对
养殖收入
30%a
30%×2a=60%a
增加了一倍
C对
养殖收入
+第三产
业收入
(30%+6%)a
=36%a
(30%+28%)
×2a=116%a
超过经济收入
2a的一半
D对
甲
10
8
9
9
9
乙
10
10
7
9
9
甲
10
8
9
9
9
乙
10
10
7
9
9
用水量分组
频数
频率
[0.5,2.5)
12
[2.5,4.5)
[4.5,6.5)
40
[6.5,8.5)
0.18
[8.5,10.5]
6
合计
100
1.00
用水量分组
频数
频率
[0.5,2.5)
12
0.12
[2.5,4.5)
24
0.24
[4.5,6.5)
40
0.40
[6.5,8.5)
18
0.18
[8.5,10.5]
6
0.06
合计
100
1.00
使用者
年龄段
25岁以下
26岁~35岁
36岁~45岁
45岁以上
人数
20
40
10
10
使用
频率
0~6
次/月
7~14
次/月
15~22
次/月
23~31
次/月
人数
5
10
20
5
满意度
非常满意
(9~10)
满意
(8~9)
一般
(7~8)
不满意
(6~7)
人数
15
10
10
5
相关学案
2024年高考数学第一轮复习精品导学案第82讲 随机抽样的方法、用样本估计总体(学生版)+教师版:
这是一份2024年高考数学第一轮复习精品导学案第82讲 随机抽样的方法、用样本估计总体(学生版)+教师版,共2页。学案主要包含了抽样方法,总体分布特征数的估计等内容,欢迎下载使用。
(新高考)高考数学一轮复习学案11.1《随机抽样、用样本估计总体》(含详解):
这是一份(新高考)高考数学一轮复习学案11.1《随机抽样、用样本估计总体》(含详解),共16页。学案主要包含了知识梳理,教材衍化等内容,欢迎下载使用。
高考数学统考一轮复习第11章11.4用样本估计总体学案:
这是一份高考数学统考一轮复习第11章11.4用样本估计总体学案,共10页。学案主要包含了知识重温,小题热身等内容,欢迎下载使用。