所属成套资源:2021年高考数学艺术生复习基础讲义(教师版+学生版)
2021年高考艺术生数学基础复习 考点17 特征数及抽样方法(教师版含解析)
展开这是一份2021年高考艺术生数学基础复习 考点17 特征数及抽样方法(教师版含解析),共35页。
考点17 特征数及抽样方法
知识理解
一. 三种抽样方法
(一)简单随机抽样
1.概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法(重点掌握随机数表法的读数)
3.适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.
(二)系统抽样
1.概念及步骤:假设要从容量为N的总体中抽取容量为n的样本,
第一步,先将总体的N个个体编号;
第二步,确定分隔间距,对编号进行分段,当(n是样本容量)是整数时,取k=;当(n是样本容量)不是整数时,先用简单随机抽样剔除-[]个个体,取k=[];
第三步,在第1段用简单随机抽样确定第一个个体编号l (l≤k);
第四步,按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.
2. 系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等.
3. 特征:等间隔抽样,每组抽一个号码,号码数符合等差数列的通项公式
三.分层抽样
1.概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
2.应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
3.特征:等比例抽样
二.频率分布直方图(表)
1.频率分布直方图基础概念
①纵轴表示,
②频率:数据落在各小组内的频率用各长长方形的面积表示
③各小长方形的面积总和等于1.
④分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.
2.频率分布直方图的步骤如下
(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ)列频率分布表;
(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.
三.茎叶图
1.概念:当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).
2.两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.
四.样本的数字特征
特征数
具体数字算法
频率分布直方图(表)
众数
次数出现最多的数字
频率最大或最高组的中间值
中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数
频率等于0.5时的横坐标
平均数
所有数字之和除以总个数
每个小矩形面积乘以小矩形底边中点的横坐标之和
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2].
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定
考向分析
考向一 抽样方法
【例1】(1)(2020·全国高三专题练习)福利彩票“双色球”中红球的号码可以从,,,…,,这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的个号码,选取方法是从第行第列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )
A. B. C. D.
(2)(2020·全国高三专题练习)某校高一、高二、高三共有2800名学生,为了解暑假学生在家的每天学习情况,计划用分层抽样的方法抽取一个容量为56人的样本,已知从高二学生中抽取的人数为19人,则该校高二学生人数为( )
A.900 B.950 C.1000 D.1050
(3)(2020·云南省保山第九中学高三月考)某一考场有64个试室,试室编号为001﹣064,现根据试室号,采用系统抽样法,抽取8个试室进行监控抽查,已抽看了005,021试室号,则下列可能被抽到的试室号是( )
A.029,051 B.036,052 C.037,053 D.045,054
(4)(2020·全国高三专题练习)某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:
①7,37,67,97,127,157,187,217,247,277;
②5,9,100,107,121,180,195,221,265,299;
③11,41,71,101,131,161,191,221,251,281;
④31,61,91,121,151,181,211,241,271,299.
关于上述样本的下列结论中,正确的是( )
A.②④都不能为分层抽样 B.①③都可能为分层抽样
C.①④都可能为系统抽样 D.②③都不能为系统抽样
【答案】(1)C(2)B(3)C(4)B
【解析】(1)被选中的红色球的号码依次为,,,,,,所以第四个被选中的红色球的号码为.故选:C.
(2)由高一、高二、高三共有2800名学生,用分层抽样的方法抽取一个容量为56人的样本,
因为从高二学生中抽取的人数为19人,可得高二学生的人数为人.故选:B.
(3)每八个抽取一个,第一个是,故后面编号为,当时,编号为037当时,编号为.故选:C.
(4)若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;
若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个;
若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.
①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;
②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;
③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;
④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.
综上所述,B选项正确.故选:B.
【举一反三】
1.(2020·全国高三专题练习)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第5个零件编号是( )
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
A.36 B.16 C.11 D.14
【答案】C
【解析】利用随机数表,从第一行第3列开始,由左至由一次读取,即47开始读取,在编号范围内的提取出来,可得,则选出来的第5个零件编号是.故选:C.
2.(2020·全国高三专题练习)在一次数学考试中,高二理8班56名同学的成绩的茎叶图如图所示,若将同学的成绩由高分到低分编为1~56号,再用系统抽样从中抽取7人,则成绩在区间[70,86]的人数应抽取( )人
A.2 B.3 C.4 D.5
【答案】B
【解析】由茎叶图以及系统抽样从中抽取7人,得到抽取比例为,成绩在区间[70,86]的人数为,
抽取人数为.故选:B
3.(2020·全国高三专题练习)某学校从编号依次为,,…,的个学生中用系统抽样(等间距抽样)的方法抽取一个容量为样本,已知样本中的有个编号为,则样本中最大的编号为( )
A. B. C. D.
【答案】C
【解析】依题意知系统抽样的组距为,为第二组的编号,即,所以第一组抽取的编号为,则样本中最大的编号即第20组的编号为:.故选:C.
4.(2020·舒兰市实验中学校高三学业考试)某工厂生产、、三种不同型号的产品,产品的数量之比依次为,现用分层抽样的方法抽出容量为的样本,样本中型产品有件,那么样本容量为( )
A. B. C. D.
【答案】C
【解析】由题意可得,解得.故选:C.
5.(2020·全国高三专题练习)已知甲、乙、丙三个社区现分别有低收入家庭360户、270户、180户.若政府计划援助这三个社区中90户低收入家庭,现采用分层随机抽样的方法决定各社区户数,则甲社区中接受援助的低收入家庭的户数为( )
A.20 B.30 C.36 D.40
【答案】D
【解析】每个个体被抽到的概率等于
甲社区有低收入家庭360户,故甲社区中接受援助的低收入家庭的户数故选:D.
6.(2020·湖南长沙市·长郡中学高三其他模拟)要完成下列三项调查:①某商城从10台同款平板电脑中抽取4台作为商城促销的奖品;②某酒厂从某白酒生产线上抽取40瓶进行塑化剂检测:③某市从老、中、青三代市民中抽取100人调查他们网络购物的情况.适合采用的抽样方法依次为( )
A.①用简单随机抽样:②③均用系统抽样
B.①用抽签法;②③均用系统抽样
C.①用抽签法:②用分层抽样:③用系统抽样
D.①用随机数表法;②用系统抽样;③用分层抽样
【答案】D
【解析】对于①,所收集的数据没有明显差异,且数量较少,应用抽签法;对于②,所收集的数据没有明显差异,且数量较多,应用系统抽样;对于③,所收集的数据差异明显,应用分层抽样;故选:D.
考向二 频率分布直方图(表)
【例2】(1)(2020·全国高三专题练习)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17~18岁的男生的体重(千克),将他们的体重按[54.5,56.5),[56.5,58.5),…,[74.5,76.5]分组,得到频率分布直方图如图所示.由图可知这100名学生中体重在[56.5,64.5)的学生人数是( )
A.20 B.30
C.40 D.50
(2)(2020·全国高三专题练习)某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为( )
A.600 B.30 C.60 D.300
【答案】(1)C(2)A
【解析】(1)由频率分布直方图可得体重在[56.5,64.5)的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,
则这100名学生中体重在[56.5,64.5)的学生人数为100×0.4=40.故选:C.
(2)因为成等差数列,所以,
由频率分布直方图可得,即,
所以.故消费金额超过150元的频率为,
故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.故选:A.
【举一反三】
1.(2020·全国高三专题练习)为了评估某家快递公司的服务质量,某评估小组进行了客户满意度调查,从该公司参与调查的客户中随机抽取500名客户的评分,评分均在区间上,分组为,,,,其频率分布直方图如图所示.规定评分在60分以下表示对该公司的服务质量不满意,则这500名客户中对该公司的服务质量不满意的客户的人数为( )
A.15 B.16 C.17 D.18
【答案】A
【解析】由频率分布直方图可知,评分在区间上的频率,
所以评分在区间上的客户有(人),即对该公司的服务质量不满意的客户有15人.
故选:A
2.(2021·天津高三其他模拟)某校对高三年级学生的数学成绩进行统计分析.全年级同学的成绩全部介于80分与150分之间,将他们的成绩按照,,,,,,分组后得到的频率分布直方图如图所示.现从全体学生中根据成绩采用分层抽样的方法抽取80名同学的试卷进行分析,则从成绩在内的学生中抽取的人数为( )
A.24 B.36 C.20 D.28
【答案】A
【解析】,解得.
所以成绩在内的学生中抽取的人数为.故选:A
3.(2020·全国高三专题练习)我国在贵州省平塘县境内修建的500米口径球面射电望远镜(FAST)是目前世界上最大单口径射电望远镜.截至2019年8月28日,该射电望远镜已发现132颗优质的脉冲星候选体,其中有93颗已被确认为新发现的脉冲星.脉冲星是20世纪60年代天文学的四大发现之一,脉冲星就是正在快速自转的中子星,每一颗脉冲星每两脉冲间隔时间(脉冲星的自转周期)是一定的,最小的小到0.0014秒,最长的也不过11.765735秒.某一天文研究机构观测并统计了93颗已被确认为新发现的脉冲星的自转周期,绘制了如图所示的频率分布直方图.在93颗新发现的脉冲星中,自转周期在2至10秒的颗数大约为( )
A.47 B.86 C.79 D.70
【答案】C
【解析】由频率分布直方图可知,自转周期在0至2秒的频率为,
自转周期在10至12秒的频率为,
所以自转周期在2至10秒的频率为,
所以自转周期在2至10秒的颗数大约为,故选:C.
考向三 特征数的计算
【例3-1】(1)(2020·全国高三专题练习)甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )
A.极差 B.方差
C.平均数 D.中位数
(2)(2020·全国高三专题练习)已知一组数据,,的平均数是5,方差是4则由,,,11这4个数据组成的新的一组数据的方差是( )
A.16 B.14 C.12 D.8
【答案】(1)C(2)C
【解析】(1)由茎叶图可得:甲的数据更集中,乙的数据较分散,所以甲与乙的方差不同;
甲的极差为;乙的极差为,所以甲与乙的极差不同;
甲的中位数为,乙的中位数为,所以中位数不同;
甲的平均数为,
乙的平均数为,所以甲、乙的平均数相同;故选:C.
(2)由已知得,,
则新数据的平均数为,
所以方差为
,故选:C
【例3-2】(2020·全国高三专题练习)某市有100万居民,政府为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如下的频率分布直方图:
(1)求直方图中的值;
(2)估计居民月均用水量的众数、中位数(精确到0.01).
【答案】(1);(2)众数2.25吨,中位数约为2.06吨.
【解析】(1)由频率分布直方图得:
,
解得.
(2)由频率分布直方图估计居民月均用水量的众数为:
.,的频率为:,,的频率为:,
中位数为:
【方法总结】
直方图的主要性质有:
(1) 直方图中各矩形的面积之和为;
(2) 组距与直方图纵坐标的乘积为该组数据的频率;
(3) 每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;
(4)直方图左右两边面积相等处横坐标表示中位数.
【举一反三】
1.(2020·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为,,,,.下面给出的指标可以用来评估该贫困户年收入的稳定程度( )
A.,,,,的平均数 B.,,,,的标准差
C.,,,,的最大值 D.,,,,的中位数
【答案】B
【解析】标准差反映了各数据对平均数的偏离,反映了一组数据的离散程度,在本题中即稳定程度,
而其他的统计量则不能反映稳定程度,故选:B
2.(2020·全国高三专题练习)已知数据的平均数为,方差为,则,,…,的平均数和方差分别为( )
A.和 B.和
C.和 D.和
【答案】B
【解析】因为数据的平均数为,方差为,
所以,,…,的平均数和方差分别为和故选:B
3.(2020·四川宜宾市·高三一模)某团支部随机抽取甲乙两位同学连续9期“青年大学习”的成绩(单位:分),得到如图所示的成绩茎叶图,关于这9期的成绩,则下列说法正确的是( )
A.甲成绩的平均数高于乙成绩的平均数
B.乙成绩的极差为40
C.甲乙两人成绩的众数相等
D.甲成绩的中位数为32
【答案】D
【解析】根据茎叶图数据知:
甲同学的平均分为,
乙同学的平均分为,,故甲同学成绩的平均数低于乙同学成绩的平均数,A错误;
乙同学成绩最高52,最低10,故极差为42,故B错误;
甲同学成绩的众数为32,乙同学成绩的众数为42,不相等,故C错误;
甲同学成绩的中位数为32,故D正确.
故选:D.
4.(2020·广东江门市·高三月考)某学校组织学生参加数学测试,某班成绩的频率分布直方图如图,数据的分组依次为,,,.由此估计该班学生此次测试的平均分为_________.
【答案】68
【解析】由频率分布直方图可得平均数为.
故答案为:68.
5.(2020·全国高三月考)为了调查某阶层月工资收入,某地政府对该阶层1000人进行了调查,并根据调查结果画出如图所示的频率分布直方图,则这1000人的月工资收入的中位数为______.(百元)
【答案】24
【解析】前2组的频率为,前3组的频率为,故中位数在第三组中,设中位数为,则,解得.
故答案为:24.
考向四 统计图解读
【例4】(2020·江苏海门市·高三月考)2019年1月到2019年12月某地新能源汽车配套公共充电桩保有量如下:
则下列说法正确的是( )
A.2019年各月公共充电桩保有量一直保持增长态势
B.2019年12月较2019年11月公共充电桩保有量增加超过2万台
C.2019年6月到2019年7月,公共充电桩保有量增幅最大
D.2019年下半年各月公共充电桩保有量均突破45万台
【答案】A
【解析】对于A,2019年各月公共充电桩保有量逐步增加,故一直保持增长态势,故A正确.
对于B,2019年12月较2019年11月公共充电桩保有量增加量为:,故B错.
对于C,2019年6月到2019年7月,公共充电桩保有量增幅约,
而2019年2月到2019年3月,公共充电桩保有量增幅约,故C错误;
2019年7月公共充电桩保有量小于45万台,故D错误.故选:A.
【举一反三】
1.(2020·全国高三专题练习)湖上升明月是中国第一座“露天博物馆”,它的建设目标是创建国家5A级风景旅游区,建成后对丰富皖北旅游资源,完善安徽省旅游战略格局,具有重要意义,建成后它将是国内规模最大、建筑类型最多、文化内涵丰富、服务设施完善的古名居博览园,如图是市旅游局为做好开园迎客准备,查阅资料时查到的安徽某景区近几年的游客人数变化情况的柱状图:以下说法错误的是( )
A.与上一年比2018年增幅最大
B.从2016年开始,游客人数明显增多
C.近8年游客人数的平均数大于2016年游客人数
D.该景区游客人数逐年上升
【答案】A
【解析】对于A,从图中可得,2018年增加210万人次,而2019年增加230万人次,所以2019年增幅最大,所以A错误;
对于B,从图中的数据可看出,从2016年开始,游客人数明显增多,所以B正确;
对于C,近8年游客人数的平均数为,即近8年游客人数的平均数大于2016年游客人数,所以C正确;
对于D,从柱状图可看出,该景区游客人数逐年上升,所以D正确,
故选:A
2.(2020·全国高三专题练习)为了解大学生对体育锻炼的兴趣,某高校从4万多名在校大学生中抽取了男、女生各200名进行了调查,得到如下统计图:
对比两图中信息并进行分析,下列说法正确的是( )
A.大量出汗并感到很疲乏的男生人数是女生人数的2倍
B.男生中运动时间超过1小时的超过
C.女生的平均运动强度高于男生的平均运动强度
D.运动时间在小时内的男生人数与运动时间在小时内的女生人数相同
【答案】D
【解析】对于A,大量出汗并感到很疲乏的男生超过110人,而女生约50人,因此大量出汗并感到很疲乏的男生人数比女生人数的2倍还要多,因此A不正确;
对于B,男生中运动时间在小时内的超过70人,占所有男生的比例超过,因此男生中运动时间超过1小时的占比没达到,因此B不正确;
对于C,由图易知男生的平均运动强度高于女生的平均运动强度,因此C不正确;
对于D,运动时间在小时内的男生人数有50人,运动时间在小时内的女生人数也有50人,因此D正确.故选:D.
3.(多选)(2020·福建厦门市·厦门双十中学高三月考)某人退休前后各类支出情况如下,已知退休前工资收入为8000元月,退休后每月储蓄的金额比退休前每月储蓄的金额少1500元,则下面结论中正确的是( )
A.该教师退休前每月储蓄支出2400元
B.该教师退休后的旅行支出是退休前旅行支出的3倍
C.该教师退休工资收入为6000元月
D.该教师退休后的其他支出比退休前的其他支出少
【答案】ACD
【解析】退休前工资收入为8000元月,每月储蓄的金额占,则该教师退休前每月储蓄支出元,故A正确;
该教师退休后每月储蓄的金额比退休前每月储蓄的金额少1500元,
则该教师退休后每月储蓄的金额为900元,设该教师退休工资收入为元月,则,即元月,故C正确;
该教师退休前的旅行支出为元,退休后的旅行支出为元,
该教师退休后的旅行支出是退休前旅行支出的 倍,故B错误;
该教师退休前的其他支出为元,退休后的其他支出为元,
该教师退休后的其他支出比退休前的其他支出少,故D正确.故选:ACD.
强化练习
一、单选题
1.(2020·广东清远市·高三期末)清远市教育教学研究院想了解清远市某所中学的学生是否赞成该学校的某个新政策,由于条件限制,教学研究院不能询问每位学生的意见,所以需要选择一个合适的样本.最好的方法是询问( )
A.由该学校推选的学生
B.在课间遇见的学生
C.在图书馆学习的学生
D.从学校名单中随机选取的学生
【答案】D
【解析】按照随机的原则,即保证总体中每一个对象都有已知的、非零的概率被选入作为研究的对象,保证样本的代表性。随机抽样法就是调查对象总体中每个部分都有同等被抽中的可能,是一种完全依照机会均等的原则进行的抽样调查,被称为是一种“等概率”。ABC三个抽样方法,不能保证等可能,D选项可以保证等可能,所以最好的方法是D.故选:D
2.(2020·河南高三月考)某影院有60排座位,每排70个座号,一次报告会坐满了听众,会后留下座号为15的所有听众60人进行座谈,这是运用了( )
A.抽签法 B.随机数法 C.系统抽样法 D.分层抽样法
【答案】C
【解析】由系统抽样的特点可知,要求留下座位号为15的听众留下进行座谈,这样选出的样本是符合系统抽样的特点的,故选C.
3.(2020·广西高三一模)2018年1月,中共中央、国务院发出《关于开展扫黑除恶专项斗争的通知》.今天,“扫黑除恶”进入深水区,为了了解人民群众对全国公安机关的满意程度,2019年5月1日,政府工作人员在某商场门口随机抽一个人询问调查,直到调查到事先规定的调查人数为止,这种抽样方式是( )
A.简单随机抽样 B.系统抽样
C.分层抽样 D.非以上三种抽样方法
【答案】D
【解析】根据简单随机抽样、系统抽样和分层抽样的特征可知,
本题既不是系统抽样,也不是分层抽样,它的形式类似于简单随机抽样,但它不符合简单随机抽样的两种形式:抽签法和随机数表法.故选:D.
4(2020·全国高三专题练习)完成下列抽样调查,较为合理的抽样方法依次是( )
①从件产品中抽取件进行检查;
②某校高中三个年级共有人,其中高一人、高二人、高三人,为了了解学生对数学的建议,拟抽取一个容量为的样本;
③某剧场有排,每排有个座位,在一次报告中恰好坐满了听众,报告结束后,为了了解听众意见,需要请名听众进行座谈.
A.简单随机抽样,系统抽样,分层抽样; B.分层抽样,系统抽样,简单随机抽样;
C.系统抽样,简单随机抽样,分层抽样; D.简单随机抽样,分层抽样,系统抽样;
【答案】D
【解析】对于①,从件产品中抽取件进行检查,总体的数量较少,且个体差异不明显,符合简单随机抽样的特点;
对于②,该校高中的三个年级,是差异明显的三个部分,符合分层抽样的特点;
对于③,该剧场有排,每排有个座位,显然总体数量较多,又有编号,符合系统抽样的特点.
故选:D.
5.(2020·全国高三专题练习)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n座城市作试验基地.这n座城市共享单车的使用量(单位:人次/天)分别为x1,x2,…,xn,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
【答案】B
【解析】平均数、中位数可以反映一组数据的集中程度;最值不能反映稳定程度;
方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选:B.
6.(2020·全国高三专题练习)如图是某位同学近5次数学测试成绩(单位:分)的茎叶图,其中有一次测试成绩记录不清楚,其末位数记为,若该同学这5次数学测试成绩的中位数是分,则该同学这5次数学测试成绩的平均数不可能是( )
A.123.4分 B.123.6分
C.123.8分 D.124分
【答案】D
【解析】因为该同学这5次数学测试成绩的中位数是分,所以的所有可能取值为,,,
当时,平均数为分;同理可得,
当时,平均数为分;当时,平均数为分.故选:D.
7.(2020·全国高三专题练习)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:
若将运动员按成绩由好到差编号为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]内的运动员人数是( )
A.3 B.4 C.5 D.6
【答案】B
【解析】根据茎叶图以及系统抽样的特征将每组的成绩列出如下:
第一组(130,130,133,134,135),
第二组(136,136,138,138,138),
第三组(139,141,141,141,142),
第四组(142,142,143,143,144),
第五组(144,145,145,145,146),
第六组(146,147,148,150,151),
第七组(152,152,153,153,153),
故成绩在[139,151]上恰有4组,故有4人.
故选:B.
8.(2020·全国高三专题练习)为比较甲、乙两地某月时的气温情况,随机选取该月中的天,将这天中时的气温数据(单位:℃)制成如图所示的茎叶图,考虑以下结论:
①甲地该月时的平均气温低于乙地该月时的平均气温
②甲地该月时的平均气温高于乙地该月时的平均气温
③甲地该月时的气温的标准差小于乙地该月时的气温的标准差
④甲地该月时的气温的标准差大于乙地该月时的气温的标准差
其中根据茎叶图能得到的正确结论的编号为( )
A.①③ B.①④
C.②③ D.②④
【答案】C
【解析】由茎叶图和平均数公式可得甲、乙两地的平均数分别是,
,则甲地该月时的平均气温高于乙地该月时的平均气温,
①错误,②正确,排除A和B;
又甲、乙两地该月时的标准差分别是
,
,
则甲地该月时的气温的标准差小于乙地该月11时的气温的标准差,③正确,④错误.
故选:C.
9.(2020·舒兰市实验中学校高三学业考试)样本容量为200的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在内的频数为( )
A.16 B.32 C.64 D.128
【答案】C
【解析】由题可得:内的频率为,所以样本数据落在内的频数为.故选:C
10.(2020·全国高三专题练习)气象意义上从春季进入夏季的标志为“连续天的日平均温度均不低于””.现有甲、乙、丙三地连续天的日平均温度的记录数据(记录数据都是正整数,单位:):
①甲地:个数据的中位数为,众数为;
②乙地:个数据的中位数为,总体均值为;
③丙地:个数据中有个数据是,总体均值为,总体方差为.
其中肯定进入夏季的地区有( )
A.①② B.①③
C.②③ D.①②③
【答案】B
【解析】甲地的个数据的中位数为24,众数为22,则甲地连续天的日平均温度的记录数据中必有,,,其余2天的记录数据大于24,且不相等,故甲地符合进入夏季的标准;乙地的个数据的中位数为,总体均值为,当个数据为,,,,时,其连续天的日平均温度中有低于的,此时乙地不符合进入夏季的标准;
丙地的个数据中有个数据是,总体均值为,设其余个数据分别为,,,,则总体方差
,
若,,,有小于的数据时,则,即,不满足题意,所以,,,均大于或等于,故丙地符合进入夏季的标准.
综上所述,肯定进入夏季的地区有①③.
故选:B.
11.(2020·江西新余市·新余一中高三其他模拟)某学生准备参加某科目考试,在12次模拟考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的众数与中位数分别为( )
A.95,94 B.95,95
C.93,94.5 D.95,94.5
【答案】D
【解析】出现次数最多的数是95,所以众数为95;从小到大排列,中间两数为94,95,
所以中位数为.故选:D.
12.(2020·深圳市龙岗区龙城高级中学高三月考)设有个样本,,,,其标准差是,另有个样本,,且,则其标准差为( )
A. B. C. D.
【答案】D
【解析】由题意可得个样本,,,平均数为,
则,
所以,
个样本,的平均数为
方差为
,
故标准差为:,故选:D
13.(2020·深圳市龙岗区龙城高级中学高三月考)在样本的频率分布直方图中,共有个小长方形,这个小长方形的面积由小到大依次构成等比数列,已知,且样本容量为,则对应小长方形面积最大的一组的频数为( )
A. B. C. D.
【答案】D
【解析】设等差数列的公比为,则,所以,
所以这个小长方形的面积由小到大依次为,,,,
所以,解得:,
所以对应小长方形面积最大的一组的频数为,
故选:D
14.(2020·全国高三专题练习)对一个容量为的总体抽取容量为的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为,,,,则( )
A. B.
C. D.
【答案】D
【解析】根据抽样调查的原理可得简单随机抽样、分层抽样、系统抽样都必须满足每个个体被抽到的概率相等,即,故选:D
15.(2020·天津市武清区杨村第一中学高三期中)某辆汽车每次加油都把油箱加满,下表记录了该车相邻两次加油时的情况.
加油时间
加油量(升)
加油时的累计里程(千米)
2020年5月1日
12
35000
2020年5月15日
60
35600
注:“累计里程”指汽车从出厂开始累计行驶的路程.在这段时间内,该车每百千米平均耗油量为( )
A.6升 B.8升 C.10升 D.12升
【答案】C
【解析】因为每次都把油箱加满,第二次加了升油,说明这段时间总耗油量为升,
而行驶的路程为 (千米),故每千米平均耗油量为 (升).故选:C.
16.(2020·湖北高三学业考试)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了50根棉花的纤维长度(单位:mm),其频率分布直方图如图所示.根据频率分布直方图,估计事件“棉花的纤维长度大于275mm”的概率为( )
A.0.30 B.0.48 C.0.52 D.0.70
【答案】C
【解析】“棉花的纤维长度大于275mm”的概率为.故选:C
17.(2020·广东广州市·高三月考)某学校鼓励学生参加社区服务,学生甲2019年每月参加社区服务的时长(单位:小时)分别为,,…,,其均值和方差分别为和,若2020年甲每月参加社区服务的时长增加1小时,则2020年甲参加社区服务时长的均值和方差分别为( )
A., B., C., D.,
【答案】D
【解析】由题意可知,,
设2020年甲参加社区服务时长的均值和方差分别为,,则
,
故选:D
18(2020·全国高三专题练习)某高校大一新生中,来自东部地区的学生有人,中部地区学生有人、西部地区学生有人.从中选取人作样本调研饮食习惯.为保证调研结果相对准确,下列判断正确的有( )
①用分层抽样的方法分别抽取东部地区学生人、中部地区学生人、西部地区学生人;
②用简单随机抽样的方法从新生中选出人;
③西部地区学生小刘被选中的概率为;
④东部地区学生小张被选中的概率比中部地区的学生小王被选中的概率大.
A.①④ B.①③ C.①③④ D.②③
【答案】B
【解析】由题意得,应该选择分层抽样,故②错误,若采用分层抽样,则抽样比为,则分别抽取东部地区学生人,中部地区学生人,西部地区学生人,故①正确;
而采用分层抽样时,每个个体别选到的概率一样都为,故③正确,④错误.
故选:B.
19.(2020·全国高三专题练习)假设要考察某公司生产的克袋装牛奶的质量是否达标,现从袋中抽取袋进行检验,利用随机数表抽样时,先将袋牛奶按、、、进行编号,如果从随机数表第行第列开始向右读,请你写出抽取检测的第袋牛奶的编号是( )(下面摘取了随机数表第行至第行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
A. B. C. D.
【答案】B
【解析】由题意可知,样本中前个个体的编号分别为、、、、.
因此,抽取检测的第袋牛奶的编号是.故选:B.
20.(2020·云南高三期中)2020年10月1日是中秋节和国庆节双节同庆,很多人外出旅行或回家探亲,因此交通比较拥堵.某交通部门为了解从A城到B城实际通行所需时间,随机抽取了n台车辆进行统计,结果显示这些车辆的通行时间(单位:分钟)都在内,按通行时间分为,,,,五组,频率分布直方图如图所示,其中通行时间在内的车辆有235台,则通行时间在内的车辆台数是( )
A.450 B.325 C.470 D.500
【答案】C
【解析】因为,,,四组通行时间的频率分别是0.1,0.25,0.4,0.05,
所以通行时间在内的频率是,通过的车辆台数是.
故选:C.
二、多选题
21.(2020·湖南高三月考)某校对120名考生的数学竞赛成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图,则下列说法正确的是( )
A.
B.该校学生数学竞赛成绩落在内的考生人数为24
C.该校学生数学竞赛成绩的中位数大于80
D.估计该校学生数学竞赛成绩的平均数落在内
【答案】BD
【解析】对于A,由频率分布直方图性质得:,解得,故A错误;
对于B,由频率分布直方图得成绩落在的概率为0.2,人数为,故B正确;
对于C,由频率分布直方图得:的频率为,的频率为,所以成绩的中位数位于内,故C错误;
对于D,估计成绩的平均数为:所以成绩的平均数落在内,故D正确.
故选:BD.
22.(2020·广东高三月考)空气质量指数是反映空气质量状况的指数,指数值越小,表明空气质量越好,其对应关系如表:
指数值
空气质量
优
良
轻度污染
中度污染
重度污染
严重污染
如图是某市12月1日日指数变化趋势,则下列叙述正确的是( )
A.这20天中指数值的中位数略高于100
B.这20天中的中度污染及以上的天数占
C.该市12月的前半个月的空气质量越来越好
D.总体来说,该市12月,上旬的空气质量比中旬的空气质量好
【答案】AD
【解析】对:将这20天的数据从小到大排序后,第10个数据略小于100,
第11个数据约为120,因为中位数是这两个数据的平均数,故中位数略高于100是正确的,故A正确:
对:这20天中,指数大于150的有5天,故中度污染及以上的天数占,故B错误;
对:由折线图可知,前5天空气质量越来越好,从6日开始至15日越来越差,故C错误;
对:由折线图可知,上旬大部分指数在100以下,中旬指数大部分在100以上,故上旬空气质量比中旬的要好.故D正确.
故选: AD
23.(2020·全国高三专题练习)下列命题中是真命题的有( )
A.有A,B,C三种个体按的比例分层抽样调查,如果抽取的A个体数为9,则样本容量为30
B.一组数据1,2,3,3,4,5的平均数、众数、中位数相同
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是甲
D.某一组样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在区间内的频率为
【答案】BD
【解析】对于选项A:根据样本的抽样比等于各层的抽样比,样本容量为,故选项A 不正确;
对于选项B:数据1,2,3,3,4,5的平均数为,众数和中位数都是,故选项B正确;
对于选项C:乙组数据的平均数为,乙组数据的方差为
,所以这两组数据中较稳定的是乙,故选项C不正确;
对于选项D:样本数据落在区间有120,122,116,120有个,所以样本数据落在区间内的频率为,故选项D,
故选:BD
24.(2020·全国高三专题练习)比较甲、乙两名学生的数学学科素养的各项能力指标值(满分为5分,分值高者为优),绘制了如图所示的六维能力雷达图,例如图中甲的数学抽象指标值为4,乙的数学抽象指标值为5,则下面叙述正确的是( )
A.甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值
B.甲的数学建模能力指标值优于乙的直观想象能力指标值
C.乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平
D.甲的数学运算能力指标值优于甲的直观想象能力指标值
【答案】AC
【解析】对于A选项,甲的逻辑推理能力指标值为4,乙的逻辑推理能力指标值为3,所以甲的逻辑推理能力指标值优于乙的逻辑推理能力指标值,故选项A正确;
对于B选项,甲的数学建模能力指标值为3,乙的直观想象能力指标值为5,所以乙的数学建模能力指标值优于甲的直观想象能力指标值,故选项B错误;
对于C选项,甲的六维能力指标值的平均值为,乙的六维能力指标值的平均值为,所以乙的六维能力指标值整体水平优于甲的六维能力指标值整体水平,所以选项C正确;
对于D选项,甲的数学运算能力指标值为4,甲的直观想象能力指标值为5,所以甲的数学运算能力指标值不优于甲的直观想象能力指标值,所以选项D错误.
故选:AC.
25.(2020·全国高三其他模拟)物流业景气指数反映物流业经济发展的总体变化情况,以50%作为经济强弱的分界点,高于50%时,反映物流业经济扩张;低于50%时,则反映物流业经济收缩.如图所示为中国物流与采购联合会发布的2020年1~7月的中国物流业景气指数,则下列说法正确的是( )
A.2月份物流业景气指数最低,6月份物流业景气指数最高
B.1,2月份物流业经济收缩,3~7月份物流业经济扩张
C.2月份到7月份的物流业景气指数一直呈上升趋势
D.4月份的物流业景气指数与2月份相比增加了一倍以上
【答案】ABD
【解析】由统计图可得2月份物流业景气指数为26.2%,最低,6月份物流业景气指数为54.9%,最高,故A项正确;1,2月份的物流业景气指数都低于50%,3~7月份的物流业景气指数都高于50%,所以B项正确;7月份的物流业景气指数低于6月份的物流业景气指数,所以7月份的物流业景气指数不是上升,而是下降,故C项错误;因为,所以4月份的物流业景气指数与2月份相比增加了一倍以上,故D项正确.故选:ABD
三、填空题
26.(2020·全国高三专题练习)某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,若用分层抽样方法,则40岁以下年龄段应抽取___________人.
【答案】20
【解析】由年龄分布情况图可得40岁以下年龄段应抽取(人),故答案为:.
27.(2020·全国高三专题练习)从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.
三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________;乙:________;丙:________.
【答案】众数 平均数 中位数
【解析】甲厂数据的众数是8,乙厂数据的平均数是8,丙厂数据的中位数是8.
故答案为:众数;平均数;中位数
28.(2020·全国高三专题练习(文))一组数据,,,,,,若该数据的众数是中位数的倍,则该数据的方差为______.
【答案】
【解析】根据题意知,该组数据的众数是,则中位数是3,把这组数据从小到大排列,为1,2,2,x,5,10,则,解得:,
这组数据的平均数为,
方差为.故答案为:.
29.(2020·全国高三专题练习(文))在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制成如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是________.
【答案】15
【解析】根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故答案为:15
30.(2020·全国高三专题练习(理))某学校高一、高二、高三年级的学生人数之比为,现用分层抽样的方法从该校高中三个年级的学生中抽取一个容量为的样本,则应从高一年级抽取________名学生.
【答案】
【解析】因为高一、高二、高三年级的学生人数之比为,所以高一年级占总人数的,故应从高一年级抽取的学生人数为.故答案为:.
31.(2020·江西高三其他模拟)甲、乙两人在我校举行的“传承红色经典,纪念抗美援朝70周年”演讲比赛中,6位评委的评分情况如下方茎叶图所示,其中甲的成绩的中位数是82,乙的成绩的平均数是84,若正实数a,b满足:x,,y成等差数列,则的最小值为_____.
【答案】
【解析】由茎叶图可知:,.
∵正实数a,b满足:x,a,b,y成等差数列;
∴;
∴
.
当且仅当,时等号成立.
故答案为:.
32.(2020·贵溪市实验中学高三月考)甲乙两名链球运动员在比赛中各投掷5次,成绩如表(单位:米)
甲
78
80
77
81
84
乙
76
80
85
82
77
分别表示甲、乙两人比赛成绩的方差,则的大小关系是_____________.(用、、连接)
【答案】
【解析】,
,
,
,
则,
故答案为:.
33.(2020·吉林市第二中学高三期中)已知样本方差,则样本的方差为_______.
【答案】4
【解析】由题意,样本数据的方差,
设样本的方差为,则.
故答案为:4.
34.(2020·宜宾市叙州区第二中学校高三月考(理))学校田径队有男运动员28人,女运动员21人,用分层抽样的方法从全体运动员中抽取7人组建集训队进行训练,一段时间后,再从集训队中抽取3人代表学校参加比赛,则这3人中男、女运动员都有的选法种数为______(用数字作答).
【答案】30;
【解析】根据题意,学校田径队有男运动员28人,女运动员21人,共人,
用分层抽样的方法从全体运动员中抽取7人,
则应抽取男运动员人,女运动员人,
再从7人中抽取3人代表学校参加比赛,有种,
其中只有男运动员的有种,只有女运动员则有种,
则这3人中男、女运动员都有的选法有种;
故答案为:30
35.(2020·全国高三专题练习)已知数据x1,x2,…,xn的平均数=5,方差s2=4,则数据3x1+7,3x2+7,…,3xn+7的平均数为________,标准差为________.
【答案】22 6
【解析】数据3x1+7,3x2+7,…,3xn+7的平均数为3×5+7=22,方差为32×4=36,则标准差为6.
故答案为:22;6
相关教案
这是一份2021年高考艺术生数学基础复习 考点42 圆的方程(教师版含解析),共18页。教案主要包含了圆的方程,点与圆的位置关系,直线与圆的位置关系,圆与圆的位置关系等内容,欢迎下载使用。
这是一份2021年高考艺术生数学基础复习 考点04 复数(教师版含解析),共12页。教案主要包含了复数的实部与虚部,复数的象限,复数的模长,复数的分类,复数的轨迹等内容,欢迎下载使用。
这是一份2021年高考艺术生数学基础复习 考点44 双曲线(教师版含解析),共29页。教案主要包含了直线与曲线的位置关系,弦长,离心率与渐近线等内容,欢迎下载使用。