


艺考生专题讲义35 特征数与抽样方法-2024-2025学年高考数学艺体生一轮复习试题
展开
这是一份艺考生专题讲义35 特征数与抽样方法-2024-2025学年高考数学艺体生一轮复习试题,共13页。试卷主要包含了概念,最常用的简单随机抽样的方法,适用范围是,5,56,5,64,3=600等内容,欢迎下载使用。
一.三种抽样方法
(一)简单随机抽样
1.概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法(重点掌握随机数表法的读数)
3.适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.
(二)系统抽样
1.概念及步骤:假设要从容量为N的总体中抽取容量为n的样本,
第一步,先将总体的N个个体编号;
第二步,确定分隔间距,对编号进行分段,当eq \f(N,n)(n是样本容量)是整数时,取k=eq \f(N,n);当eq \f(N,n)(n是样本容量)不是整数时,先用简单随机抽样剔除eq \f(N,n)-[eq \f(N,n)]个个体,取k=[eq \f(N,n)];
第三步,在第1段用简单随机抽样确定第一个个体编号l (l≤k);
第四步,按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.
系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等.
特征:等间隔抽样,每组抽一个号码,号码数符合等差数列的通项公式
三.分层抽样
1.概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
2.应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
3.特征:等比例抽样
二.频率分布直方图(表)
1.频率分布直方图基础概念
①纵轴表示eq \f(频率,组距),
②频率:数据落在各小组内的频率用各长长方形的面积表示
③各小长方形的面积总和等于1.
④分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.
2.频率分布直方图的步骤如下
(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ)列频率分布表;
(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.
三.样本的数字特征
精讲精练
题型一 抽样方法
【例1】(1)(2024·全国高三专题练习)福利彩票“双色球”中红球的号码可以从,,,…,,这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的个号码,选取方法是从第行第列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )
A.B.C.D.
(2)(2024·全国高三专题练习)某校高一、高二、高三共有2800名学生,为了解暑假学生在家的每天学习情况,计划用分层抽样的方法抽取一个容量为56人的样本,已知从高二学生中抽取的人数为19人,则该校高二学生人数为( )
A.900B.950C.1000D.1050
(3)(2024·云南省保山第九中学高三月考)某一考场有64个试室,试室编号为001﹣064,现根据试室号,采用系统抽样法,抽取8个试室进行监控抽查,已抽看了005,021试室号,则下列可能被抽到的试室号是( )
A.029,051B.036,052C.037,053D.045,054
(4)(2024·全国高三专题练习)某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:
①7,37,67,97,127,157,187,217,247,277;
②5,9,100,107,121,180,195,221,265,299;
③11,41,71,101,131,161,191,221,251,281;
④31,61,91,121,151,181,211,241,271,299.
关于上述样本的下列结论中,正确的是( )
A.②④都不能为分层抽样B.①③都可能为分层抽样
C.①④都可能为系统抽样D.②③都不能为系统抽样
【答案】(1)C(2)B(3)C(4)B
【解析】(1)被选中的红色球的号码依次为,,,,,,所以第四个被选中的红色球的号码为.故选:C.
(2)由高一、高二、高三共有2800名学生,用分层抽样的方法抽取一个容量为56人的样本,
因为从高二学生中抽取的人数为19人,可得高二学生的人数为人.故选:B.
(3)每八个抽取一个,第一个是,故后面编号为,当时,编号为037当时,编号为.故选:C.
(4)若采用简单随机抽样,根据简单随机抽样的特点,1~300之间任意一个号码都有可能出现;
若采用分层抽样,则1~120号为一年级,121~210为二年级,211~300为三年级.且根据分层抽样的概念,需要在1~120之间抽取4个,121~210与211~300之间各抽取3个;
若采用系统抽样,根据系统抽样的概念,需要在1~30,31~60,61~90,91~ 120,121~150,151~180,181~210,211~240,241~270,271~300之间各抽一个.
①项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以①项为系统抽样或分层抽样;
②项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,可能为分层抽样;
③项,1~120之间有 4个,121~210之间有 3个,211~300之间有 3个,并且满足系统抽样的条件,所以③项为系统抽样或分层抽样;
④项,第一个数据大于30,所以④项不可能为系统抽样,并且④项不满足分层抽样的条件.
综上所述,B选项正确.故选:B.
【举一反三】
1.(2024·全国高三专题练习)某工厂为了对40个零件进行抽样调查,将其编号为00,01,…38,39.现要从中选出5个,利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第5个零件编号是( )
0647 4373 8636 9647 3661 4698 6371 6233 2616 8045 6011 1410
9577 7424 6762 4281 1457 2042 5332 3732 2707 3607 5124 5179
A.36B.16C.11D.14
【答案】C
【解析】利用随机数表,从第一行第3列开始,由左至由一次读取,即47开始读取,在编号范围内的提取出来,可得,则选出来的第5个零件编号是.故选:C.
2.(2024·全国高三专题练习)某学校从编号依次为,,…,的个学生中用系统抽样(等间距抽样)的方法抽取一个容量为样本,已知样本中的有个编号为,则样本中最大的编号为( )
A.B.C.D.
【答案】C
【解析】依题意知系统抽样的组距为,为第二组的编号,即,所以第一组抽取的编号为,则样本中最大的编号即第20组的编号为:.故选:C.
4.(2024·舒兰市实验中学校高三学业考试)某工厂生产、、三种不同型号的产品,产品的数量之比依次为,现用分层抽样的方法抽出容量为的样本,样本中型产品有件,那么样本容量为( )
A.B.C.D.
【答案】C
【解析】由题意可得,解得.故选:C.
5.(2024·全国高三专题练习)已知甲、乙、丙三个社区现分别有低收入家庭360户、270户、180户.若政府计划援助这三个社区中90户低收入家庭,现采用分层随机抽样的方法决定各社区户数,则甲社区中接受援助的低收入家庭的户数为( )
A.20B.30C.36D.40
【答案】D
【解析】每个个体被抽到的概率等于
甲社区有低收入家庭360户,故甲社区中接受援助的低收入家庭的户数故选:D.
6.(2024·湖南长沙市·长郡中学高三其他模拟)要完成下列三项调查:①某商城从10台同款平板电脑中抽取4台作为商城促销的奖品;②某酒厂从某白酒生产线上抽取40瓶进行塑化剂检测:③某市从老、中、青三代市民中抽取100人调查他们网络购物的情况.适合采用的抽样方法依次为( )
A.①用简单随机抽样:②③均用系统抽样
B.①用抽签法;②③均用系统抽样
C.①用抽签法:②用分层抽样:③用系统抽样
D.①用随机数表法;②用系统抽样;③用分层抽样
【答案】D
【解析】对于①,所收集的数据没有明显差异,且数量较少,应用抽签法;对于②,所收集的数据没有明显差异,且数量较多,应用系统抽样;对于③,所收集的数据差异明显,应用分层抽样;故选:D.
题型二 频率分布直方图(表)
【例2】(1)(2024·全国高三专题练习)为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄在17~18岁的男生的体重(千克),将他们的体重按[54.5,56.5),[56.5,58.5),…,[74.5,76.5]分组,得到频率分布直方图如图所示.由图可知这100名学生中体重在[56.5,64.5)的学生人数是( )
A.20B.30
C.40D.50
(2)(2024·全国高三专题练习)某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为( )
A.600B.30C.60D.300
【答案】(1)C(2)A
【解析】(1)由频率分布直方图可得体重在[56.5,64.5)的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,
则这100名学生中体重在[56.5,64.5)的学生人数为100×0.4=40.故选:C.
(2)因为成等差数列,所以,
由频率分布直方图可得,即,
所以.故消费金额超过150元的频率为,
故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.故选:A.
【举一反三】
1.(2024·全国高三专题练习)为了评估某家快递公司的服务质量,某评估小组进行了客户满意度调查,从该公司参与调查的客户中随机抽取500名客户的评分,评分均在区间上,分组为,,,,其频率分布直方图如图所示.规定评分在60分以下表示对该公司的服务质量不满意,则这500名客户中对该公司的服务质量不满意的客户的人数为( )
A.15B.16C.17D.18
【答案】A
【解析】由频率分布直方图可知,评分在区间上的频率,
所以评分在区间上的客户有(人),即对该公司的服务质量不满意的客户有15人.
故选:A
2.(2024·天津高三其他模拟)某校对高三年级学生的数学成绩进行统计分析.全年级同学的成绩全部介于80分与150分之间,将他们的成绩按照,,,,,,分组后得到的频率分布直方图如图所示.现从全体学生中根据成绩采用分层抽样的方法抽取80名同学的试卷进行分析,则从成绩在内的学生中抽取的人数为( )
A.24B.36C.20D.28
【答案】A
【解析】,解得.
所以成绩在内的学生中抽取的人数为.故选:A
3.(2024·全国高三专题练习)我国在贵州省平塘县境内修建的500米口径球面射电望远镜(FAST)是目前世界上最大单口径射电望远镜.截至2019年8月28日,该射电望远镜已发现132颗优质的脉冲星候选体,其中有93颗已被确认为新发现的脉冲星.脉冲星是20世纪60年代天文学的四大发现之一,脉冲星就是正在快速自转的中子星,每一颗脉冲星每两脉冲间隔时间(脉冲星的自转周期)是一定的,最小的小到0.0014秒,最长的也不过11.765735秒.某一天文研究机构观测并统计了93颗已被确认为新发现的脉冲星的自转周期,绘制了如图所示的频率分布直方图.在93颗新发现的脉冲星中,自转周期在2至10秒的颗数大约为( )
A.47B.86C.79D.70
【答案】C
【解析】由频率分布直方图可知,自转周期在0至2秒的频率为,
自转周期在10至12秒的频率为,
所以自转周期在2至10秒的频率为,
所以自转周期在2至10秒的颗数大约为,故选:C.
题型三 特征数的计算
【例3-1】(1)(2024·全国高三专题练习)甲、乙两组数的数据如茎叶图所示,则甲、乙的平均数、方差、极差及中位数中相同的是( )
A.极差B.方差
C.平均数D.中位数
(2)(2024·全国高三专题练习)已知一组数据,,的平均数是5,方差是4则由,,,11这4个数据组成的新的一组数据的方差是( )
A.16B.14C.12D.8
【答案】(1)C(2)C
【解析】(1)由茎叶图可得:甲的数据更集中,乙的数据较分散,所以甲与乙的方差不同;
甲的极差为;乙的极差为,所以甲与乙的极差不同;
甲的中位数为,乙的中位数为,所以中位数不同;
甲的平均数为,
乙的平均数为,所以甲、乙的平均数相同;故选:C.
(2)由已知得,,
则新数据的平均数为,
所以方差为
,故选:C
【例3-2】(2024·全国高三专题练习)某市有100万居民,政府为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如下的频率分布直方图:
(1)求直方图中的值;
(2)估计居民月均用水量的众数、中位数(精确到0.01).
【答案】(1);(2)众数2.25吨,中位数约为2.06吨.
【解析】(1)由频率分布直方图得:
,
解得.
(2)由频率分布直方图估计居民月均用水量的众数为:
.,的频率为:,,的频率为:,
中位数为:
【方法总结】
直方图的主要性质有:
直方图中各矩形的面积之和为;
组距与直方图纵坐标的乘积为该组数据的频率;
每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;
(4)直方图左右两边面积相等处横坐标表示中位数.
【举一反三】
1.(2024·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为,,,,.下面给出的指标可以用来评估该贫困户年收入的稳定程度( )
A.,,,,的平均数B.,,,,的标准差
C.,,,,的最大值D.,,,,的中位数
【答案】B
【解析】标准差反映了各数据对平均数的偏离,反映了一组数据的离散程度,在本题中即稳定程度,
而其他的统计量则不能反映稳定程度,故选:B
2.(2024·全国高三专题练习)已知数据的平均数为,方差为,则,,…,的平均数和方差分别为( )
A.和B.和
C.和D.和
【答案】B
【解析】因为数据的平均数为,方差为,
所以,,…,的平均数和方差分别为和故选:B
3.(2024·广东江门市·高三月考)某学校组织学生参加数学测试,某班成绩的频率分布直方图如图,数据的分组依次为,,,.由此估计该班学生此次测试的平均分为_________.
【答案】68
【解析】由频率分布直方图可得平均数为.
故答案为:68.
4.(2024·全国高三月考)为了调查某阶层月工资收入,某地政府对该阶层1000人进行了调查,并根据调查结果画出如图所示的频率分布直方图,则这1000人的月工资收入的中位数为______.(百元)
【答案】24
【解析】前2组的频率为,前3组的频率为,故中位数在第三组中,设中位数为,则,解得.
故答案为:24.
题型四 统计图解读
【例4】(2024·江苏海门市·高三月考)2019年1月到2019年12月某地新能源汽车配套公共充电桩保有量如下:
则下列说法正确的是( )
A.2019年各月公共充电桩保有量一直保持增长态势
B.2019年12月较2019年11月公共充电桩保有量增加超过2万台
C.2019年6月到2019年7月,公共充电桩保有量增幅最大
D.2019年下半年各月公共充电桩保有量均突破45万台
【答案】A
【解析】对于A,2019年各月公共充电桩保有量逐步增加,故一直保持增长态势,故A正确.
对于B,2019年12月较2019年11月公共充电桩保有量增加量为:,故B错.
对于C,2019年6月到2019年7月,公共充电桩保有量增幅约,
而2019年2月到2019年3月,公共充电桩保有量增幅约,故C错误;
2019年7月公共充电桩保有量小于45万台,故D错误.故选:A.
【举一反三】
1.(2024·全国高三专题练习)湖上升明月是中国第一座“露天博物馆”,它的建设目标是创建国家5A级风景旅游区,建成后对丰富皖北旅游资源,完善安徽省旅游战略格局,具有重要意义,建成后它将是国内规模最大、建筑类型最多、文化内涵丰富、服务设施完善的古名居博览园,如图是市旅游局为做好开园迎客准备,查阅资料时查到的安徽某景区近几年的游客人数变化情况的柱状图:以下说法错误的是( )
A.与上一年比2018年增幅最大
B.从2016年开始,游客人数明显增多
C.近8年游客人数的平均数大于2016年游客人数
D.该景区游客人数逐年上升
【答案】A
【解析】对于A,从图中可得,2018年增加210万人次,而2019年增加230万人次,所以2019年增幅最大,所以A错误;
对于B,从图中的数据可看出,从2016年开始,游客人数明显增多,所以B正确;
对于C,近8年游客人数的平均数为,即近8年游客人数的平均数大于2016年游客人数,所以C正确;
对于D,从柱状图可看出,该景区游客人数逐年上升,所以D正确,
故选:A
2.(2024·全国高三专题练习)为了解大学生对体育锻炼的兴趣,某高校从4万多名在校大学生中抽取了男、女生各200名进行了调查,得到如下统计图:
对比两图中信息并进行分析,下列说法正确的是( )
A.大量出汗并感到很疲乏的男生人数是女生人数的2倍
B.男生中运动时间超过1小时的超过
C.女生的平均运动强度高于男生的平均运动强度
D.运动时间在小时内的男生人数与运动时间在小时内的女生人数相同
【答案】D
【解析】对于A,大量出汗并感到很疲乏的男生超过110人,而女生约50人,因此大量出汗并感到很疲乏的男生人数比女生人数的2倍还要多,因此A不正确;
对于B,男生中运动时间在小时内的超过70人,占所有男生的比例超过,因此男生中运动时间超过1小时的占比没达到,因此B不正确;
对于C,由图易知男生的平均运动强度高于女生的平均运动强度,因此C不正确;
对于D,运动时间在小时内的男生人数有50人,运动时间在小时内的女生人数也有50人,因此D正确.故选:D.
3.(多选)(2024·福建厦门市·厦门双十中学高三月考)某人退休前后各类支出情况如下,已知退休前工资收入为8000元月,退休后每月储蓄的金额比退休前每月储蓄的金额少1500元,则下面结论中正确的是( )
A.该教师退休前每月储蓄支出2400元
B.该教师退休后的旅行支出是退休前旅行支出的3倍
C.该教师退休工资收入为6000元月
D.该教师退休后的其他支出比退休前的其他支出少
【答案】ACD
【解析】退休前工资收入为8000元月,每月储蓄的金额占,则该教师退休前每月储蓄支出元,故A正确;
该教师退休后每月储蓄的金额比退休前每月储蓄的金额少1500元,
则该教师退休后每月储蓄的金额为900元,设该教师退休工资收入为元月,则,即元月,故C正确;
该教师退休前的旅行支出为元,退休后的旅行支出为元,
该教师退休后的旅行支出是退休前旅行支出的 倍,故B错误;
该教师退休前的其他支出为元,退休后的其他支出为元,
该教师退休后的其他支出比退休前的其他支出少,故D正确.故选:ACD
备战高考数学成套的一轮复习,二轮复习,专题高分突破,考前回归,模拟试卷尽在备战高考QQ群722859698也可联系微信fjshuxue加入夸克网盘群3T一线老师必备资料一键转存自动更新永不过期
特征数
具体数字算法
频率分布直方图(表)
众数
次数出现最多的数字
频率最大或最高组的中间值
中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数
频率等于0.5时的横坐标
平均数
所有数字之和除以总个数
每个小矩形面积乘以小矩形底边中点的横坐标之和
方差
s2=eq \f(1,n)[(x1-eq \(x,\s\up6(-)))2+(x2-eq \(x,\s\up6(-)))2+…+(xn-eq \(x,\s\up6(-)))2].
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定
相关试卷
这是一份艺考生专题讲义28 数列求和-2024-2025学年高考数学艺体生一轮复习试题,共13页。
这是一份艺考生专题讲义19 求导公式及运算-2024-2025学年高考数学艺体生一轮复习试题,共7页。试卷主要包含了基本初等函数的导数公式,求导原则,下列结论正确的个数为,已知函数,则等内容,欢迎下载使用。
这是一份艺考生专题讲义10 函数的图象-2024-2025学年高考数学艺体生一轮复习试题,共5页。试卷主要包含了函数图象的作法,描点法作函数图象,基本初等函数的图象,函数图象的变换等内容,欢迎下载使用。
