2021版新高考数学(理科)一轮复习教师用书:第10章第2节 随机抽样
展开第二节 随机抽样
[最新考纲] 1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本.3.了解分层抽样和系统抽样方法.4.会用随机抽样的基本方法解决一些简单的实际问题.
1.简单随机抽样
(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号.
(2)确定分段间隔k,对编号进行分段,当是整数时,取k=,当不是整数时,随机从总体中剔除余数,再取k=(N′为从总体中剔除余数后的总数).
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k).
(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号l+k,再加k得到第3个个体编号l+2k,依次进行下去,直到获取整个样本.
3.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的应用范围
当总体由差异明显的几个部分组成时,往往选用分层抽样.
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.
3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.
一、思考辨析(正确的打“√”,错误的打“×”)
(1)简单随机抽样中每个个体被抽到的机会不一样,与先后有关.( )
(2)系统抽样在起始部分抽样时采用简单随机抽样.( )
(3)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )
(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )
[答案] (1)× (2)√ (3)× (4)×
二、教材改编
1.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )
A.总体
B.个体
C.样本的容量
D.从总体中抽取的一个样本
A [由题目条件知,5 000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.]
2.某学校为了了解高中一年级、二年级、三年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )
A.抽签法 B.系统抽样法
C.分层抽样法 D.随机数法
C [总体由差异明显的几部分组成,故最合理的抽样方法是分层抽样法.故选C.]
3.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是( )
A.10 B.11
C.12 D.16
D [由题意可知,分段间隔k==13,
∴样本中还有一个学生的学号为3+13=16,故选D.]
4.某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.
18 [∵==,
∴应从丙种型号的产品中抽取×300=18(件).]
考点1 简单随机抽样
(1)简单随机抽样需满足:①被抽取样本的总体的个体数有限;②逐个抽取;③是不放回抽取;④是等可能抽取.
(2)简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
1.下列抽取样本的方式属于简单随机抽样的个数为( )
①从无限多个个体中抽取100个个体作为样本;
②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
③从20件玩具中一次性抽取3件进行质量检验;
④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0 B.1
C.2 D.3
A [①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③不是简单随机抽样,因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样,因为不是等可能抽样.故选A.]
2.总体由编号为01,02,03,…,49,50的50个个体组成,利用随机数表(以下选取了随机数表中的第1行和第2行)选取5个个体,选取方法是从随机数表第1行的第9列和第10列数字开始由左向右读取,则选出来的第4个个体的编号为( )
66 67 40 67 14 64 05 71 95 86 11 05 65 09 68 76 83 20 37 90
57 16 00 11 66 14 90 84 45 11 75 73 88 05 90 52 83 20 37 90
A.05 B.09
C.11 D.20
B [从随机数表第1行的第9列和第10列数字开始由左向右读取,符合条件的编号有14,05,11,05,09,因为05出现了两次,所以选出来的第4个个体的编号为09.故选B.]
3.利用简单随机抽样,从n个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为( )
A. B.
C. D.
C [根据题意得,=,解得n=28.故每个个体被抽到的概率为=.]
应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,将超过总体号码或出现重复号码的数字舍去.
考点2 系统抽样
系统抽样的最基本特征是“等距性”,一般地,每组内所抽取的号码依据第一组抽取的号码和组距确定.每组抽取的号码依次构成一个以第一组抽取的号码m为首项、组距d为公差的等差数列{an},第k组抽取的号码为ak=m+(k-1)d.
(1)(2019·全国卷Ⅰ)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
(2)采用系统抽样方法从1 000人中抽取50人做问卷调查,将他们随机编号1,2,…,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( )
A.12 B.13
C.14 D.15
(1)C (2)A [(1)∵从1 000名学生中抽取一个容量为100的样本,∴系统抽样的分段间隔为=10,∵46号学生被抽到,则根据系统抽样的性质可知,第一组随机抽取一个号码为6,以后每个号码都比前一个号码增加10,所有号码数是以6为首项,10为公差的等差数列,设其数列为{an},则an=6+10(n-1)=10n-4,当n=62时,a62=616,即在第62组抽到616.故选C.
(2)根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d==20的等差数列{an},∴通项公式an=8+20(n-1)=20n-12,令751≤20n-12≤1 000,得≤n≤,又∵n∈N*,∴39≤n≤50,
∴做问卷C的共有12人,故选A.]
(1)系统抽样适用的条件是总体容量较大,样本容量也较大. (2)使用系统抽样的方法抽取样本时,若总体容量不能被样本容量整除,则应先从总体中随机地剔除几个个体,再确定分段间隔. (3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定.
1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一个产品的编号为13,则抽到产品的最大编号为( )
A.73 B.78
C.77 D.76
B [样本的分段间隔为=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.]
2.中央电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.
2 10 [把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含=10(个)个体.所以需剔除2个个体,抽样间隔为10.]
考点3 分层抽样
分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.
(1)(2018·全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.
(2)(2019·洛阳一模)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
图甲 图乙
A.100,10 B.100,20
C.200,10 D.200,20
(1)分层抽样 (2)D [(1)因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.
(2)由题得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,
抽取的高中生人数为2 000×2%=40人,则近视人数为40×0.5=20人,故选D.]
进行分层抽样的相关计算时,常用到的两个关系
(1)抽样比==.
(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.
[教师备选例题]
1.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )
类别 | 人数 |
老年教师 | 900 |
中年教师 | 1 800 |
青年教师 | 1 600 |
合计 | 4 300 |
A.90 B.100
C.180 D.300
C [设该样本中的老年教师人数为x,由题意及分层抽样的特点得=,故x=180.故选C.]
2.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.
1 800 [由题设,抽样比为=.设甲设备生产的产品总数为x件,则=50,所以x=3 000.故乙设备生产的产品总数为4 800-3 000=1 800.]
1.交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为( )
A.101 B.808
C.1 212 D.2 012
B [甲社区每个个体被抽取的概率为=,样本容量为12+21+25+43=101,所以四个社区中驾驶员的总人数N==808.]
2.为了了解高一、高二、高三学生的身体状况,现用分层抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3,已知高一年级共抽取了240人,则高三年级抽取的人数为________.
360 [因为高一年级抽取学生的比例为=,所以=,解得k=2,故高三年级抽取的人数为1 200×=360.]