2020年高中数学新教材同步必修第二册 第9章 9.1.2~9.1.3 分层随机抽样
展开9.1.2 分层随机抽样
9.1.3 获取数据的途径
学习目标 1.理解分层随机抽样的概念.2.掌握用分层随机抽样从总体中抽取样本.3.掌握两种抽样的区别与联系.4.了解获取数据的一些基本途径.
知识点一 分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样.
(1)每一个子总体称为层,在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
(2)如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,,两层的总体平均数分别为,,总体平均数为,样本平均数为.
则=+.
=+.
(3)在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均数.
思考 分层随机抽样的总体具有什么特点?
答案 个体之间差异较大.
知识点二 获取数据的途径
获取数据的基本途径有通过调查获取数据、通过试验获取数据、通过观察获取数据、通过查询获得数据等.
1.简单随机抽样和分层随机抽样都是等可能抽样.( √ )
2.分层随机抽样是按一定的比例从各层抽取个体组成样本的抽样.( √ )
3.在分层随机抽样时,每层可以不等可能抽样.( × )
4.通过网络查询的数据是真实的数据.( × )
一、对分层随机抽样的理解
例1 某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是( )
A.抽签法 B.随机数法
C.分层随机抽样 D.其他抽样方法
答案 C
解析 由于老年人、中年人和青年人的身体情况会有明显的差异,所以要用分层随机抽样.故选C.
反思感悟 使用分层随机抽样的前提
分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
跟踪训练1 分层随机抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体被等可能抽取,必须进行( )
A.每层等可能抽样
B.每层可以不等可能抽样
C.所有层按同一抽样比等可能抽样
D.所有层抽取个体数量相同
答案 C
解析 保证每个个体等可能的被抽取是两种基本抽样方式的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽样.
二、分层随机抽样的应用
例2 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.(1)试写出抽样过程;(2)若样本中3个区的高中学生的平均视力分别为4.8,4.8,4.6,试估计该市高中学生的平均视力.
解 (1)①由于该市高中学生的视力有差异,按3个区分成三层,用分层随机抽样法抽取样本.
②确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是2∶3∶5,所以抽取的学生人数分别是
200×=40;200×=60;
200×=100.
③在各层分别按简单随机抽样法抽取样本.
④综合每层抽样,组成容量为200的样本.
(2)样本中高中学生的平均视力为×4.8+×4.8+×4.6=4.7.
所以估计该市高中学生的平均视力约为4.7.
反思感悟 在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
跟踪训练2 一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁及50岁以上的有95人.为了了解这个单位职工与身体状态有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?
解 用分层随机抽样来抽取样本,步骤如下:
(1)分层.按年龄将500名职工分成三层:不到35岁的职工;35岁至49岁的职工;50岁及50岁以上的职工.
(2)确定每层抽取个体的个数.抽样比为=,
则在不到35岁的职工中抽取125×=25(人);
在35岁至49岁的职工中抽取280×=56(人);
在50岁及50岁以上的职工中抽取95×=19(人).
(3)在各层分别按随机数法抽取样本.
(4)汇总每层抽样,组成样本.
三 获取数据的途径
例3 为了缓解城市的交通拥堵情况,某市准备出台限制私家车的政策,为此要进行民意调查.某个调查小组调查了一些拥有私家车的市民,你认为这样的调查结果会怎样?
解 一个城市交通状况的好坏将直接影响着生活在这个城市中的每个人,关系到每个人的利益.为了调查这个问题,在抽样时应当关注到各种人群,既要抽到拥有私家车的市民,也要抽到没有私家车的市民.调查时,如果只对拥有私家车的市民进行调查,结果一定是片面的,不能代表所有市民的意愿.因此,在调查时,要对生活在该城市的所有市民进行随机抽样调查,不要只关注到拥有私家车的市民.
反思感悟 在统计活动中,尤其是大型的统计活动,为避免一些外界因素的干扰,通常需要确定调查的对象、调查的方法和策略,需要精心设计前期的准备工作和收集数据的方法,然后对数据进行分析,得到统计推断.
跟踪训练3 为了创建“和谐平安”校园,某校决定在开学前将学校的电灯电路使用情况进行检查,以便排除安全隐患,该校应该怎样进行调查?
解 由于一个学校的电灯电路数目不算大,且对创建“和谐平安”校园来说,必须排除任一潜在或已存在的安全隐患,故必须用普查的方式.
1.某校高三年级有男生500人,女生400人,为了解该年级学生的体重状况,从男生中随机抽取25人,从女生中随机抽取20人进行调查.这种抽样方法是( )
A.分层随机抽样 B.抽签法
C.随机数法 D.其他随机抽样
答案 A
解析 从男生500人中抽取25人,从女生400人中抽取20人,抽取的比例相同,因此用的是分层随机抽样.
2.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层随机抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n等于( )
A.9 B.10 C.12 D.13
答案 D
解析 ∵=,∴n=13.
3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层随机抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )
A.6 B.8 C.10 D.12
答案 B
解析 设样本容量为N,则N×=6,
∴N=14,∴高二年级所抽人数为14×=8.
4.为了了解某市2019年高考各高中学校本科上线人数,收集数据进行统计,其中获取数据的途径采用什么样的方法比较合适( )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获取数据
答案 D
5.某校高二年级化生史组合只有2个班,且每班50人,在一次数学测试中,从两个班抽取了20名学生的数学成绩进行分析,统计得在该次测试中,两班中各抽取的20名学生的平均成绩分别为110分和106分,则该组合学生的平均成绩约为________分.
答案 108
解析 样本中40名学生的平均分为×110+×106=108分,所以估计该组合学生的平均分约为108分.
1.知识清单:
(1)分层随机抽样.
(2)获取数据的途径.
2.方法归纳:数据分析.
3.常见误区:在分层随机抽样中,每个个体被抽到的可能性相等,与层数及分层无关,每一层的抽样一般采用简单随机抽样.
1.为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )
A.简单随机抽样 B.按性别分层随机抽样
C.按学段分层随机抽样 D.其他抽样方法
答案 C
解析 由于小学、初中、高中三个学段的学生视力差异比较大,因此,应按照学段进行分层随机抽样,而男女生视力情况差异不大,不能按照性别进行分层随机抽样.
2.要完成下列两项调查:(1)某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查有关消费购买力的某项指标;(2)从某中学高二年级的10名体育特长生中抽取3人调查学习情况.应采用的抽样方法是( )
A.(1)用简单随机抽样法,(2)用分层随机抽样法
B.(1)用分层随机抽样法,(2)用其他抽样方法
C.(1)用分层随机抽样法,(2)用简单随机抽样法
D.(1)(2)都用分层随机抽样法
答案 C
解析 (1)中收入差距较大,采用分层随机抽样法较合适;(2)中总体个数较少,采用简单随机抽样法较合适.
3.下列调查所抽取的样本具有代表性的是( )
A.利用某地七月份的日平均最高气温值估计该地全年的日平均最高气温
B.在农村调查市民的平均寿命
C.利用一块实验水稻田的产量估计水稻的实际产量
D.为了了解一批洗衣粉的质量情况,从仓库中任意抽取100袋进行检验
答案 D
解析 A项中某地七月份的日平均最高气温值不能代表全年的日平均最高气温;B项中在农村调查得到的平均寿命不能代表市民的平均寿命;C项中实验田的产量与水稻的实际产量相差可能较大,只有D项正确.
4.从一个容量为m(m≥3,m∈N)的总体中抽取一个容量为3的样本,当选取简单随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是,则选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性是( )
A. B. C. D.
答案 D
解析 因为在简单随机抽样时每个个体被抽到的可能性相等,所以选取分层随机抽样方法抽取样本时,总体中每个个体被抽中的可能性仍为.
5.某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层随机抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )
A.100 B.150 C.200 D.250
答案 A
解析 由题意得,=,
解得n=100,故选A.
6.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人,现采用分层随机抽样抽取30人,则抽取的高级职称的人数为________.
答案 3
解析 由题意得抽样比为=,所以抽取的高级职称的人数为15×=3.
7.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高做调查,现有三种调查方案:
①测量少年体校中180名男子篮球、排球队员的身高;
②查阅有关外地180名男生身高的统计资料;
③在本市的市区和郊县各任选三所中学,在这六所学校各年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.
为了达到估计本市初中这三个年级男生身高分布的目的,则上述调查方案比较合理的是________.(填序号)
答案 ③
解析 ①中,少年体校的男子篮球、排球的运动员的身高普遍高于一般情况,因此不能用测量的结果去估计总体的结果;②中,外地学生的身高也不能准确地反映本地学生身高的实际情况;而③中的调查方案比较合理,能达到估计本市初中这三个年级男生身高分布的目的.
8.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层随机抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查,已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.
答案 60
解析 根据题意,应从一年级本科生中抽取的人数为×300=60.
9.某城市有210家百货商店,其中大型商店20家、中型商店40家、小型商店150家,为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层随机抽样的方法抽取时,各种百货商店分别要抽取多少家?写出抽样过程.
解 ①样本容量与总体中的个体数的比值为=;
②确定要抽取的各种商店的数目:大型商店为20×=2(家),中型商店为40×=4(家),小型商店为150×=15(家);
③采用简单随机抽样的方法在各层中分别抽取大型商店2家、中型商店4家、小型商店15家,这样便得到了所要抽取的样本.
10.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40人.为了检测该大队的射击水平,从整个大队用分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8环,8.5环,8.1环,试估计该武警大队队员的平均射击水平.
解 该武警大队共有30+30+40=100(人),按比例分配所以第一中队参加考核人数为×30=9(人),
第二中队参加考核人数为×30=9(人),
第三中队参加考核人数为×30=12(人).
所参加考核的30人的平均射击环数为×8.8+×8.5+×8.1=8.43(环).
所以估计该武警大队的平均射击水平为8.43环.
11.为调查德克士各分店的经营状况,某统计机构用分层随机抽样的方法,从A,B,C三个城市中抽取若干家德克士分店组成样本进行深入研究,有关数据见下表:(单位:个)
城市 | 德克士数量 | 抽取数量 |
A | 26 | 2 |
B | 13 | x |
C | 39 | y |
则样本容量为( )
A.4 B.6 C.10 D.12
答案 B
解析 设所求的样本容量为n,
由题意得=,解得n=6.
12.某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层随机抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6人对户外运动持“喜欢”态度,有1人对户外运动持“不喜欢”态度,有3人对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的人数为( )
A.36 B.6 C.12 D.18
答案 A
解析 设持“喜欢”“不喜欢”“一般”态度的人数分别为6x,x,3x,由题意可得3x-x=12,x=6,∴持“喜欢”态度的有6x=36(人).
13.某工厂生产A,B,C三种不同型号的产品,产品数量之比为k∶5∶3,现用分层随机抽样的方法抽出一个容量为120的样本,已知A型号产品抽取了24件,则C型号产品抽取的件数为________.
答案 36
解析 由=,得k=2,故C型号产品抽取的件数为120×=36.
14.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按的抽样比用分层随机抽样的方法抽取样本,则应抽取高一学生数为________.
答案 8
解析 若设高三学生数为x,则高一学生数为,高二学生数为+300,所以有x+++300=3 500,解得x=1 600.故高一学生数为800,因此应抽取高一学生数为800×=8.
15.(多选)分层随机抽样是将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,组成一个样本的抽样方法.在《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱.欲以钱多少衰出之,问各几何?”其译文为:今有甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,问三人各应付多少税?则下列说法正确的是( )
A.甲应付51 钱
B.乙应付32 钱
C.丙应付16 钱
D.三者中甲付的钱最多,丙付的钱最少
答案 ACD
解析 依题意由分层随机抽样可知,
100÷(560+350+180)=,
则甲应付:×560=51 (钱);
乙应付:×350=32 (钱);
丙应付:×180=16 (钱).
16.某市两所高级中学在暑假联合组织全体教师外出旅游,活动分为两条线路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占42.5%,高二教师占47.5%,高三教师占10%.参加华东五市游的教师占参加活动总人数的,且该组中,高一教师占50%,高二教师占40%,高三教师占10%.为了了解各条线路不同年级的教师对本次活动的满意程度,现用分层随机抽样的方法从参加活动的全体教师中抽取一个容量为200的样本.试确定:
(1)参加长白山之旅的高一教师、高二教师、高三教师分别所占的比例;
(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.
解 (1)设参加华东五市游的人数为x,参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为a,b,c,则有=47.5%,=10%,解得b=50%,c=10%.故a=100%-50%-10%=40%,即参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为40%,50%,10%.
(2)参加长白山之旅的高一教师应抽取人数为200××40%=60;
抽取的高二教师人数为200××50%=75;
抽取的高三教师人数为200××10%=15.