数学必修 第一册4.2 分层随机抽样的均值与方差导学案
展开第2课时 分层随机抽样的均值与方差 百分位数
课前篇·自主梳理知识
【主题1】 分层随机抽样的均值与方差
1.分层随机抽样的平均数
一般地,将样本a1,a2,…,am和样本b1,b2,…,bn合并成一个新样本,则这个新样本的平均数为
=·+·.
于是,当已知上述两层构成的新样本中每层的平均数分别为1和2时,可得这个新样本的平均数为1+2.
记w1=,w2=,则这个新样本的平均数为________,其中w1,w2称为________.
更一般地,设样本中不同层的平均数和相应权重分别为1,2,…,n和w1,w2,…,wn,则这个样本的平均数为w11+w22+…+wnn.为了简化表示,引进求和符号,记作w11+w22+…+wnn=________.
2.分层随机抽样的方差
设样本中不同层的平均数分别为1,2,…,n,方差分别为s,s,…,s,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=___________________________________,其中为这个样本的平均数.
答案:
1.w11+w22 权重 wii
2.wi[s+(i-)2]
【主题2】 百分位数
一般地,当总体是连续变量时,给定一个百分数p∈(0,1),总体的p分位数有这样的特点:总体数据中的任意一个数小于或等于它的可能性是________.
25%,50%,75%分位数是三个常用的百分位数.把总体数据按照从小到大排列后,这三个百分位数把总体数据分成了4个部分,在这4个部分取值的可能性都是.因此这三个百分位数也称为总体的________.
其他常用的百分位数有1%,5%,10%,90%,95%,99%.
总体的p分位数通常是未知的,人们用样本的p分位数来估计它,样本容量越大,估计越准确.
答案:p 四分位数
[自我检测]
1.思维辨析(对的打“√”,错的打“”)
(1)若x1,x2,…,x100的平均数为,方差为s,x1,x2,…,x40的平均数为a,方差为s1,x41,x42,…,x100的平均数为b,方差为s2,则=,s=.( )
(2)下表记录了某地区某天早晨6点到下午7点的温度变化情况,
时间(时) | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 |
温度(℃) | 8 | 8 | 10 | 14 | 17 | 19 | 24 | 25 | 23 | 20 | 16 | 12 |
则这组数据的25%分位数是10 ℃.( )
答案:(1) (2)
2.某班40名学生一次体育测试成绩统计如下:
成绩(分) | 60 | 70 | 80 | 90 | 100 |
人数 | 7 | x | 12 | y | 3 |
如果已知该班的平均成绩为76分,则x,y的值分别为( )
A.14,4 B.13,5 C.12.6 D.11,7
答案:B
3.某校规定学生的体育成绩由三部分组成,早晨锻炼及体育课外活动表现占成绩的15%,体育理论测试占35%.体育技能测试占50%,小明上述三项的成绩依次是94分,90分,96分,则小明这学期的体育成绩是________分.
答案:93.6
4.一位同学进行十次投实心球的练习,每次投出的成绩如表:
投实心 球序次 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
成绩 (m) | 10.5 | 10.2 | 10.1 | 10.6 | 10.4 | 9.9 | 10.4 | 10.7 | 10.2 | 10.1 |
则此同学成绩的50%分位数是________.
答案:10.3
课堂篇·重难要点突破
研习1 分层随机抽样的平均数
[典例1] 某公司招聘人才,对应聘者分别进行阅读能力、思维能力和表达能力三项测试,其中甲、乙两人的成绩如下表:(单位:分)
项目 人员 | 阅读能力 | 思维能力 | 表达能力 |
甲 | 93 | 86 | 73 |
乙 | 95 | 81 | 79 |
(1)若根据三项测试的平均成绩在甲、乙两人中录用一人,那么谁将能被录用?
(2)根据实际需要,公司将阅读能力、思维能力和表达能力三项测试得分按3∶5∶2的比确定每人的最后成绩,若按此成绩在甲、乙两人中录用一人,谁将被录用?
(1)解:∵甲的平均成绩x甲=(93+86+73)÷3=84(分),
乙的平均成绩x乙=(95+81+79)÷3=85(分),
∴x乙>x甲,∴乙将被录用.
(2)解:根据题意,得
甲==85.5(分),
乙==84.8(分).
∴甲>乙,∴甲将被录用.
计算分层随机抽样平均数的关键是知道样本中不同层的平均数及它们相应的权重,然后运用公式计算即可.
[练习1]有甲、乙、丙三种糖果混合而成的什锦糖100千克,其中各种糖果的单价和千克数如表所示,商家用平均数来确定什锦糖的单价.
| 甲种糖果 | 乙种糖果 | 丙种糖果 |
单价(元/千克) | 20 | 25 | 30 |
千克数 | 40 | 40 | 20 |
(1)求该什锦糖的单价;
(2)为了使什锦糖的单价每千克至少降低1元,商家计划在什锦糖中加入甲、丙两种糖果共100千克,问其中最多可加入丙种糖果多少千克?
解:(1)根据题意,得
=24(元/千克).
答:该什锦糖的单价是24元/千克.
(2)设加入丙种糖果x千克,
则加入甲种糖果(100-x)千克,
根据题意,得≤23.
解得x≤20.
答:最多可加入丙种糖果20千克.
研习2 分层随机抽样的方差
[典例2] 某厂甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中共抽取10件.测得数据如下:
甲:99,100,98,103;
乙:99,100,102,99,100,100.
(1)分别计算两组数据的平均数和方差,并说明哪台机床加工零件的质量更稳定;
(2)求这10件零件的平均直径和方差.
解:(1)甲=×(99+100+98+103) =100(cm),
乙=×(99+100+102+99+100+100)=100(cm),
s=[(99-100)2+ (100-100)2+(98-100)2+(103-100)2]=,
s=×[(99-100)2+(100-100)2+(102 -100)2+(99-100)2+(100-100)2+(100-100)2]=1,
因为甲=乙,s>s,所以乙机床加工零件的质量更稳定.
(2)因为甲=100 cm,s=,w甲=,
乙=100 cm,s=1,w乙=,
所以这10件零件的平均直径=×100+×100=100(cm),这10件零件的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×+×[1+(100-100)2]==2.
(1)方差反映数据相对于平均数的离散程度,方差越大,表明各个数据在平均数的周围越分散;方差越小,表明各个数据在平均数的周围越集中,越稳定.
(2)计算分层随机抽样方差的关键是知道样本中不同层的平均数、方差及它们相应的权重,然后代入公式计算即可.
[练习2] 某班甲、乙两个小组共18名学生的英语口语测试成绩(单位:分)如下:
甲组:76 90 84 86 81 87 86 82
乙组:82 84 85 89 79 80 91 89 79 72
(1)哪个小组的成绩高一些?哪个小组的成绩更整齐一些?
(2)求这18名学生英语口语测试成绩的平均分和方差.
解:(1)甲=×(76+90+84+86+81+87+86+82)=84(分),
乙=×(82+84+85+89+79+80+91+89+79+72)=83(分),
s=×[(76-84)2+(90-84)2+(84-84)2+(86-84)2+(81-84)2+(87-84)2+(86-84)2+(82-84)2]==16.25,
s=×[(82-83)2+(84-83)2+(85-83)2+(89-83)2+(79-83)2+(80-83)2+(91-83)2+(89-83)2+(79-83)2+(72-83)2]==30.4.
因为甲>乙,所以甲小组的成绩高一些.
因为s<s,所以甲小组的成绩更整齐一些.
(2)这18名学生英语口语测试成绩的平均分=×84+×83≈83.4(分),
这18名学生英语口语测试成绩的方差s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=×[16.25+(84-83.4)2]+×[30.4+(83-83.4)2]==24.36.
研习3 百分位数
[典例3] 一次数学测试中,高一(1)班1小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试该小组12名学生成绩的众数、平均数、75%分位数分别是( )
A.82分、82分、90分 B.82分、81分、92分
C.82分、80分、91分 D.82分、81分、91分
答案:D
解析:这组数据中82出现的次数最多,故众数为82分,平均数为
×(58+67+73+74+76+82+82+87+90+92+93+98)=81(分).
因为12×75%=9,所以这组数据的75%分位数为=91(分).故选D.
计算一组n个数据的p分位数的一般步骤如下:
第1步,按照从小到大排列原始数据;
第2步,计算i=np;
第3步,若i不是整数,大干i的最小整数为j,则p分位数为第j项数据;若i是整数,则p分位数为第i项与第(i+1)项数据的平均数.
[练习3]某校调查某班30名同学所穿的鞋的尺码如下表所示:
码号 | 33 | 34 | 35 | 36 | 37 |
人数 | 7 | 6 | 14 | 1 | 2 |
则这组数据的中位数、众数、平均数、25%分位数分别是( )
A.35,35,35,33 B.35,35,34.5,34
C.34,35,34,34 D.35,35,34.5,33
答案:B
解析:这组数据中处于最中间位置的是第15、第16个数据,故这组数据的中位数为35.这组数据中35出现的次数最多,故众数为35,平均数为=34.5.因为30×25%=7.5,所以这组数据的25%分位数为34.故选B.
课后篇·演练提升方案
1.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
答案:0.98
解析:==0.98.
则经停该站高铁列车所有车次的平均正点率的估计值为0.98.
2.在浙江省和青海省各取面积大小一样的A,B两块区域,分别调查人均可支配收入.获得数据显示,浙江省的A区域的人均可支配收入为35 537元,青海省的B区域的人均可支配收入为24 542元.能否得到这两个区域的人均可支配收入为=30 039.5(元)?
解:由于不知道A,B两区域的具体人数,故不能得到两区域人均可支配收入所占的权重,所以不能求得两个区域的人均可支配收入.只有当两区域的人数相等时,人均可支配收入为=30 039.5(元).
3.某歌手电视大奖赛中,七位评委为甲、乙两名选手打出了如下分数.
甲:7.9,8.1,8.4,8.5,8.5,8.5,9.9;
乙:7.0,8.4,8.4,8.4,8.6,8.7,9.0.
(1)若评分规则为”根据七位评委的所有评分,计算选手得分的平均数”,求甲、乙两名选手的最终得分;
(2)若评分规则为“去掉一个最高分和一个最低分后,计算选手得分的平均数”,求甲、乙两名选手的最终得分;
(3)若作为观众,需要你从这两名选手中投票选择一人晋级,你会选择谁?
解:(1)甲=×(7.9+8.1+8.4+8.5+8.5+8.5+9.9)≈8.5,
乙=×(7.0+8.4+8.4+8.4+8.6+8.7+9.0)≈8.4.
(2)去掉一个最高分和一个最低分后,
甲=×(8.1+8.4+8.5+8.5+8.5)=8.4,
乙=×(8.4+8.4+8.4+8.6+8.7)=8.5.
(3)s=×[(8.1-8.4)2+(8.4-8.4)2+3×(8.5-8.4)2]=0.024,
s=×[3×(8.4-8.5)2+(8.6-8.5)2+(8.7-8.5)2]=0.016,
由于在(2)中乙>甲,且s<s,说明乙的平均成绩比甲好,且成绩比甲稳定,故我会选择乙.
4.某地区农科所为了选择更适应本地区种植的棉花品种,在该地区选择了5块土块,每块土地平均分成面积相等的两部分,分别种植甲、乙两个品种的棉花,收获时测得棉花的亩产量如下表所示:
甲 | 95 | 107 | 105 | 102 | 111 |
乙 | 103 | 103 | 98 | 106 | 110 |
(1)分别求出甲、乙品种棉花亩产量的中位数和20%分位数;
(2)判断甲、乙两品种棉花哪种亩产量更稳定,并说明理由.
解:(1)由题意可得
甲品种棉花亩产量的中位数为105,
20%分位数为=98.5;
乙品种棉花亩产量的中位数为103,
20%分位数为=100.5.
(2)乙品种棉花亩产量更稳定,理由如下:
甲品种棉花亩产量的平均数为甲=×(95+102+105+107+111)=104,方差为s=×[(95-104)2+(102-104)2+(105-104)2+(107-104)2+(111-104)2]=28.8.
乙品种棉花亩产量的平均数为乙=×(98+103+103+106+110)=104,方差为s=×[(98-104)2+(103-104)2+(103-104)2+(106-104)2+(110-104)2]=15.6.
因为s>s,所以乙品种棉花的亩产量更稳定.
高中数学北师大版 (2019)必修 第一册2.2 分层随机抽样导学案及答案: 这是一份高中数学北师大版 (2019)必修 第一册2.2 分层随机抽样导学案及答案,共7页。
必修 第一册6.4 用样本估计总体导学案: 这是一份必修 第一册6.4 用样本估计总体导学案,共7页。
北师大版 (2019)必修 第一册4.2 分层随机抽样的均值与方差学案设计: 这是一份北师大版 (2019)必修 第一册4.2 分层随机抽样的均值与方差学案设计,共9页。