高中数学湘教版(2019)必修 第一册6.4 用样本估计总体导学案
展开百分位数
新课程标准解读 | 核心素养 |
结合实例,能用样本估计百分位数,理解百分位数的统计含义 | 数据运算、数据分析 |
在一次长跑测试中,小明是班上跑得最快的,小彬是班上跑得最慢的,全班共40人.
[问题] 小明、小彬长跑成绩的百分位数各是多少?
知识点 百分位数
1.百分位数是位于按一定顺序排列的一组数据中某一个百分位置的数值,以Pr表示,其中r是区间[1,99]上的整数.一个百分位数Pr将总体或样本的全部观测值分为两部分,至少有r%的观测值小于或等于它,且至少有(100-r)%的观测值大于或等于它,当r%=50%时,Pr即对应中位数.
2.求一组观测数据的百分位数的步骤
设观测数据已经按从小到大的顺序排列.如x1,x2,…,xn.
第一步,计算c=n×r%;
第二步,如果c不是整数,用m表示比c大的最小整数.则所求的Pr=m,如果c是整数,则Pr=.
总体百分位数估计需要注意的两个问题
(1)总体百分位估计的基础是样本百分位数的计算,因此计算准确是关键;
(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.
1.某班级人数为50,班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
提示:不是.是指能够考取本科院校的同学占同学总数的百分比.
2.“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
提示:有70%的同学数学测试成绩小于或等于85分.
1.下列关于一组数据的第50百分位数的说法正确的是( )
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
解析:选A 由百分位数的意义可知选项B、C、D错误.
2.观测一组数据5,6,7,8,9,10,11,12,13,14的P25为________;P75为________;P90为________.
解析:由于共有10个数字,则10×25%=2.5,10×75%=7.5,10×90%=9.故P25=7,P75=12,P90==13.5.
答案:7 12 13.5
百分位数的计算 |
[例1] (链接教科书第245页例9)从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,
8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的P25,P75,P95;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用P25,P75,P95把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则P25==8.15,
P75==8.75,
P95=9.9.
(2)因为共有12个数据,所以12×15%=1.8,即P15=7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.
(3)由(1)可知珍珠质量的P25=8.15 g,P75=8.75 g,P95=9.9 g,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.75 g的珍珠为合格品,质量大于8.75 g且小于或等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.
计算百分位数时,可先将这组数据按从小到大的顺序排列,再根据定义计算.
[跟踪训练]
某校年级组长为了解本校高三学生一模考试的数学成绩(单位:分),随机抽取30名学生的一模数学成绩,如下所示:
110 144 125 63 89 121 145 123 74 96
97 142 115 68 83 116 139 124 85 98
132 147 128 133 99 117 107 113 96 141
估计该校高三学生一模数学成绩的P25=________分,P50=________分.
解析:把这30名学生的数学成绩按从小到大的顺序排列,得63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为30×25%=7.5,30×50%=15,所以这30名学生一模数学成绩的P25=96分,P50==115.5(分).据此可以估计该校高三学生一模数学成绩的P25=96分,P50=115.5分.
答案:96 115.5
百分位数的应用 |
[例2] 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的P75.
[解] (1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.
所以y与x之间的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,
结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设P75为m,
因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,
用电量不超过400千瓦时的占80%,
所以P75在[300,400)内,所以0.6+(m-300)×0.002=0.75,
解得m=375千瓦时,即用电量的P75=375千瓦时.
[母题探究]
(变设问)根据本例(2)中求得的数据计算用电量的P15.
解:设P15为x,因为用电量低于100千瓦时的所占比例为0.001×100=10%,
用电量不超过200千瓦时的占30%,
所以P15在[100,200)内,所以0.1+(x-100)×0.002=0.15,
解得x=125千瓦时,即用电量的P15为125千瓦时.
根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.
[跟踪训练]
某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.
(1)求x;
(2)求抽取的x人的年龄的P50(结果保留整数);
(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的P20和平均数,以这两个数据为依据,评价参赛人员对“中国梦”的伟大构想的认知程度,并谈谈你的感想.
解:(1)第一组频率为0.01×5=0.05,所以x==100.
(2)由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的P50在[30,35)内,由30+5×=≈32(岁),所以抽取的x人的年龄的P50=32岁.
(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,
计算10×20%=2,所以这10人成绩的P20==91(分),
这10人成绩的平均数为(88+90+92+92+95+96+96+97+98+99)=94.3(分).
评价:从百分位数和平均数来看,参赛人员的认知程度很高.
感想:略(结合本题和实际,符合社会主义核心价值观即可).
1.下列一组数据的P25=( )
2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6
A.3.2 B.3.0
C.4.4 D.2.5
解析:选A 把这组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由10×25%=2.5,不是整数,则第3个数据3.2,是P25.
2.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,P50=b,则有( )
A.a=13.7,b=15.5 B.a=14,b=15
C.a=12,b=15.5 D.a=14.7,b=15
解析:选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,P50=b==15.
3.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的P80是________.
解析:由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,
因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的P80==2.
答案:2
4.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的P90=________.
解析:棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,
在35 mm以下的比例为85%+10%=95%,
因此,P90一定位于[30,35]内,由30+5×=32.5,可以估计棉花纤维的长度的P90=32.5 mm.
答案:32.5 mm
高中数学6.4 用样本估计总体导学案及答案: 这是一份高中数学6.4 用样本估计总体导学案及答案,共14页。
2020-2021学年6.2 抽样导学案: 这是一份2020-2021学年6.2 抽样导学案,共16页。学案主要包含了易错警示等内容,欢迎下载使用。
湘教版(2019)必修 第一册6.3 统计图表学案设计: 这是一份湘教版(2019)必修 第一册6.3 统计图表学案设计,共11页。