必修 第二册9.2 用样本估计总体教课内容课件ppt
展开问题一:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了减少水资源的浪费,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望确定一个比较合理的标准,以使大部分居民用户的水费支出不受影响,你认为需要做哪些工作?
标准如果定的太低,会影响很多居民的日常生活;标准如果太高,则不利于节水。 为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民用户所占的比例情况。 在时间、经费允许的情况下,我们可以通过全面调查获得过去一年全市所有居民用户的月均用水量数据,进而得到月均用水量在不同范围内的居民用户所占的比例。 由于全市居民很多,通常采用抽样调查的方式,通过分析样本观测数据,来估计全市居民用户月均用水量的分布情况。
问题二:在这个问题中,总体、个体、调查变量分别是什么?
总体是该市的全体居民用户,个体是每户居民,调查变量是居民用户的月均用水量。 假设通过简单随机抽样,获得了100户居民用户的月均用水量数据(单位:t)
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.52.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
知识探究(三):总体百分位数的估计
问题三:我们根据频率分布直方图得出了“大部分居民用户的月均用水量集中在一个较低值区域”等推断。那么,如何利用这些信息,为政府决策服务呢?如果该市政府希望使80%的居民用户生活用水费支出不受影响,你能给市政府提出确定居民用户月均用水量标准的建议吗?
把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分。 一般地,我们取这两个数的平均数(13.6+13.8)/2=13.7,并称此数为这组数据的第80百分位数或80%分位数。
根据市政府的要求确定居民用户月均用水量标准,要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%。下面我们通过样本数据对a的值进行估计。
根据样本数据的第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右。
问:100个数据第80百分位数是按从小到大排列第80个数据和第81个数据的之间的任意值,一般取平均值。那如果是有200个数据呢?只有50个数据呢?
由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14t,或者把年用水量标准定为168t.
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值。 可以通过下面的步骤计算一组n个数据的第p百分位数: 第一步:按从小到大排列原始数据;第二步:计算i=n×p%; 第三步:若i不是整数,而大于i的比邻整数位j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第i+1项的平均数。 我们在初中学过的中位数,相当于是第50百分位数。 在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数。这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等。另外,像第1百分位数,第5百分位数,第95百分位数,和第99百分位数在统计中也经常被使用。
同学们,这文字叙述复杂吗?难吗?我们该如何学习它?
回放《9.1.1简单随机抽样》课堂小结 一、对于第九章《统计》教材有个特征: 共同特征就是文字定义表达很抽象、复杂,但具体例子却是简单易懂。这给我们学习启发就是先弄懂具体例子,文字定义自然就可以上升上去。 这一节到底难不难?是真难还是假难?如果是假难,原因是什么?如果是假难,那可以用毛主席的一句话:一切反动派都是什么?
答:假难。原因是我们平时很少遇到、亲历接触到这些事情,是我们积累的具体的、生活的例子不够,当用文字语言表达时我们感到抽象,不知在说什么。积累大量具体、感性的例子是学好本章的一个方法。
二、1、按要求简单随机抽样分几种?你觉得抽象吗?抽象的原因是什么?实际上抽象不抽象?按高中数学要求不放回简单随机抽样又分几种?
答:都是分两种,文字定义叙述很抽象。实际上不抽象,我们只须去理解一个具体简单的例子。只有随机数法我们没碰到。
三、人类的认识规律: 从特殊到一般、从具体到抽象、从简单到复杂。特殊的、具体的是简单的,一般的、抽象的是复杂的,所以我们可以先认识特殊的、具体的,熟练了,自然就上升到一般的、抽象的。
例2、根据下列样本数据,估计树人中学高一年级女生第25,50,75百分位数。
解:把27名女生的样本数据按从小到大排序,可得: 由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164. 据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.
例3、根据下列图表,估计月均用水量的样本数据的80%和95%分位数。
同学们要注意:原始数据丢失了,我们再也不能把原始数据按从小到大排列,于是可以数出第80百分位数和第95百分位数。
解:由上表可知,月均用水量在13.2t以下的居民用户所占比例为23%+32%+13%+9%=77% 在16.2t以下的居民用户所占比例为77%+9%=86% 因此,80%分位数一定位于[13.2,16.2)内。 由13.2+3×(0.80-0.77)/(0.86-0.77)=14.2 可以估计月均用水量的样本数据的80%分位数约为14.2. 类似地,由22.2+3×(0.95-0.94)/(0.98-0.94)=22.95 可以估计月均用水量的样本数据的95%分位数约为22.95.
答:假定样本在区间内均匀分布。13.2表示百分位数所在区间起点,3是区间长度。(0.86-0.77=0.09)表示区间在频率方面的长度,频率方面的总长度是1。然后把这区间在频率方面的长度当成一个整体,()表示所占比例77%到所占比列80%的长度,3×(0.80-0.77)/(0.86-0.77)表示它在长度为3的区间占到几分之几。然后13.2+3×(0.80-0.77)/(0.86-0.77)=14.2就是第80%分位数
思:13.2+3×(0.80-0.77)/(0.86-0.77)是什么意思?
同学们觉得以上文字叙述很抽象、难理解。下面我画个图来帮助同学们理解。
某赛季甲、乙两名篮球运动员10场比赛得分的原始记录为:甲运动员的得分:13 51 23 8 26 38 16 33 14 28 乙运动员的得分:49 24 12 31 50 31 44 36 15 37 估计甲运动员第25百分位数乙运动员第50百分位数。解:先将甲、乙两名运动员的得分按从小到大进行排序:甲:8 13 14 16 23 26 28 33 38 51乙:12 15 24 31 31 36 37 44 49 50 由25%×10=2.5,50%×10=5,可知甲的第25百分位数为第3项数据,为14;乙的第50百分位数为第5项数据,为31。
【探究3】 某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;(3)根据(2)中求得的数据计算用电量的75%分位数.
同学们要注意:原始数据丢失了,我们再也不能把原始数据按从小到大排列,于是可以数出第75百分位数。
解 (1)当0≤x≤200时,y=0.5x;当200
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率分布直方图可知
解得a=0.001 5,b=0.002 0.
(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400千瓦时的占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375(千瓦时),即用电量的75%分位数为375千瓦时.
思:0.6+(m-300)×0.002=0.75是什么意思?
假定样本在区间内均匀分布 0.6表示电量低于300千瓦的所占比例。0.002就是b,即所在矩形的高。(m-300)表示所占比要增加15%这个矩形的宽。(m-300)×0.002表示所占比要增加15%的这个矩形面积即频率的大小。 把方程0.6+(m-300)×0.002=0.75中的m求出来,就是电量的75%分位数。
人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体课文内容ppt课件: 这是一份人教A版 (2019)必修 第二册第九章 统计9.2 用样本估计总体课文内容ppt课件,共41页。
人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt: 这是一份人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt,共37页。PPT课件主要包含了小到大,n×p%,平均数,答案A,出现次数最多,横坐标,答案9696等内容,欢迎下载使用。
数学必修 第二册9.2 用样本估计总体集体备课ppt课件: 这是一份数学必修 第二册9.2 用样本估计总体集体备课ppt课件,共27页。PPT课件主要包含了离散型,连续型,知识点二百分位数,小于或等于,100-p%,大于或等于,第25百分位数,第50百分位数,第75百分位数,第5百分位数等内容,欢迎下载使用。