高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体导学案及答案
展开
这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体导学案及答案,共16页。学案主要包含了温故知新等内容,欢迎下载使用。
9.2.3 总体集中趋势的估计1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数).2.会求样本数据的众数、中位数、平均数.3.理解集中趋势参数的统计含义.重点:会求样本数据的众数、中位数、平均数.难点:理解集中趋势参数的统计含义.一、温故知新1、定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2、计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3、根据频率分布直方图(频率分布表)计算样本数据的百分位数:首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.众数:在一组数据中,出现次数最多的数据.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数). 做一做1.判断下列说法是否正确.(正确的打“√”,错误的打“×”)(1)改变一组数据中的一个数,则这些数据的平均数一定会改变.( )(2)改变一组数据中的一个数,则其中位数也一定会改变.( )(3)在频率分布直方图中,众数是最高矩形中点的横坐标.( )2、求下列各组数据的众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9(2)、1 ,2,3,3,3,5,5,8,8,9,9 3、求下列各组数据的中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9(2)1 ,2,3,3,3,4,8,8,8,9,94.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数 。一、情境与问题为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律,但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征,例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等. 在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势。 下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.例1. 利用下表中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数. 9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.52.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6思考:并与真实的样本平均数和中位数作比较。哪个量的值变化更大?你能解释其中的原因吗? 平均数由原来的8.79t变为9.483t,中位数没有变化.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变,因此,与中位数较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种频率分布直方图形态中,平均数和中位数的大小存在什么关系?例2.某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格,据统计,高一年级女生需要不同规格校服的频数如下表所示,校服规格155160165170175合计频数39641679026386如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和数中,哪个量比较合适?试讨论用上表中的数据估计全国高一年级女生校服规格的合理性.分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的类别,对于这样的分类数据,用众数作为这组数据的代表比较合适.众数、中位数和平均数的比较名称优点缺点平均数与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大中位数不受少数几个极端数据(即排序靠前或靠后的数据)的影响对极端值不敏感众数体现了样本数据的最大集中点众数只能传递数据中的信息的很少一部分,对极端值不敏感探究:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据,例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图,这时该如何估计样本的平均数、中位数和众数?在频率分布直方图中,损失了大量的原始数据,只知道分组和每组的频率,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数. 你能以下图居民用水的频率分布直方图提供的信息,估计出样本的平均数、中位数和众数吗?因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.如图所示,可以测出图中每个小矩形的高度,于是平均数的近似值为这个结果与根据原始数据计算的样本平均数8.79相差不大 根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等这个结果与根据原始数据求得的中位数6.6相差不大.由于0.077×3=0.231,(0.077+0.107)×3=0.552.因此中位数落在区间[4.2,7.2)内.设中位数为x,由0.077×3+0.107×(x-4.2)=0.5得到x≈6.71.因此,中位数约为6.71,如图所示.在频率分布直方图中,月均用水量在区间[4.2,7.2)内的居民最多,可以将这个区间的中点5.7作为众数的估计值,如图所示,众数常用在描述分类型数据中,在这个实际问题中,众数“5.7”让我们知道月均用水量在区间[4.2,7.2)内的居民用户最多,这个信息具有实际意义。在频率分布直方图中,我们无法知道每个组内的数据是如何分布的,此时,通常假设它们在组内均匀分布,这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数.跟踪训练2.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数(3)求这次测试数学成绩的平均数.(4)若例3条件不变,求80分以下的学生人数. 1.根据表中的数据,估计该市2019年全年空气质量指数的平均数、中位数和第80百分位(注:已知该市属于“严重污染”等级的空气质量指数不超过400)已知某市2019年全年空气质量等级如下表所示2.某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计日工资2200250220200100 人数16510123合计22001500110020001006900(1)指出这个问题中日工资的众数、中位数、平均数(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?3.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数;(3)求这次测试数学成绩的平均分. 平均数、中位数和众数的意义 1.平均数: 平均数是指在一组数据中所有数据之和再除以数据的个数,特征:平均数的大小与一组数据里的每个数均有关系,其中任何数据的变动都会相应引起平均数的变动。2.中位数: 将一组数据从小到大(或从大到小)排列,中间的数称为这组数据的中位数。如果是奇数个数据,中间的数就为这组数据的中位数,如果是偶数个数据,中间两个数的平均数为这组数据的中位数,特征:中位数仅与数据的排列有关,部分数据的变动对中位数可能没有影响。3.众数: 一组数据中出现次数最多的数值叫众数,有时在一组数中有几个,特征:众数着眼于对各数据出现频率的考察,其大小只与这组数据的部分数据有关。平均数、中位数、众数的联系 众数、中位数及平均数都是描述一组数据的集中趋势的量,其中以平均数最为重要,其应用也最为广泛。 参考答案:知识梳理做一做1.√;√;×2、(1)众数是:3和8(2) 众数是:33、(1)中位数是:5(2)中位数是:44. 解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。 这组数据的平均数是学习过程例1. 所以估计全市居民用户的月均用水量约为8.79t,其中位数约为6.6t.跟踪练习1. 小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数.思考: 平均数由原来的8.79t变为9.483t,中位数没有变化.这是因为样本平均数与每一个样本数据有关,样本中的任何一个数据的改变会引起平均数的改变;但中位数只利用了样本数据中间位置的一个或两个值,并未利用其他数据,所以不是任何一个样本数据的改变都会引起中位数的改变,因此,与中位数较,平均数反映出样本数据中的更多信息,对样本中的极端值更加敏感.例2.分析:虽然校服规格是用数字表示的,但它们事实上是几种不同的类别,对于这样的分类数据,用众数作为这组数据的代表比较合适.解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据(下图)可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理. 跟踪训练1.(2)众数为75.设中位数为x,由于前三个矩形面积之和为0.35,第四个矩形面积为0.3,0.35+0.3>0.5,因此中位数位于第四个矩形内,得0.3+0.03(x-70)=0.5,所以x=75.2(2)设中位数为x,由图知前三个矩形面积之和为0.4,第四个矩形面积为0.30.3+0.4>0.5,因此中位数位于第四个矩形内得:0.4+0.03(x-70)=0.5,所以x≈73.3.解:由题干图知这次数学成绩的平均数为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.(4)若例3条件不变,求80分以下的学生人数.[40,80)分的频率为:(0.005+0.015+0.020+0.030)×10=0.7,所以80分以下的学生人数为80×0.7=56. 达标检测1.2.分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。利用样本数字特征进行决策时的两个关注点(1)平均数与每一个数据都有关,可以反映更多的总体信息,但受极端值的影响大;中位数是样本数据所占频率的等分线,不受几个极端值的影响;众数只能体现数据的最大集中点,无法客观反映总体特征.(2)当平均数大于中位数时,说明数据中存在许多较大的极端值.3. 解析: (1)由图知众数为=75.(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.(3)由图知这次数学成绩的平均分为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.
相关学案
这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体导学案及答案,共4页。
这是一份人教A版 (2019)必修 第二册9.2 用样本估计总体学案,共6页。学案主要包含了学习目标,自主学习,小试牛刀,经典例题,跟踪训练,当堂达标,课堂小结,参考答案等内容,欢迎下载使用。
这是一份2020-2021学年6.4 用样本估计总体学案设计,共13页。