数学必修 第二册9.2 用样本估计总体精品课件ppt
展开为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等. 在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
平均数:反映所有数据的平均水平的数据叫做平均数.中位数:把处在最中间位置的一个数据或最中间两个数据的平均数叫做中位数.众数:出现次数最多的数据叫做众数.
例4.利用9.2.1节中100户居民用户的月均用水量的调查数据,计算样本数据的平均数和中位数,并据此估计全市居民用户月均用水量的平均数和中位数.
思考1:小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?
思考2:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
例5.某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表所示.
如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据.可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适. 由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感. 一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对于分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
思考3:样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始数据.例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图.这时该如何估计样本的平均数、中位数和众数?你能以图9.2—1中频率分布直方图提供的信息为例,给出估计方法吗?
在频率分布直方图中,我们无法知道每个组内的数据是如何分布的.此时,通常假设它们在组内均匀分布.这样就可以获得样本的平均数、中位数和众数的近似估计,进而估计总体的平均数、中位数和众数. 因为样本平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
以上我们讨论了平均数、中位数和众数等特征量在刻画一组数据的集中趋势时的各自特点,并研究了用样本的特征量估计总体的特征量的方法.需要注意的是,这些特征量有时也会被利用而产生误导.例如,假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”,该如何理解这句话? 这句话是真实的,但它可能描述的是差异巨大的实际情况.例如,可能这个企业的工资水平普遍较高,也就是员工年收入的中位数、众数和平均数差不多;也可能是绝大多数员工的年收入较低(如绝大多数是5万元左右),而少数员工的年收入很高,甚至达到100万元,这句话是真实的,但它可能描述的是差异巨大的实际情
况.例如,可能这个企业的工资水平普遍较高,也就是员工年收入的中位数、众数和平均数差不多;也可能是绝大多数员工的年收入较低(如绝大多数是5万元左右),而少数员工的年收入很高,甚至达到100万元,在这种情况下年收入的平均数就比中位数大得多.尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为了招揽员工,却用了平均数. 所以,我们要强调“用数据说话”,但同时又要防止被数据误导,这就需要掌握更多的统计知识和方法.
辨析1:判断正误.1.一组数据中的平均数和中位数都不一定是原始数据中的数.( ) 2.样本的平均数是频率分布直方图中最高长方形的中点对应的数据.( ) 3.若改变一组数据中其中的一个数,则这组数据的平均数、中位数、众数都会发生改变.( )
辨析2:七位评委为某跳水运动员打出的分数如下:84,79,86,87,84,93,84,则这组分数的中位数和众数分别是( ),85 B.84,84 C.85,84 D.85,85
辨析3:已知一组数据7.5, 8.0, 8.4, 7.8, 8.3,那么这组数据的平均数为____.
例1.(1)一组样本数据为:19,23,12,14,14,17,10,12,18,14,27,则这组数据的众数和中位数分别为( ),14 B.12,14 C.14,15.5 D.12,15.5
方法技巧: 平均数、众数、中位数的计算方法 平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.【注】如果样本平均数远大于样本中位数,说明数据中存在较大的极端值.
变1.(1)某学习小组在一次数学试验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该学习小组成绩的平均数、众数、中位数分别是( )分、85分、85分 B.87分、85分、86分C.87分、85分、85分 D.87分、85分、90分
变1.(2)某校在一次学生演讲比赛中,共有7个评委,学生最后得分为去掉一个最高分和一个最低分的平均分.某学生所得分数为9.6,9.4,9.6,9.7,9.7,9.5,9.6,这组数据的众数是____,该学生最后得分为____.
答案:9.6,9.6.
例2.某校从参加高二年级学业水平测试的800名学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.
(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数;(3)求这次测试数学成绩的平均数;(4)试估计这次测验高二年级80分以上的学生人数.
变2.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数,中位数;(2)高一参赛学生的平均成绩.
求:(1)高一参赛学生成绩的众数,中位数;
求:(2)高一参赛学生的平均成绩.
1.众数、中位数、平均数的比较
2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,也就是50%分位数.(3)众数:众数是最高小矩形底边的中点所对应的数据.
人教A版 (2019)9.2 用样本估计总体图文ppt课件: 这是一份人教A版 (2019)<a href="/sx/tb_c4000310_t3/?tag_id=26" target="_blank">9.2 用样本估计总体图文ppt课件</a>,共37页。PPT课件主要包含了横坐标等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体图文ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体图文ppt课件,共29页。PPT课件主要包含了导入新课,精彩课堂,课堂练习,课堂总结等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体说课ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体说课ppt课件,共10页。PPT课件主要包含了中位数平均数,复习回顾,课前练习,新知探究,设中位数为,典例解析,随堂练习,巩固练习,归纳总结,当堂训练一等内容,欢迎下载使用。