高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体精品ppt课件
展开1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数),培养数据分析的核心素养;2.会求样本数据的众数、中位数、平均数,提升数学运算的核心素养;3.理解集中趋势参数的统计含义,培养数据分析的核心素养。
现从甲、乙、丙三个厂家生产的同一种耐用家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下:(单位:年)甲:3,4,5,6,8,8,8,10;乙:4,6,6,6,8,9,12,13;丙:3,3,4,7,9,10,11,12.【问题】 三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为什么吗?
【提示】 三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年,乙:平均数为8年,丙:中位数为8年.
为了了解总体的情况,前面我们研究了如何通过样本的分布规律估计总体的分布规律.但有时候,我们可能不太关心总体的分布规律,而更关注总体取值在某一方面的特征.例如,对于某县今年小麦的收成情况,我们可能会更关注该县今年小麦的总产量或平均每公顷的产量,而不是产量的分布;对于一个国家国民的身高情况,我们可能会更关注身高的平均数或中位数,而不是身高的分布;等等.
在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势.
平均数:反映所有数据的平均水平的数据叫做平均数.中位数:把处在最中间位置的一个数据或最中间两个数据的平均数叫做中位数.众数:出现次数最多的数据叫做众数.
下面我们通过具体实例进一步了解这些量的意义,探究它们之间的联系与区别,并根据样本的集中趋势估计总体的集中趋势. 例4 利用9.2.1节中100户居民用户的月均用水量的调查数据, 计算样本数据的平均数和中位数, 并据此估计全市居民用户月均用水量的平均数和中位数.
9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.0 2.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.9 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.4 3.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.0 22.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.9 5.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.7 5.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.3 5.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.8 7.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6
解:① 根据已知100户居民用户月均用水量的数据,可得样本平均数为
即100户居民的月均用水量的平均数为8. 79 t.
由上述数据可得,第50个数和第51个数均为6.8,由中位数的定义,可得100户居民的月均用水量的中位数是6.8 t.
②将样本数据按从小到大排序,结果如下:
1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0
因为数据是抽自全市居民户的简单随机样本,所以我们可以据此估计全市居民用户的月均用水量约为8.79 t,其中位数约为6.8 t,众数是2.0和5.5t.
由众数的定义,可得100户居民的月均用水量的众数是2.0和5.5 t.
思考1:小明用统计软件计算了100户居民用水量的平均数和中位数,但在录入数据时,不小心把一个数据7.7录成了77.请计算录入数据的平均数和中位数,并与真实的样本平均数和中位数作比较,哪个量的值变化更大?你能解释其中的原因吗?
思考2:平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在下图的三种分布形态中,平均数和中位数的大小存在什么关系?
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.
例5.某学校要定制高一年级的校服,学生根据厂家提供的参考身高选择校服规格.据统计,高一年级女生需要不同规格校服的频数如表所示. 如果用一个量来代表该校高一年级女生所需校服的规格,那么在中位数、平均数和众数中,哪个量比较合适?试讨论用表中的数据估计全国高一年级女生校服规格的合理性.
解:为了更直观地观察数据的特征,我们用条形图来表示表中的数据.可以发现,选择校服规格为“165”的女生的频数最高,所以用众数165作为该校高一年级女生校服的规格比较合适.由于全国各地的高一年级女生的身高存在一定的差异,所以用一个学校的数据估计全国高一年级女生的校服规格不合理.
众数只利用了出现次数最多的那个值的信息.众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度.因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感. 一般地,对数值型数据(如用水量、身高、收入、产量等)集中趋势的描述,可以用平均数、中位数;而对于分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
探究2 样本的平均数、中位数和众数可以分别作为总体的平均数、中位数和众数的估计,但在某些情况下我们无法获知原始的样本数据. 例如,我们在报纸、网络上获得的往往是已经整理好的统计表或统计图. 这时该如何估计样本的平均数、中位数和众数?你能以下面的频率分布直方图提供的信息为例,给出估计方法吗?
思考1 根据频率分布直方图如何计算样本平均数?
1. 根据频率分布直方图计算样本平均数:
因为样本平均数可以表示为数据与它的频率的乘积之和. 所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
所以由上图可得样本平均数为
这个结果与根据原始数据计算的样本平均数8.79相差不大.
由于0.077×3=0.231,(0.077+0.107)×3=0.552,因此中位数落在区间[4.2, 7.2)内.设中位数为x,由0.077×3+0.107×(x-4.2)=0.5,解得x≈6.71.因此,中位数约为6.71.这个结果与根据原始数据计算的样本中位数6.8相差不大.
2. 根据频率分布直方图计算样本中位数:
根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数. 因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
3. 根据频率分布直方图计算样本众数:
根据众数定义得,在样本数据中出现次数最多数据就是众数. 因此在频率分布直方图中,我们常常把最高直方图底边的中点作为众数的估计值.
在这个实际问题中,众数“5. 7”让我们知道月均用水量在区间[4.2, 7.2)内的居民用户最多. 但这个结果与根据原始数据计算的样本众数2.0和5.5相差比较大,这说明众数只利用了出现次数最多的那个值的信息. 众数只能告诉我们它比其他值出现的次数多,但并未告诉我们它比别的数值多的程度,因此,众数只能传递数据中的信息的很少一部分,对极端值也不敏感.
在此频率分布直方图中,月均用水量在区间[4.2, 7.2)内的居民最多,所以将这个区间的中点5.7作为众数的估计值.
思考3 以上我们讨论了平均数、中位数和众数在刻画一组数据的集中趋势时的各自特点,并研究了用样本的特征量估计总体特征量的方法. 但需要注意的是,这些特征量有时会被利用而产生误导. 例如,假设你到人力市场去找工作,有一个企业老板告诉你,“我们企业员工的年平均收入是20万元”. 你如何理解这句话?
这句话是真实的,但它可能描述的是差异巨大的实际情况. 例如,可能这个公司的工资水平普遍较高,也就是员工收入的中位数、众数与平均数差不多;也可能是绝大多数员工的年收入较低,而少数员工的年收入很高;在这种情况下,年收入的平均数就比中位数大得多.尽管在后一种情况下,用中位数或众数比用平均数更合理些,但这个企业的老板为了招揽员工,却用了平均数.所以,我们要强调“用数据说话”,但同时又要防止被数据误导. 这就需要掌握更多的统计知识和方法.
1. 根据表9.2-2中的数据,估计该市2015年全年空气质量指数的平均数、中位数和第80百分位数.(注:已知该市属于“严重污染”等级的空气质量指数不超过400)
由上表数据可知,中位数在50~100之间,其估计值为
25×22.8%+75×33.2%+125×18.6%+175×13.4%+250×8.2%+350×3.8%≈111.
由上表数据可知,空气质量指数在0~150的频率为0.746,0~200的频率为0.88.所以第80百分位数在150~200之间,其估计值为
2. 假设你是某市一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额. 已知国家对本市一条新公路的建设投资为2000万元人民币,对另外25个公路项目的投资是20~100万元,这26个投资金额的中位数是25万元,平均数是100万元,众数是20万元. 请你根据上面的信息给市长写一份简要的报告.
解:因为一条公路建设投资2000万元,属极端情况,大多数投资项目在20万元至100万元之间,此时平均数难以正确客观反映各项目投资的实际分布状况,不宜选用. 而众数20万元只说明投资20万元的项目最多,不能反映其他项目的投资数额. 中位数对极端值不敏感,能回避极端数额的影响. 所以25万元比较客观,故选中位数25万元作为平均投资金额.
3. 某校举行演讲比赛,10 位评委对两位选手的评分如下: 甲 7.5 7.5 7.8 7.8 8.0 8.0 8.2 8.3 8.4 9.9 乙 7.5 7.8 7.8 7.8 8.0 8.0 8.3 8.3 8.5 8.5选手的最终得分为去掉一个最低分和一个最高分之后,剩下8个评分的平均数. 那么,这两个选手的最后得分是多少? 若直接用10位评委评分的平均数作为选手的得分,两位选手的排名有变化吗? 你认为哪种评分办法更好? 为什么?
解:去掉一个最低分和一个最高分后的平均数分别为
若不去掉一个最低分和一个最高分的平均数分别为
所以甲、乙的最后得分分别为8分和8.06分.
此时,甲、乙两位选手的排名发生了变化. 相比较而言第一种评分办法更合理,因为去掉一个最低分和一个最高分以后能够防止被数据中的极端值误导,使平均数能更加准确地反映数据信息.
1.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各1人,则该小组成绩的平均数、众数、中位数分别是( )A.85分、85分、85分 B.87分、85分、86分C.87分、85分、85分 D.87分、85分、90分
2.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:甲群 13,13,14,15,15,15,15,16,17,17;乙群 54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
3.从高三年级抽出50名学生参加数学竞赛,由成绩得到如图所示的频率分布直方图.由于一些数据丢失,试利用频率分布直方图估计:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.
解 (1)最高矩形的高是0.03,其底边中点是=75,则这50名学生成绩的众数估计是75分.频率分布直方图中,从左到右前3个和前4个矩形的面积和分别是(0.004+0.006+0.02)×10=0.3<0.5,(0.004+0.006+0.02+0.03)×10=0.6>0.5,设中位数是m,则70<m<80,则0.3+(m-70)×0.03=0.5,解得m≈76.7(分),即这50名学生成绩的中位数约是76.7分.(2)每个小矩形的面积乘以其底边中点的横坐标的和为0.004×10×45+0.006×10×55+0.02×10×65+0.03×10×75+0.024×10×85+0.016×10×95=76.2.即这50名学生的平均成绩约是76.2分.
1.众数、中位数、平均数的比较
2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,也就是50%分位数.(3)众数:众数是最高小矩形底边的中点所对应的数据.
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体示范课ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体示范课ppt课件,共29页。PPT课件主要包含了探究新知,例题讲解,①估计平均数,于是平均数的近似值为,↑小矩形面积,设中位数是x则,②估计中位数,最高矩形的中点,③估计众数,课堂练习等内容,欢迎下载使用。
人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt: 这是一份人教A版 (2019)必修 第二册9.2 用样本估计总体教课课件ppt,共37页。PPT课件主要包含了小到大,n×p%,平均数,答案A,出现次数最多,横坐标,答案9696等内容,欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体优秀ppt课件: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体优秀ppt课件,共29页。PPT课件主要包含了学习目标,新知学习,易错辨析,典例剖析,反思感悟,跟踪训练,随堂小测,ABC,课堂小结等内容,欢迎下载使用。