初中数学沪科版八年级下册20.2 数据的集中趋势与离散程度备课课件ppt
展开20 . 2 数据的集中趋势与离散程度
20.2.1数据的集中趋势
右图表示的是甲、乙、丙三人的射击成绩,谁的成绩更好?你是怎么判断的?除了直观感觉外,我们如何用量化的数据来刻画“更好”呢?
问题1 某校“环保宣传”小组定期对学校的空气含尘量进行检测,下面是某天每隔 2 h 测得的数据:
0.03,0.04,0.03,0.02,0.04,0.01,0.03,0.03,0.04,0.05,0.01,0.03.
根据上面数据,怎样说明这一天的空气含尘量?
计算上述数据的平均数:
把这个平均数作为这组数据的一个代表,用来反映该日空气含尘量的一般状况. 我们说学校这一天的空气含尘量平均为0.03g/m3.
一般地,如果有n 个数据
x1,x2,···,xn,
对于一组数据,我们常用平均数来作为刻画它的集中趋势的一种方法.
按此公式计算的平均数,通常也叫算术平均数.
例1 在一次校园网页设计比赛中,8 位评委对甲乙两名选手的评分情况如下:
确定选手的最后得分有两种方案:一是将评委评分的平均数作为最后得分;二是将评委评分中的一个最高分与一个最低分去掉后的平均数作为最后得分. 哪一种方案更为可取?
解 按方案一计算甲、乙的最后得分为
这时,甲的成绩比乙高.
按方案二计算甲、乙的最后得分为
这时,乙的成绩比乙高.
将上面的得分与表中的数据相比较,我们发现有 5 位评委对甲的评分不高于乙,这表明多数人认为乙的成绩好.方案二的结果表明乙的成绩比甲高,与大多数评委的观点相符. 因此,按方案二评定选手的最后得分较为可取.
1. 人们说“女性比男性寿命长”是依据什么得出的?
样本中女性寿命的平均数大于男性平均数.
2. 本节例 1中若只去掉一个最高分或只去掉一个最低分, 再将其余评委评分的 平均数作为最后得分 是否可取? 为什么?
不可取,因为去掉最低分,平均分会升高,去掉最高分,平均分会降低,这样求出的平均数都不能很好地反映甲、乙两人的实际水平.
例2 某校在招聘新教师时以考评成绩确定人选. 甲、乙两位高校毕业生的各项考评成绩如下表:
(1) 如果学校将教学设计、课堂教学和答辩按 1∶3∶1的比例来计算各人的考评成绩,那么谁会被录用?
(2) 如果按教学设计占30% 、课堂教学占 50%、答辩占20% 来计算各人的考评成绩,那么又是谁会被录用?
90×30%+85×50%+90×20%=87.5(分),
80×30%+92×50%+83×20%=86.6(分),
例2 中是用什么来表示各个指标的重要程度的?
用“权”来表示各个指标的重要程度.
一般地,对上面的求平均数,可统一用下面的公式:
通过例 2,我们可以看出数据的权能反映数据的相对“重要度”.
1. 据气象台预报,2012 年某日我国 34 个主要城市的最 高气温情况如图所示:
问这 34 个城市这一天最高气温的平均值是多少?
2. 小林、小红两位同学英语各单项测试成绩如下:
若听力、阅读、写作三项成绩分别按 15%,50%,35%计入总分,谁的总成绩好? 若分别按 35%,50%,15%呢?
解:若听力、阅读、写作三项成绩分别按15%、50%、35%计入总分小林:70×15%+80×50%+90×35%=82(分)小红:90×15% +80×50%+70×35%=78(分).∵82 > 78∴小林的总成绩最好.
若听力、阅读、写作三项成绩分别按35%、50%、15%计入总分小林:70×35%+80×50%+90×15%=78(分)小红:90×35%+80×50%+70×15%=82(分);∵78<82,∴小红的总成绩最好.
求一组数据的平均数,当数据很多时,用笔算比较麻烦这时用计算器就很简便.只要按照指定的方法将各个数据依次输人计算器(图20-5),即可直接得出结果.下面,我们以例1中求选手甲的平均分为例加以说明.
60 个长绒棉样品的纤维长度(单位:mm)如下:
37,43,33,37,36,41,39,34,38,45,36,30,37,28,41,38,35,37,32,44,29,36,42,38,36,35,37,34,40,37,31,37,47,35,37,39,38,36,40,38,35,27,38,37,33,37,26,36,38,44,48,42,36,33,39,36,38,37,37,40.
请用计算器计算该批样品纤维的平均长度(精确到 0.01 mm)
(26 + 27 + 28 + 29 + 30 + 31 + 32 + 33 × 3+34× 2+35×4+36×8+37×12+38×8+39×3+40×3 + 41×2+42×2+43+44×2+45+47+48)÷60=2220÷60= 37.00 (mm)答:该批样品纤维的平均长度为37.00mm
问题2 某公司对外宣称员工的平均年薪为 3 万元经过调查,发现该公司全体员工年薪的具体情况如下表:
看了这张调查表,你认为该公司的宣传是否失实? 3 万元能代表该公司员工年薪的一般水平吗?
在公司的 21名员工中,年薪不低于3 万元的只有 6人而低于3 万元的却有 15 人,并且其中有 13 人不超过 2万元,8 人不超过1.5 万元,年薪 1.5 万元的人数最多,为6 人.
如果我们将上面的 21 个数据按大小顺序排列,不难发现数据2万元处于中间位置,也就是说: (1) 年薪不低于 2 万元的人数不少于一半(13 人); (2) 年薪不高于2 万元的人数也不少于一半(13 人).
一组数据中出现次数最多的数据叫做这组数据的众数.
一般地,当将一组数据按大小顺序排列后,位于正中间的一个数据(当数据的个数是奇数时)或正中间两个数据的平均数(当数据的个数是偶数时)叫做这组数据的中位数.
中位数和众数也是刻画数据集中趋势的两种方法.
将一组数据按照由小到大(或由大到小)的顺序排列: 如果数据的个数是奇数,那么位于正中间位置的数为这组数据的中位数; 如果数据的个数是偶数,那么正中间两个数据的平均数为这组数据的中位数.
思考:中位数有何意义?
思考1:中位数怎么确定?
如果一组数据中有极端数据,中位数比平均数更能合理地反映该组数据的整体水平.
(1) 一组数据中可能没有众数,如 1,2,3,4,6,5 中没有众数.
(2) 一组数据的众数可能不止一个,如 1,1,2,3,3,5 中众数是 1 和 3.
思考2:众数是否一定唯一?
(3) 众数是一组数据中出现次数最多的数据而不是最多的次数,如 1,1,1,2,2,5 中众数是 1 而不是 3.
例3 8位评委对选手甲的评分情况如下:
9.0,9.0,9.2,9.8,8.8,9.2,9.5,9.2.
求这组数据的中位数和众数.
解 将这 8 个数据按从小到大的顺序排列,得
8.8,9.0,9.0,9.2,9.2,9.2,9.5,9.8.
其中正中间的两个数据是 9.2,9.2,它们的平均数也是9.2,即这组数据的中位数是9.2 分. 数据 9.2出现次数最多,所以这组数据的众数也是9.2分.
问题3 巨星公司是以生产各种模具为主的大型企业公司销售部有营销员 15人. 销售部为了制定下一年度每位营销员的销售定额,统计了这 15人本年度的销售情况:
(1) 如果公司销售部把每位营销员的下一年度销售额定为平均数 86 万元,你认为是否合理?为什么? (2)你认为销售额定为多少元比较合理?试说出你的理由.
但是如果我们注意到 40 万元这个数据就会发现: (1) 它是众数; (2) 它是中位数,销售额不小于它的人数为 10 人,小于它的仅有 5人.
因此,若将 40 万元定为下年度的销售额,则更加符合大多数人的承受能力,有利于调动营销员的积极性.
平均数、中位数和众数都是反映数据集中趋势的统计量,能从不同的角度提供信息.
能充分利用数据提供的信息,它的使用最为广泛能刻画一组数据整体的平均状态,但不能反映个体性质,易受极端值(即一组数据中与其余数据差异很大的数据)的影响.
代表了这组数据数值大小的“中点”,不易受极端值影响,但不能充分利用所有数据的信息.
反映一组数据中出现次数最多的数据. 一组数据中,众数可能不止一个,也可能没有.
我们已经看到,有时是平均数更能反映问题,有时则是中位数或众数更能反映问题.
总之,要根据具体问题来选择刻画一组数据的集中趋势的统计量,选择的统计量要能够更客观地反映实际背景.
最不感兴趣的指标是平均数;最感兴趣的指标是众数.
1.一组数据的平均数、中位数和众数一定在这组数据中 吗?举例说明.
平均数、中位数不一定在这组数据中,例如数据1、2、3、5的平均数为2.75,中位数是2.5,而众数的定义为在一组数据中出现次数最多的数值,例如数据1、1、1、2、2、3的众数是1,故一组数据中平均数、中位数不一定在这组数据中,而众数一定在这组数据中.
2. 某届世界杯足球赛结束后,球迷统计了全部(64 场)比 赛的进球情况.
求全部比赛进球数的中位数和众数.
3. 如图是N市某年 12月1日至 10 日的最低气温图.
求这 10 天最低气温的平均数、中位数和众数.
4. 小明在一次数学检测中得了 80 分,而全班同学这次检 测的平均成绩为 75 分,因此小明认为他的成绩在全 班属中等偏上,你同意他的看法吗?
不同意他的看法,判断其成绩中等偏上的依据应该是其成绩大于全班成绩的中位数,而不是大于平均成绩.
问题4 某园艺场采摘苹果,边采摘、边装箱,共装了2000箱. 苹果的市场收购价为 4 元/kg. 现在要估计出这2000 箱苹果的销售收入,我们可以怎样去做?
方法一:全面调查,就是一箱箱地称,再根据苹果的总质量估计这 2000 箱果的销售收入.
三、用样本平均数估计总体平均数
方法二:采用抽样的方法.该园艺场从中任意抽出了10箱苹果,称出它们的质量,得到如下数据(单位:kg):
16,15,16.5,16.5,15.5,14.5,14,14,14.5,15.
4 × 15.15 × 2 000 = 121 200(元)
例4 某单位共有 280 位员工参加了社会公益捐款活动,从中任意抽取了 12 位员工的捐款数额,记录如下:
估计该单位的捐款总额.
解 这12位员工的捐款数额的平均数为
62.5 × 280 = 17 500 (元).
从上面的问题和例子中,我们可以看到:
现实生活中总体平均数一般难以计算出来,通常我们就用样本平均数估计总体平均数.
问题5 某班45 名学生的体重(单位:kg)数据如下:
47,48,42,61,50,45,44,46,51,46,45,51,48,53,55,42,47,51,49,49,52,46,52,57,49,48,57,49,51,41,52,58,50,54,55,48,56,54,60,44,53,61,54,50,62.
选第9列的数据作为样本,计算它的平均数:再选取第3,6,9 列共三列的数据作为样本,计算它的平均数.
与总体的平均数相比较,你有什么发现?
用样本的平均数估计总体的平均数,如果样本容量太小,往往差异较大.
1. 为了解某小区居民7 月份的用水情况,任意抽查了 20 户家庭的月用水量,结果如下:
如果该小区有 200 户家庭,估计该小区居民7 月份的用水总量.
根据题意得: 200×[(10×3+12×5+13×2+14×3+15×3+16×2+17+18)÷20] = 2700(m³),答:该小区居民7月份的用水总量是2700m3.
2. 某家电商场今年7月15 日至7月20日,每天销售某种空 调数量(单位:台)为:
6,8,8,10,12,10 .
据此预测,下半年销售量可达到 1 656 台,请问是怎样作出预测的?这种预测有道理吗?
3. 抽查某商场 8月份7天的营业额(单位:万元),结果 如下:
3.0,3. 1,2.9,3.0,3.4,3.2,3.5.
试估计这个商场该月的营业额(精确到 0.01 万元).
随机抽查的7天的营业额的平均数为:(3.0+3.1+2.9+3.0+3.4+3.2+3.5)÷7≈3.16(万元),则这个商场该月的营业额:3.16 × 31 = 97.96(万元).
4. 6月5日是“世界环境日”,某校“绿色”小组进入明 光社区进行一次有关“白色污染方面的抽样调查,调 查结果如下:
如果该社区有 500 户居民,请你估计该社区居民每天要丢弃多少个废塑料袋?
根据题意得: 500×[(0×2+3×9+4×28+5×16+6×5)÷(2+9+28+16+5)] = 2075(个), 答:该社区居民每天要丢弃2075个废塑料袋.
20.2.2数据的离散程度
这是两名队员射击训练各 10 次的成绩,观察两幅图片,进行比较,你发现什么?那么,我们用怎样的办法来比较这两名队员成绩的稳定性呢?
问题6 两台机床都生产直径为(20 0.2)mm 的零件,为了检验产品质量,从产品中各抽出 10 个进行测量,结果如下(单位:mm):
要比较, 首先想到比较两组数据的平均值:
把每组零件的直径分别用点来表示,如图 .
图中过 20.0与横轴平行的直线上的点表示平均数.可见机床 A 生产出的零件的直径中偏离这个平均数0.2 mm的有6个0.1mm的有2个;
机床 B生产出的零件的直径中偏离这个平均数0.2mm 的有2个01mm的有4个直观上容易看出机床 B 比机床 A 生产的零件的精度更稳定.
但如何用数量来刻画一组数据的离散程度呢?
统计学中常用下面的方法:
来衡量这组数据的离散程度,并把它叫做这组数据的方差.
下面通过计算方差,来评判问题中机床 A 和机床 B 哪台生产的零件的精度更稳定.
前面已经算得 A,B 两组数的平均数,
由于0.026 > 0.012,可知机床A生产的10 个零件直径比机床 B生产的10 个零件直径波动要大.
一组数据方差越大,说明这组数据的离散程度越大.
1. 求下列每题中两组数据的方差,并说明哪组数据的离 散程度较小.
(1) A:11,12,13,14,15 ; B:11,13,13,14;
(2) A:30,50,50,50,60; B:30,44,50,56,60.
∵96 < 110.4,∴ A组数据离散程度较小.
2. 考察甲、乙两种小麦的长势,分别从中抽取 10 株苗, 测得苗高如下(单位:cm):
甲:12,13,14,15,10,16,13,11,15,11;乙:11,16,17,14,13,19, 6, 8, 10,16.
计算甲、乙两组数据的方差,说明哪种小麦长得较整齐.
求一组数据的方差,用计算器更为方便.
例5 用计算器求下列数据的方差(结果保留 2 位小数):
138,156,131,141,128, 139,135,130.
(3) 输入数据,依次按以下各键:
(4) 求方差.在计算器的键盘上,用 σX 表示一组数据的方差的算术平方根.
σX=8.302860953
ANS2=68.9375
A :20, 21,22,23,24, 25,26 ;B : 20,20,23,23,23, 26,26.
用计算器分别求出它们的方差,并说明哪组数据的波动较大.
∴ B组数据的波动较大.
2. 两名跳远运动员在 10 次测验中的成绩如下(单位:m);
甲:5.85,5.93,6.07,5.91,5.99,6.13,5.89,6.05,6.00,6.19;乙:6.11,6.08,5.83,5.92,5.84,6.18,6.17, 5.81,5.85,6.21.
用计算器分别计算两组数据的方差,并根据计算估计哪名运动员的成绩较稳定.
∴甲运动员成绩比较稳定.
用 Excel 求一组数据的方差,非常方便.
(1) 打开Excel,将本章 20.2节的问题6中机床A生产的10 个零件的直径数据:
20.0,19.8,20.1,20.2,19.9,20.0,20.2,19.8,20.2,19.8逐个输入到 Excel 表格的单元格 A2~A11中,再选中单元格B12,作为显示答案的位置(图 20-7).
(2) 选择“公式”菜单中的“插入函数”命令(图20-8),在弹出的“插入函数”对话框中选择“统计”分类中的“VARP”函数(图20-9),点击“确定”按钮.
(3) 弹出“VARP”函数参数对话框后,将此对话框移开,选中A2~A11(图20-10),再点击“确定”按钮,得到方差为0.026.
在实际问题中,与用样本平均数估计总体平均数一样,我们也常用样本方差估计总体方差,如:
例6 为比较甲乙两个新品种水稻的产品质量,收割时各抽取了五块具有相同条件的试验田地,分别称得它们的质量,得其每公顷产量如下表(单位:t);
(1) 哪个品种平均每公顷的产量较高?(2) 哪个品种的产量较稳定?
分析:现在要通过比较甲、乙两个新品种在试验田中的产量和产量的稳定性,来估计甲、乙两个新品种在这一地区的产量和产量的稳定性,这实际上就是用样本的平均数和方差来估计总体的平均数和方差.
(1) 哪个品种平均每公顷的产量较高?
解 甲、乙两个新品种在试验田中的产量各组成一个样本.
说明甲、乙两个新品种平均每公顷的产量一样高.
(2) 哪个品种的产量较稳定?
得出 s2甲< s2乙.
可知,甲品种每公顷的产量波动比乙品种每公顷的产量波动要小,由此估计甲品种的稳定性好.
一般地,在平均数相同的情况下,方差越大,则意味着这组数据对平均数的离散程度也越大. 在两组数据的平均数相差较大时,以及在比较单位不同的两组数据时,不能直接用方差来比较它们的离散程度.
1. 在对某玉米品种进行考察时,农科所从一块试验田里随机抽取了 15 株玉米,称得各株玉米的产量如下(单位: kg):
0.25,0.16,0.16,0.15,0.20,0.13,0.10,0.18,0.14,0.12,0.13,0.13,0.18,0.15,0.10.
由此估计这块试验田每株玉米产量的方差是多少?
2. 从甲、乙两名工人生产的同一种零件中,各随机抽出 4 个,量得它们的直径(单位:mm)如下:
田生产零件:9.98, 10.00,10.02,10.00;乙生产零件:10.00,9.97, 10.03,10.00.
求它们的方差,并说明谁做的零件直径差异较小.
1. 某次中学生田径运动会上参加男子跳高的 10 名运 动员的成绩如下表:
求这些运动员的平均成绩.
2. 青年歌手大奖赛中,某民族唱法选手的歌唱得分如下:
8.1,8.6,8.6,8.4,8.8,8.2, 9.2,8.7,8.7,8.8,8.9,8.1.
去掉一个最高分和一个最低分,再计算平均分,则该选手的最后得分是多少?
∵题目中数据的最高分是9.2,最低分是8.1.∴平均分为: (8.1+8.6+8.6+8.4+8.8+8.2+8.7+8.7+8.8 + 8.9) ÷10 =8.58(分) 答:该选手的最后得分是8.58分.
3. 某单位男职工数与女职工数之比为 5∶3,男女职工的 平均年龄分别为 40 岁和30岁,求该单位职工的平均 年龄.
4. 已知一组数据 5,15,75,45,25,75,45,35,45, 35,那么 40 是这组数据的( ). (A) 平均数但不是中位数 (B) 平均数也是中位数 (C) 众数 (D) 中位数但不是平均数
5. 在体育课上,老师对九年级 100 名男生引体向上这一 项目进行了一次测试,成绩如下表:
(1) 求这些男生引体向上成绩的平均数、中位数和众数(精确到 0.1);
九年级100名男生中共有30人引体向上次数为10次,因此引体向上成绩的众数是10;
(2) 若规定 8 次以上(含8 次)为优秀,求这 100 名男生该项目成绩的优秀率.
(30+20+15)÷100 = 65%,答:这100名男生该项目成绩的优秀率为65%。
6. 十一黄金周时期,某旅游区的游客量如下表:
(1) 求这 7天假期中,游客量的平均数、中位数和众数;
在这一组数据中,2是出现次数最多的,故众数是2; 将这组数据从小到大的顺序排列,处于中间位置的那个数是2,那么由中位数的定义可知,这组数据的中位数是2;
(2) 选用平均数、中位数和众数中的哪个数作代表,更能反映黄金周 7 天游客量的一般情况?
选用中位数或众数作代表,更能反映黄金周7天游客量的一般情况.
7. 某商店销售5 种领口大小分别为 38,39,40,41,42 (单位:cm)的衬衫,一个月内的销量如下表:
你认为商店最感兴趣的是这组数据的平均数、中位数还是众数?为什么?
商店最感兴趣的是这组数据的众数,众数是这组数据中出现次数最多的,即销量最大的就是众数.所以商店最感兴趣的是这组数据的众数.
8. 在人才市场上招聘 A 种技工的单位有25 家提供的月薪平均为 1200 元:招聘 B种技工的单位有 30 家提供的月薪平均为 1500 元能由此认为用人单位给 B技工的月薪普遍高于 A 种技工吗?
不能认为用人单位给B种技工的月薪普遍高于A种技工, 理由:1200和1500分别代表的是月薪的平均水平,而不是全部水平,故不能认为用人单位给B种技工的月薪普遍高于A种技工.
9. 已知两个样本数据如下:
甲: 9.8, 9.9,10.3,10,10.1,10.4,9.7,9.8;乙:10.5,9.6,10.1,9.8,9.5, 10.2,10,10.3.
分别计算两个样本的方差,并比较哪一个样本数据较稳定.
∴ 甲样本数据较稳定.
10. 某校从甲、乙两名优秀选手中选 1名选手参加全市中学生田径百米比赛. 该校预先对这两名选手测试了8次,测试成绩如下表:
根据测试成绩,请你运用所学知识作出判断,派哪位选手参加比赛更好?为什么?
沪科版八年级下册18.1 勾股定理教课ppt课件: 这是一份沪科版八年级下册<a href="/sx/tb_c70391_t3/?tag_id=26" target="_blank">18.1 勾股定理教课ppt课件</a>,共46页。PPT课件主要包含了数学天地,习题181等内容,欢迎下载使用。
沪科版八年级下册20.2 数据的集中趋势与离散程度集体备课ppt课件: 这是一份沪科版八年级下册20.2 数据的集中趋势与离散程度集体备课ppt课件,共13页。PPT课件主要包含了议一议,中位数,想一想,试一试,练一练,作业各显其能等内容,欢迎下载使用。
数学沪科版20.2 数据的集中趋势与离散程度精品课件ppt: 这是一份数学沪科版20.2 数据的集中趋势与离散程度精品课件ppt