专题6.1 《数据的分析》全章复习与巩固(学案讲义)
展开专题6.1 《数据的分析》全章复习与巩固(知识讲解)
【学习目标】
1. 了解加权平均数的意义和求法,会求实际问题中一组数据的平均数,体会用样本平均数估计总体平均数的思想.
2. 了解中位数和众数的意义,掌握它们的求法.进一步理解平均数、中位数和众数所代表的不同的数据特征.
3. 了解极差和方差的意义和求法,体会它们刻画数据波动的不同特征.体会用样本方差估计总体方差的思想,掌握分析数据的思想和方法.
4. 从事收集、整理、描述和分析数据得出结论的统计活动,经历数据处理的基本过程,体验统计与生活的联系,感受统计在生活和生产中的作用,养成用数据说话的习惯和实事求是的科学态度.
【要点梳理】
要点一、算术平均数和加权平均数
一般地,对于个数,我们把叫做这个数的算术平均数,简称平均数,记作.计算公式为.
特别说明:平均数表示一组数据的“平均水平”,反映了一组数据的集中趋势.
(1)当一组数据较大时,并且这些数据都在某一常数附近上、下波动时,一般选用简化计算公式.其中为新数据的平均数,为取定的接近这组数据的平均数的较“整”的数.
(2)平均数的大小与一组数据里的每个数据均有关系,其中任一数据的变动都会相应引起平均数的变动.所以平均数容易受到个别特殊值的影响.
若个数的权分别是,则叫做这个数的加权平均数.
特别说明:(1)相同数据的个数叫做权,越大,表示的个数越多,“权”就越重. 数据的权能够反映数据的相对“重要程度”.
(2)加权平均数实际上是算术平均数的另一种表现形式,是平均数的简便运算.
要点二、中位数和众数
1.中位数的概念:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数称为这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数称为这组数据的中位数.
特别说明:(1)一组数据的中位数是唯一的;一组数据的中位数不一定出现在这组数据中.
(2)由一组数据的中位数可以知道中位数以上和以下数据各占一半.
2.众数的概念:一组数据中出现次数最多的数据称为这组数据的众数.
特别说明:(1)一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个;如果所有数据出现的次数都一样,那么这组数据就没有众数.
(2)众数是一组数据中出现次数最多的数据而不是数据出现的次数.
要点三、平均数、中位数与众数的联系与区别
联系:平均数、众数、中位数都是用来描述数据集中趋势的量,其中以平均数最为重要.
区别:平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据太高或太低,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列位置有关,个别数据的波动对中位数没影响;众数主要研究各数据出现的频数,当一组数据中不少数据多次重复出现时,可用众数来描述.
要点四、极差、方差和标准差
用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差称为极差,极差=最大值-最小值.
特别说明:极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大.一组数据极差越小,这组数据就越稳定.
方差是反映一组数据的整体波动大小的特征的量.方差的计算公式是:
特别说明:(1)方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小.
(2)一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变.
(3)一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
方差的算术平方根叫做这组数据的标准差,用符号表示,即:
;标准差的数量单位与原数据一致.
要点五、极差、方差和标准差的联系与区别
联系:极差与方差、标准差都是表示一组数据离散程度的特征数.
区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性也越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
要点六、用样本估计总体
在考察总体的平均水平或方差时,往往都是通过抽取样本,用样本的平均水平或方差近似估计得到总体的平均水平或方差.
特别说明:(1)如果总体数量太多,或者从总体中抽取个体的试验带有破坏性,都应该抽取样本.取样必须具有尽可能大的代表性.
(2)用样本估计总体时,样本容量越大,样本对总体的估计也越精确.样本容量的确定既要考虑问题本身的需要,又要考虑实现的可能性所付出的代价.
【典型例题】
类型一、利用概念求平均数、中位数、众数
1、为了提高农民收入,村干部带领村民自愿投资办起了一个养鸡场.办场时买来的1000只小鸡,经过一段时间精心饲养,可以出售了,下表是这些鸡出售时质量的统计数据.
质量/ | 1.0 | 1.2 | 1.5 | 1.8 | 2 |
频数 | 112 | 226 | 323 | 241 | 98 |
(1)出售时这些鸡的平均质量是多少(结果保留小数点后一位)?
(2)质量在哪个值的鸡最多?
(3)中间的质量是多少?
【答案】(1)出售时这些鸡的平均质量是;(2)质量在哪个值的鸡最多是;(3)中间的质量是.
【分析】(1)由平均数公式计算即可;(2)由统计表即得;(3)求中位数即可.
解:(1)出售时这些鸡的平均质量是:
(2)由表知,重量为的鸡的数量最多;
(3)把鸡的质量按从小到大排列,正中间的两只鸡的质量应该是第500、501个数,而112+226=338,112+226+323=661>500,因此正中间两只鸡的质量的平均数是1.5kg,从而中间的质量是.
【点拨】本题考查了求一组数据的平均数、众数及中位数,理解题意,抓住问题的实质是解题的关键.
举一反三:
【变式】一组数据:1,2,4,10,a,其中整数a是这组数据的中位数,则该组数据的平均数是____.
【答案】3.8或4或4.2
【分析】根据中位数的定义确定整数a的值,由平均数的定义即可得出答案.
解:∵1,2,4,10,a的中位数是整数a,
∴a=2或3或4,
当a=2时,这组数据的平均数为×(1+2+2+4+10)=3.8;
当a=3时,这组数据的平均数为×(1+2+3+4+10)=4,
当a=4时,这组数据的平均数为×(1+2+4+4+10)=4.2,
故答案为:3.8或4或4.2.
【点拨】本题主要考查了中位数和平均数,解题的关键是根据中位数的定义确定a的值.中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数);平均数等于这一组数的和除以它们的个数.
类型二、利用三数——平均数、众数、中位数解决问题
.圆圆同学前十次数学测试的成绩(单位:分)分别是90,95,95,100,100,100,105,105,105,105.
(1)圆圆下次测试的成绩需要超过多少分,才能使这十一次测试的平均分超过100分?
(2)点点同学对圆圆说:“不论你下次测试得多少分,这十一次测试成绩的中位数都是100.”点点的说法正确吗?说明理由.
【答案】(1)圆圆下次测试的成绩需要超过100分,才能使这十一次测试的平均分超过100分.(2)正确,理由见解析
【分析】
(1)设圆圆下次测试的成绩为x分,根据求平均数的公式,即可列出关于x的不等式,解出x即可.
(2)由中位数的定义“按顺序排列的一组数据中居于中间位置的数”解答即可.
解:(1)设圆圆下次测试的成绩为x分,
根据题意,得:,
解得:x>100,
所以圆圆下次测试的成绩需要超过100分,才能使这十一次测试的平均分超过100分.
(2)点点的说法正确,
若圆圆的分数小于100分或大于100分,此时最中间的数是100分,此时中位数是100;
若圆圆的分数等于100分,此时最中间的数是100分,此时中位数是100;
所以不论圆圆下次测试得多少分,这十一次测试成绩的中位数都是100.
【点拨】本题考查由平均数求未知数据,中位数的定义.掌握求平均数的公式,中位数的定义是解答本题的关键.
举一反三:
【变式】在一次中学生田径运动会上,参加男子跳高的15名运动员的成绩如下表所示.
成绩/m | 1.50 | 1.60 | 1.65 | 1.70 | 1.75 | 1.80 |
人数 | 2 | 3 | 2 | 3 | 4 | 1 |
分别计算这些运动员成绩的平均数、中位数、众数(结果保留小数点后两位).
【答案】这些运动员成绩的平均数、中位数、众数分别为1.67,1.70,1.75.
【分析】由平均数的计算公式即可算出平均数;把各运动员的成绩按从低到高排列,正中间的数是中位数;成绩人数最多的数便是众数
解:平均数为:
由成绩表知,正中间的数是1.70,故中位数为1.70
由于成绩为1.70米的学生人数最多,故众数这1.75
所以这些运动员成绩的平均数、中位数、众数分别为1.67,1.70,1.75.
【点拨】本题考查了求一组数据的平均数、中位数、众数,掌握它们的概念及计算方法是关键.
3、某商场统计了每个营业员在某月的销售额,绘制了如下统计图.
解答下列问题:
(1)设营业员的月销售额为x(单位:万元).商场规定:当时为不称职,当时为基本称职,当时为称职,当时为优秀.试求出不称职、基本称职、称职、优秀四个层次营业员人数所占百分比,并画出相应的扇形图.
(2)根据(1)中规定,所有称职和优秀的营业员月销售额的中位数、众数和平均数分别是多少?
(3)为了调动营业员的积极性,决定制定一个月销售额奖励标准,凡达到或超过这个标准的营业员将受到奖励.如果要使得称职和优秀的所有营业员的半数左右能获奖,奖励标准应定为多少元?并简述其理由.
【答案】(1)优秀10%,称职60%,基本称职23.3%,不称职6.7%;见解析;(2)中位数是22,众数是20,平均数是22.3;(3)22万元,见解析
【分析】
(1)先求出所有营业员的人数,再利用不称职、基本称职、称职、优秀四个层次营业员人数除以总人数乘以百分之百,即可求解;
(2)先求出所有称职和优秀的营业员的人数,再根据的中位数、众数和平均数的定义,即可求解;
(3)根据使得称职和优秀的所有营业员的半数左右能获奖,可得应该以这些员工的销售额的中位数为标准,即可求解.
解:(1)一共有营业员: (人),
优秀: ,
称职:,
基本称职:,
不称职:,
如图所示;
(2)所有称职和优秀的营业员的人数为: 人,则位于第11位的月销售额是22万元,所以中位数是22,
月销售额是20万元的有5人,最多,所以众数是20,
平均数是;
(3)奖励标准应定为22万元理由:要使称职和优秀的员工中有半数左右能获奖,应该以这些员工的销售额的中位数为标准.
【点拨】本题主要考查了条形统计图和扇形统计图,明确题意,准确从图形中获取信息是解题的关键.
举一反三:
【变式】某校九年级在“停课不停学”期间,为促进学生身体健康,布置了“云键身”任务,为了解学生完成情况,体育教师随机抽取一班与二班各10名学生进行网上视频跳绳测试,他的测试结果与分析过程如下:
(1)收集数据:两班学生每分钟跳绳个数分别记录如下(二班一个数据不小心被墨水遮盖):
一班:100 94 86 86 84 94 76 69 59 94
二班:99 96 ■ 82 96 79 65 96 55 96
(2)整理,描述数据:根据上面得到的两组数据,分别绘制了频数分布直方图如下:
(3)分析数据:两组样本数据的平均数、众数.中位数、方差如下表所示:
班级 | 平均数 | 众数 | 中位数 | 方差 |
一班 | ① | 94 | 86 | 147.76 |
二班 | 83.7 | 96 | ② | 215.21 |
根据以上数据填出表格中①,②两处的数据并补全二班的频数分布直方图;
(4)得出结论:根据以上信息,判断哪班完成情况较好?说明理由(至少从两个不同角度说明判断的合理性).
【答案】(3)84.2,89.补图见解析,(4)一班完成情况较好,理由见解析
【分析】
(3)根据平均数公式和中位数定义计算,求出二班各组人数,补全统计图即可;
(4)根据两班的平均数和方差进行判断即可.
解:(3)一班的平均数为(个);
二班墨水遮盖的数据为(个),
将二班的数据从小到大排列为:55,65,73,79,82,96,96,96,96,99 ,中间两个数据为82和96,中位数为(个);
二班第二组人数为1人,第三组人数为2人,补全统计图如图所示;
故答案为:84.2,89.
(4)一班完成情况较好;理由是一班的平均数高于二班的平均数,而且一班的方程小于二班的方差,可以得出,一班的完成情况略高于二班,而且比二班的成绩更整齐.
【点拨】本题考查了统计图表的应用和数据分析,解题关键是从统计图表中获取信息,准确应用这些信息进行计算和判断.
类型三、极差、方差与标准差
4、小西红柿又叫圣女果,既可以生吃,也可以作为美食原料,营养价值极高,因此深受大家欢迎.某水果商准备在甲、乙两个规模相当的小西红柿种植基地中选择一个进行长期合作,为了解这两个种植基地小西红柿的产量和产量的稳定性,从甲、乙两个种植基地中各随机选取一个大棚的小西红柿秧苗进行调查,过程如下,请补充完整.
收集数据:这两个大棚的小西红柿秧苗均为300株,各随机抽取25株,其收获期所产的小西红柿个数如下.
甲:27 35 46 55 48 36 47 68 82 48 57 66 75 27 36 57 57 66 58 61 71 38 47 46 71
乙:26 32 40 51 44 74 44 63 73 74 81 54 62 41 33 54 43 34 51 63 64 73 64 54 33
整理数据:按如表分组整理样本数据并补全表格.
个数(x) 株数 大棚 | 25≤x<35 | 35≤x<45 | 45≤x<55 | 55≤x<65 | 65≤x<75 | 75≤x<85 |
甲 | 2 | 4 | 6 | 6 | 5 | 2 |
乙 | 5 |
| 5 |
| 4 | 1 |
(说明:x<45为产量不合格,x≥45为产量合格,45≤x<65为产量良好,65≤x<85为产量优秀)
分析数据:两组样本数据的平均数、众数和方差如表,并补全表格.
大棚 | 平均数 | 众数 | 方差 |
甲 | 53 |
| 215.04 |
乙 |
| 54 | 236.24 |
得出结论:
(1)估计乙种植基地的一个大棚中收获期产量良好的秧苗为 株;
(2)该水果商应选择 种植基地进行长期合作,理由是 (至少从两个不同角度说明).
【答案】整理数据:5,5;分析数据:57,53;(1)120;(2)甲;甲种植基地的西红柿产量的众数较大,方差较小,比较稳定.
【分析】
根据频数分布表的分组统计相应的频数即可完成表格填写,再根据平均数、众数的意义求出平均数和众数即可;
(1)求出样本中“良好”所占得百分比,即可求出相应的“良好”的频数;
(2)从众数、方差的比较得出答案.
解:将乙生产基地抽样的25株西红柿,进行频数整理可得,在35<x<45,55<x<65的频数都是5,
故答案为:5,5;
甲生产基地抽样的25株西红柿中,产量为57个的出现次数最多,共出现3次,因此众数是57,
乙生产基地抽样的平均数为
(26+32+40+51+44+74+44+63+73+74+81+54+62+41+33+54+43+34+51+63+64+73+64+54+33)÷25=53(个),
故答案为:57,53;
(1)300×=120(棵),
故答案为:120;
(2)该水果商应选择甲种植基地进行长期合作,理由:甲种植基地的西红柿产量的众数较大,方差较小,比较稳定.
【点拨】本题主要考查数据的整理与分析,掌握平均数,众数和方差的求法及意义是关键.
举一反三:
【变式1】老师对甲和乙两位同学从数学运算、逻辑推理、直观想象和数据分析四个方面考核他们的数学素养,单项检测成绩(百分制)列表如下:
姓名 | 数学运算 | 逻辑推理 | 直观想象 | 数据分析 |
甲 | 86 | 85 | 80 | 85 |
乙 | 74 | 87 | 84 | 84 |
(1)分别对两个人的检测成绩进行数据计算,求a,b的值.
(2)你认为甲和乙谁的数学素养更好?结合数据,从两个角度进行分析.
(3)若将数学运算、逻辑推理、直观想象、数据分析四个检测成绩分别按权重,,,的比例计算最终考核得分,请分别计算甲和乙的最终得分.
姓名 | 平均分 | 中位数 | 众数 | 方差 |
甲 | 84 | 85 | 85 | a |
乙 | 83 | b | 87 | 28.5 |
【答案】(1)a=5.5,b=84;(2)见解析;(3)甲的最终成绩为83.6分,乙的最终成绩为84.2分
【分析】(1)根据方差和中位数的定义求解即可;(2)可从平均分、中位数、方差的意义求解即可;(3)根据加权平均数的定义列式计算即可.
解:(1)甲成绩的方差为:
乙成绩的中位数为,
故答案为:a=5.5,b=84;
(2)甲的数学素养更好,
从平均数看,甲的平均分高于乙,所以甲的数学素养更好;
从方差看,甲的方差小于乙,所以甲的成绩更加稳定;
(3)甲的最终成绩为:86×10%+85×40%+80×30%+85×20%=83.6(分),
乙的最终成绩为:74×10%+87×40%+84×30%+84×20%=84.2(分),
∴甲的最终成绩为83.6分,乙的最终成绩为84.2分.
【点拨】本题主要考查数据的整理和统计量的意义,解题的关键是掌握平均数、众数、中位数及方差的意义.
【变式2】在“学党史、知党恩、跟党走”知识竞赛活动中,某校八年级甲乙两个班各选出5名代表参加竞赛,满分10分,成绩如下:
甲班:8,8,7,8,9
乙班:5,10,8,10,7
已知:甲班成绩的平均数、众数和中位数都是8,方差是0.4.
根据以上信息,回答下列问题:
(1)乙班成绩的平均数是 ,众数是 ,中位数是 ;
(2)哪个班所选的代表成绩比较均衡?请通过计算说明.
(3)已知竞赛成绩满分者可以获得奖牌.如果想获得奖牌,且只能从一个班中选5名代表参加上一级竞赛,你认为选哪个班更合适?为什么?
【答案】(1)8,10,8;(2)甲班所选的代表成绩比较均衡,见解析;(3)乙,理由见解析
【分析】
(1)根据平均数、众数和中位数的定义即可求解;
(2)先计算出乙班的方差,根据两个班的方差,利用方差的意义即可得出答案;
(3)比较哪个班成绩满分者多即可解答.
解:(1)乙班成绩的平均数是:,
10出现了2次,出现的次数最多,
乙班的众数是10;
把乙班的成绩从小到大排列,5,7,8,10,10则中位数是,
故答案为:8,10,8;
(2)乙班的成绩的方差是:
甲班的方差小于乙班的方差,
甲班所选的代表成绩比较均衡;
(3)选乙班更合适
因为:竞赛成绩满分者可以获得奖牌,甲班5名代表的成绩中没有满分的,乙班5名代表的成绩中有两个满分的,
如果想获得奖牌,且只能从一个班中选5名代表参加上一级竞赛,选乙班更合适.
【点拨】本题考查方差的计算以及根据方差判断稳定性、中位数、众数,掌握以上知识是解题的关键.