《高考总复习》数学 第九章 第5讲 用样本估计总体[配套课件]
展开
这是一份《高考总复习》数学 第九章 第5讲 用样本估计总体[配套课件],共56页。PPT课件主要包含了用样本估计总体,频率组距,3茎叶图,据的众数,最中间,平均数,题组一,走出误区,列说法中正确的是,答案ABC等内容,欢迎下载使用。
通常我们对总体作出的估计一般分成两种:(1)用样本的频率分布估计总体的分布;(2)用样本的数字特征估计总体的数字特征.
2.统计图(1)频率分布直方图从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.具体做法如下:①求极差:即一组数据的最大值与最小值的差.②决定组距和组数:当样本容量不超过 100 时,常分成5~
12 组,组距=__________.
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组.
④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干个小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映各个数据在每组所占比例的大小.⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的
,这样得到一系列的长方形,每个长方形的面积恰好是该
组的频率.这些矩形就构成了频率分布直方图,各个长方形的面
积总和等于_________.
(2)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各长方形上端
的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,在统计中称之为总体密度曲线.
当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录信息,给数据的记录和表示都带来方便.
3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数①众数:在一组数据中,出现次数最多的数据叫做这组数
②中位数:将一组数据按大小依次排列,把处在________位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
__________).
②标准差是反映总体波动大小的数字特征,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差接近总体方差.
1.(多选题)乐乐家共有七人,已知今年这七人年龄的众数为35,平均数为 44,中位数为 55,标准差为 19,则 5 年后,下
A.这七人岁数的众数变为 40B.这七人岁数的平均数变为 49C.这七人岁数的中位数变为 60D.这七人岁数的标准差变为 24
解析:根据众数、平均数、中位数的概念得 5 年后,每人的年龄相应增加 5,而标准差不变,所以这七人年龄的众数变为 40;平均数变为 49;中位数变为 60;标准差不变,为 19.故选 ABC.
2.(必修3P81A组第1题改编)已知某班级部分同学一次测验
的成绩统计如图 9-5-1,则其中位数和众数分别为(图 9-5-1
解析:由茎叶图可知,此组数据由小到大排列依次是76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114 ,共 17 个,故92 为中位数,出现次数最多的为众数,故众数为 86,故选 B.
3.(2020 年江苏)已知一组数据 4,2a,3-a,5,6 的平均数为 4,则 a 的值是________.解析:∵数据 4,2a,3-a,5,6 的平均数为 4.∴4+2a+3-a+5+6=20,即 a=2.答案:2
4.(2020年全国Ⅲ)设一组样本数据x1,x2,…,xn的方差为
0.01,则数据10x1,10x2,…,10xn的方差为( )
解析:因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据方差为102×0.01=1,故选 C.答案:C
样本的数字特征 自主练习
1.(2017 年全国Ⅰ)为评估一种农作物的种植效果,选了 n块地作试验田.这 n 块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
解析:刻画评估这种农作物亩产量稳定程度的指标是标准
2.(2018 年全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图 9-5-2 所示的饼图:图 9-5-2
则下面结论中不正确的是(
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了
解析:新农村建设前,种植收入占 60%;新农村建设后,农村的经济收入增加了一倍,实现翻番,种植收入占 37%.实际种植收入增加,A 结论不正确,故选 A.
解析:对于 A 选项,该组数据的平均数为(1+4)×0.1+
(2+3)×0.4=2.5,
方差为(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;对于B选项,该组数据的平均数为(1+4)×0.4+(2+3)×0.1=2.5,方差为(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;
对于C选项,该组数据的平均数为(1+4)×0.2+(2+3)×0.3=2.5,方差为(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;对于D选项,该组数据的平均数为(1+4)×0.3+(2+3)×0.2=2.5,方差为(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.因此,B选项这一组的标准差最大.故选B.
4.(2020 年新高考Ⅱ)(多选题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,如图 9-5-3 是某地连续 11 天复工
复产指数折线图,下列说法正确的是(
图 9-5-3A.这 11 天复工指数和复产指数均逐日增加B.这 11 天期间,复产指数增量大于复工指数的增量C.第 3 天至第 11 天复工复产指数均超过 80%D.第 9 天至第 11 天复产指数增量大于复工指数的增量
解析:由题图可知,第 1 天到第 2 天复工指数减少,第 7天到第 8 天复工指数减少,第 10 天到第 11 天复工指数减少,第 7 天到第 9 天复产指数减少,故 A 错误;
第 1 天的复产指数与复工指数的差大于第 11 天的复产指数与复工指数的差,所以这 11 天期间,复产指数增量小于复工指数的增量,故 B 错误;
第 3 天至第 11 天复工复产指数均超过 80%,故 C 正确;第 9 天至第 11 天复产指数增量大于复工指数的增量,故 D
【题后反思】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.
茎叶图的应用 师生互动
[例 1](1)(2017 年山东)如图 9-5-4 所示的茎叶图记录了甲、乙两组各 5 名工人某日的产量数据(单位:件).若这两组数据的
中位数相等,且平均值也相等,则 x 和 y 的值分别为(图 9-5-4
解析:甲组中位数为 65,所以乙组中位数也为 65,故 y=5,乙组平均数为 66,所以 56+62+65+74+70+x=66×5,x=3.故选 A.
(2)某 APP 报告显示,除夕至初五,该 APP 红包收发总量达到 460 亿个,同比去年增长 43.3%.据统计,春节期间,甲、乙两个抢红包群抢红包的金额(单位:元)的茎叶图如图 9-5-5,其中甲群抢得红包金额的平均数是 88 元,乙群抢得红包金额的中位数是 89 元,则 m,n 的等差中项为________.
解析:甲群抢得红包金额的平均数是 88 元,
78+86+84+88+95+(90+m)+927
乙群抢得红包金额的中位数是 89 元,所以 n=9.
则 m,n 的等差中项为
【题后反思】当两组数据表示在一个茎叶图中时,往往可不通过计算便能迅速得出相应的统计结论,从而提升解题效率.此时可从数据分布的对称性及数据主要集中在哪个茎上两个方面来进行.一般地,若数据大致对称,数据的集中趋势较强,则数据的稳定情况较好,即方差或标准差较小;若数据更多地集中在茎中较大的几个数所在的行,则往往平均数也较大.
【考法全练】1.(多选题)某特长班有男生和女生各 10 人,统计他们的身高,其数据(单位:cm)如下面的茎叶图 9-5-6 所示,则下列结论
B.女生身高的极差为 12D.男生身高的方差较小
A.女生身高的中位数为 165C.男生身高的均值较大答案:BC
2.(2019 年广西南宁模拟)如图 9-5-7 是甲、乙两人在 10 天中每天加工零件个数的茎叶图,若这 10 天甲加工零件个数的极差为 a,乙加工零件个数的平均数为 b,则 a+b=________.
解析:由茎叶图,知甲加工零件个数的极差 a=35-18=
3+17+11+2)=23,则 a+b=40.
考点 3 频率分布直方图的绘制及其应用
[例 2](1)(2020 年天津)从一批零件中抽取 80 个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5,35),…,[5.45,5.47),[5.47,5.49],并整理得到如图 9-5-8 所示频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
解析:根据直方图,直径落在区间[5.43,5.47)之间的零件频
率为(6.25+5.00)×0.02=0.225,
则区间[5.43,5.47)内零件的个数为 80×0.225=18.故选 B.
(2)(2019 年全国Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图 9-5-9 所示的直方图:
记 C 为事件:“乙离子残留在体内的百分比不低于 5.5”,
根据直方图得到 P(C)的估计值为 0.70.
①求乙离子残留百分比直方图中 a,b 的值;
②分别估计甲、乙离子残留百分比的平均值(同一组中的数
据用该组区间的中点值代表).
解:①由题意得 a+0.20+0.15=0.70,解得 a=0.35.由 0.05+b+0.15=1-P(C)=1-0.70,解得 b=0.10.
②由甲离子的直方图可得,甲离子残留百分比的平均值为0.15×2+0.20×3+0.30×4+0.20×5+0.10×6+0.05×7=4.05.乙离子残留百分比的平均值为 0.05×3+0.10×4+0.15×5+0.35×6+0.20×7+0.15×8=6.
【题后反思】用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:
②频率分布直方图中各长方形高的比也就是其频率之比;③直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于 1,即频率之和为 1.
1.(2016 年宁夏固原模拟)某小区共有 1000 户居民,现对他们的用电情况进行调查,得到频率分布直方图如图 9-5-10,则该小区居民用电量的中位数为________,平均数为________.
2.为了解某校九年级 1600 名学生的体能情况,随机抽查了部分学生,测试 1 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图 9-5-11 所示的频率分布直方图,根据统计图的数据,
A.该校九年级学生 1 分钟仰卧起坐的次数的中位数为 26.25B.该校九年级学生 1 分钟仰卧起坐的次数的众数为 27.5C.该校九年级学生 1 分钟仰卧起坐的次数超过 30 的人数约
D.该校九年级学生 1 分钟仰卧起坐的次数少于 20 的人数约
解析:由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是 26.25;众数是最高矩形的中间值27.5;1 分钟仰卧起坐的次数超过 30 的频率为 0.2,所以估计 1分钟仰卧起坐的次数超过 30 的人数约为 320;1 分钟仰卧起坐的次数少于 20 的频率为 0.1,所以估计 1 分钟仰卧起坐的次数少于 20 的人数约为 160.故 D 错误.
⊙函数思想在统计中的应用
在高考中常以频率分布直方图或茎叶图的形式出现,考查
统计与概率的知识,这也是近几年高考出题的热点.
[例 3](2016 年全国Ⅰ)某公司计划购买 1 台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200 元.在机器使用期间,如果备件不足再购买,则每个 500 元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了 100 台这种机器在三年使用期内更换的易损零件数,得到柱状图 9-5-12:
记 x 表示 1 台机器在三年使用期内需更换的易损零件数,y表示 1 台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.
(1)若 n=19,求 y 与 x 的函数解析式;
(2)若要求“需更换的易损零件数不大于 n”的频率不小于
0.5,求 n 的最小值;
(3)假设这 100 台机器在购机的同时每台都购买 19 个易损零件,或每台都购买 20 个易损零件,分别计算这 100 台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1 台机器的同时应购买 19 个还是 20 个易损零件?
解:(1)当 x≤19 时,y=3800;当 x>19 时,y=3800+500(x-19)=500x-5700.所以 y 与 x 的函数解析式为
(2)由柱状图知,需更换的零件数不大于 18 的频率为 0.46,不大于 19 的频率为 0.7,故 n 的最小值为 19.(3)若每台机器在购机同时都购买 19 个易损零件,则这 100台机器中有 70 台在购买易损零件上的费用为 3800,20 台的费用为 4300,10 台的费用为 4800,因此这 100 台机器在购买易损零件上所需费用的平均数为
×(3800×70+4300×20+4800×10)=4000.
若每台机器在购机同时都购买 20 个易损零件,则这 100 台机器中有 90 台在购买易损零件上的费用为 4000,10 台的费用为4500,因此这 100 台机器在购买易损零件上所需费用的平均数为
×(4000×90+4500×10)=4050.
比较两个平均数可知,购买 1 台机器的同时应购买 19 个易损零件.
【策略指导】本题把统计与函数结合在一起进行考查,有综合性但难度不大,求解关键是读懂题意,所以提醒考生要重视数学中的阅读理解问题.
某市为了解各校《国学》课程的教学效果,组织全市各学校高二年级全体学生参加了国学知识水平测试,测试成绩从高到低依次分为 A,B,C,D 四个等级.随机调阅了甲、乙两所学校各 60 名学生的成绩,得到如图 9-5-13 所示的分布图.
(1)试确定图中 a 与 b 的值;
(2)若将等级 A,B,C,D 依次按照 90 分,80 分,60 分,50 分转换成分数,试分别估计两校学生国学成绩的均值;
(3)从两校获得等级 A 的同学中按比例抽取 5 人参加集训,集训后由于成绩相当,决定从中随机选 2 人代表本市参加省级比赛,求两人来自同一学校的概率.
解:(1)a=15 ,b=0.5.
(2)由数据可得甲校的平均值为
(3)由样本数据可知集训的 5 人中甲校抽 2 人,分别记作 E,
F;乙校抽 3 人,分别记作 M,N,Q.
从 5 人中任选 2 人一共有 10 个基本事件:
EF,EM,EN,EQ,FM,FN,FQ,MN,MQ,NQ;其中 2 人来自同一学校包含 EF,MN,MQ,NQ,所以所求事件的概率 P=0.4.
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
相关课件
这是一份《高考总复习》数学 第九章 第11讲 条件概率与正态分布[配套课件],共51页。PPT课件主要包含了正态分布,分布越集中,x=μ,PABPA,为事件,题组一,走出误区,图9-11-1,答案AD,题组二等内容,欢迎下载使用。
这是一份《高考总复习》数学 第九章 第8讲 二项式定理[配套课件],共40页。
这是一份《高考总复习》数学 第九章 第7讲 计数原理与排列组合[配套课件],共49页。PPT课件主要包含了m1·m2··mn,排列与排列数,组合与组合数,题组一,走出误区,法是各不相同的,答案BCD,题组二,走进教材,选法共有等内容,欢迎下载使用。