![2.2 用样本估计总体课件PPT01](http://img-preview.51jiaoxi.com/3/3/12973784/0/0.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT02](http://img-preview.51jiaoxi.com/3/3/12973784/0/1.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT03](http://img-preview.51jiaoxi.com/3/3/12973784/0/2.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT04](http://img-preview.51jiaoxi.com/3/3/12973784/0/3.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT05](http://img-preview.51jiaoxi.com/3/3/12973784/0/4.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT06](http://img-preview.51jiaoxi.com/3/3/12973784/0/5.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT07](http://img-preview.51jiaoxi.com/3/3/12973784/0/6.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![2.2 用样本估计总体课件PPT08](http://img-preview.51jiaoxi.com/3/3/12973784/0/7.jpg?x-oss-process=image/resize,w_794/sharpen,100)
2020-2021学年9.2 用样本估计总体授课课件ppt
展开1.什么是总体?什么是样本?
随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即用样本估计总体,是我们需要进一步学习的内容.
简单随机抽样、系统抽样、分层抽样.
2.随机抽样有哪几种基本的抽样方法?
3.什么是统计?统计的思想方法是什么?
用样本估计总体常用方法有:
1.图形分析法 如 频率分布直方图,折线图,条形图,茎叶图,扇形图等.2.数字分析法 通过样本分析平均值、方差等数字特征
我国是世界上严重缺水的国家之一, 城市缺水问题较为突出。
2000年全国主要城市中缺水情况排在前10位的城市
某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即要确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.有关部门通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t),你认为用水量a确定为多少比较合理?
如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.为了确定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况
思考:由上表,大家可以得到什么信息?
通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:
观察1 上述100个数据中的最大值和最小值分别是什么?说明样本数据的变化范围是什么?由此能对总体做什么样的估计?
观察2 我们把样本数据中的最大值和最小值的差称为极差. 上面的样本极差是多大?
4.3-0.2=4.1
1:根据极差和组距把样本中的数据进行分组,如 取组距为0.5 ,
(4.3-0.2)÷0.5=8.2
2.确定各组数据分布的区间
[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
3:统计上述100个数据在各组中分布的频数,并计算样本数据在各组中出现的频率,列出样本的频率分布表
1.观察表格你能对总体的那些特征进行估计?
2.频率分布表有什么性质?
上表称为样本数据的频率分布表,由此可以推测该市全体居民月均用水量分布的大致情况是:用水量分布最多的区间为[2,2.5],绝大多数分布在区间[1,3]. 这样就给市政府确定居民月用水量标准提供参考依据,这种方法体现的统计思想是什么?
用样本的频率分布估计总体分布.
思考:如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
注意:1.对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.所以要根据样本数据分布的稠密程度选择合适的组距进行分组。
3.各组中要包含样本的最大值与最小值
一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.(极差=样本数据中最大值与最小值的差)
第二步,决定组距与组数k.(k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)
第三步,确定分组区间,将数据分组.
第四步,统计频数,计算频率,制成表格. (频数=样本数据落在各小组内的个数, 频率=频数÷样本容量)
(二):频率分布直方图
为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示,这个图叫做频率分布直方图。
在频率分布直方图中,横轴表示月均用水量,纵轴表示频率/组距.
注意:直方图中小长方形的高表示的不是该区间上数据出现的频率!
思考:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?
各小长方形的面积=频率
各小长方形的面积之和=1
思考:频率分布直方图的优点缺点是什么?优点是能够非常直观明了地反映样本数据的分布情况,缺点是原始数据不能在图中表示出来.
你能根据频率分布直方图估计居民月均用水量的一些数据特点吗?
(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(说明样本的数据非常集中)
(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;
(3)居民月均用水量的分布有一定的对称性等.
样本数据的频率分布直方图是根据频率分布表画出来的,一般地,频率分布直方图的作图步骤如下
第一步,画平面直角坐标系.
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.
第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形.
练习 某地区为了了解知识分子的年龄结构,随机抽样50名,其年龄分别如下: 42,38,29,36,41,43,54,43,34,44, 40,59,39,42,44,50,37,44,45,29, 48,45,53,48,37,28,46,50,37,44, 42,39,51,52,62,47,59,46,45,67, 53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表; (2)画出频率分布直方图;(3)估计年龄在32~52岁的知识分子所占的比例约是多少.
(1)极差为67-28=39,取组距为5,分为8组.
分 组 频数 频率 [27,32) 3 0.06 [32,37) 3 0.06 [37,42) 9 0.18 [42,47) 16 0.32 [47,52) 7 0.14 [52,57) 5 0.10 [57,62) 4 0.08 [62,67) 3 0.06 合 计 50 1.00
(2)样本频率分布直方图:
(3)因为0.06+0.18+0.32+0.14=0.7, 故年龄在32~52岁的知识分子约占70%.
通过本节课学习你有什么收获?
1.频率分布是指一个样本数据在各个小范围内所占比例的大小,总体分布是指总体取值的频率分布规律.我们通常用样本的频率分布表或频率分布直方图去估计总体的分布.
2.频率分布表和频率分布直方图,是对相同数据的两种不同表达方式.用紧凑的表格改变数据的排列方式和构成形式,可展示数据的分布情况.通过作图既可以从数据中提取信息,又可以利用图形传递信息.
3.样本数据的频率分布表和频率分布直方图,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚的看到整个样本数据的频率分布情况,并由此估计总体的分布情况.
作业:P71练习:1.(1). 东方思维
2.2 用样本估计总体
2.2.1用样本的频率分布估计总体分布
1.列出一组样本数据的频率分布表可以分哪几个步骤进行?
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成 表格.
2.频率分布直方图是在平面直角坐标系中画若干个依次相邻的小长方形,这些小长方形的宽、高和面积在数量上分别表示什么?
3.我们可以用样本数据的频率分布表和频率分布直方图估计总体的频率分布,当总体中的个体数较多或较少时,统计中用什么方法提取样本数据的相关信息,我们将进一步作些探究.
组距、频率除以组距、频率.
频率分布折线图和茎叶图
探究1:频率分布折线图与总体密度曲线
思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 你认为频率分布折线图能大致反映样本数据的频率分布吗?
思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?
思考4:在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影部分的面积有何实际意义?
总体在区间(a,b)内取值的百分比.
思考5:当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
不存在,因为组距不能任意缩小.
思考6:对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?能否通过样本数据准确地画出总体密度曲线?
频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.
【问题】 某赛季甲、乙两名篮球运动员每场比赛的得分情况如下: 甲运动员得分:13,51,23,8,26,38,16,33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
助教在比赛中将这些数据记录为如下形式:
思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
思考4:一般地,画出一组样本数据的茎叶图的步骤如何?
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.
思考6:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?
思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本数据.
(2)频率分布直方图:
(3)(0.02+0.08+0.09)×500=95(人)
例2 为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图.图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12.(1)第二小组的频率是多少?(2)样本容量是多少?(3)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率约是多少?
1.用样本的频率分布估计总体分布,当总体中的个体数取值很少时,可用茎叶图估计总体分布;当总体中的个体数取值较多时,可将样本数据适当分组,用频率分布表或频率分布直方图估计总体分布.
2.总体密度曲线可看成是函数的图象,对一些特殊的密度曲线,其函数解析式是可求的.
3.茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.
高中第五章 统计与概率5.1 统计5.1.4 用样本估计总体图文课件ppt: 这是一份高中第五章 统计与概率5.1 统计5.1.4 用样本估计总体图文课件ppt,共55页。PPT课件主要包含了有误差,数字特征,越来越大等内容,欢迎下载使用。
数学必修 第一册第6章 统计学初步6.4 用样本估计总体一等奖课件ppt: 这是一份数学必修 第一册第6章 统计学初步6.4 用样本估计总体一等奖课件ppt,共41页。PPT课件主要包含了即时巩固,归纳总结,标准差,百分位数,反思感悟,求百分位数等内容,欢迎下载使用。
数学必修32.2.2用样本的数字特征估计总体备课课件ppt: 这是一份数学必修32.2.2用样本的数字特征估计总体备课课件ppt,共13页。PPT课件主要包含了用样本估计总体等内容,欢迎下载使用。