《用样本估计总体》学案1(二)
展开2.2用样本估计总体(二)
频率分布直线图和茎线图
问题提出:
列出一组样本数据的频率分布表可以分哪几个步骤进行?
第一步,求极差.
第二步,决定组距与组数.
第三步,确定分点,将数据分组.
第四步,统计频数,计算频率,制成表格.
频率分布直方图是在平面直角坐标系中画若干个依次相邻的小长方形,这些小长方形的宽、高和面积在数量上分别表示什么?
3. 我们可以用样本数据的频率分布表和频率分布直方图估计总体的频率分布,当总体中的个体数较多或较少时,统计中用什么方法提取样本数据的相关信息,我们将进一步作些探究.
频率分布折线图和茎叶图
探究1:频率分布折线图与总体密度曲线
思考1:在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?
思考2:在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图. 你认为频率分布折线图能大致反映样本数据的频率分布吗?
思考3:当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?
思考4:在上述背景下,相应的频率分布折线图越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.那么图中阴影部分的面积有何实际意义?
思考5:当总体中的个体数比较少或样本数据不密集时,是否存在总体密度曲线?为什么?
不存在,因为组距不能任意缩小
思考6:对于一个总体,能否通过样本数据准确地画出总体密度曲线?
探究1:茎叶图
频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.
【问题】 某赛季甲、乙两名篮球运动员每场 比赛的得分情况如下:
甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39;
乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.
思考1:你能理解这个图是如何记录这些数据的吗?你能通过该图说明哪个运动员的发挥更稳定吗?
思考2:在统计中,上图叫做茎叶图,它也是表示样本数据分布情况的一种方法,其中“茎”指的是哪些数,“叶”指的是哪些数?
思考3:对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图如何表示?
思考4:一般地,画出一组样本数据的茎叶图的步骤如何?
第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;
第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;
第三步,将各个数据的叶按大小次序写在茎右(左)侧.
思考5:用茎叶图表示数据的分布情况是一种好方法,你认为茎叶图有哪些优点?
(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.
思考6:比较茎叶图和频率分布表,茎叶图中“茎”和“叶”的数目分别与频率分布表中哪些数目相当?
思考7:对任意一组样本数据,是否都适合用茎叶图表示?为什么?
不适合样本容量很大或茎、叶不分明的样本数据.
例. 甲、乙两人数学成绩的茎叶图如下.
(1)求出这两名同学的数学成绩的平均数、中位数;
(2)比较两名同学的成绩,谈谈看法.
练习
1. 为了了解高一学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出了频率分布直方图.图中从左到右各小长方形的面积之比为2:4:17:15:9:3,第二小组的频数为12.
(1)第二小组的频率是多少?
(2)样本容量是多少?
(3)若次数在110以上(含110次)为达
标,试估计该校全体高一学生的达标率约
是多少?
2. 某班级共有学生54人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本.已知2号,28号,41号同学在样本中,那么样本中还有一个同学的学号是 .
3. 在抽取某产品的尺寸过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个体数在该组上的频率为m,该组上的直方图的高为h,则| a-b |等于
4. 在一个样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形和的 ,且样本容量为160,则中间一组的频数为 ( )
A. 32 B. 0.2 C. 40 D. 0.25
作业:《习案》作业十九