上教版 (2020)2 估计总体的数字特征公开课ppt课件
展开当我们获得一组样本数据时 , 通常很难一眼看出其中的规律 , 而用图表则可以使得数据变得更为直观 . 此外 , 我们还可以利用样本数据进行适当的计算来得到一些新的数量 , 并用这些新的数量来代表整个样本数据的某些特征
我们把能反映一组数据某种特征的量称为这组数据的 数字特征 . 我们在初中阶段学习过的平均数 、 中位数和众数等 , 就是用来刻画一组数据集中趋势的数字特征 , 而方差和标准差则是用来刻画一组数据离散程度的数字特征
本节中我们讨论了用样本的频率分布来估计总体的分布 . 同样地 , 我们还可用样本的数字特征来估计总体的数字特征
2. 1 通过样本估计总体的集中趋势
利用初中阶段学习过的平均数 、 中位数和众数 , 我们可以描述有限样本的集中趋势 . 例如 , 设样本数据为 x 1 、 x 2 、…、 xn ,由公式
就得到样本平均数 , 它描述了样本数据的平均水平 . 如果 n 个数据中不同的数据 x1 、 x 2 、…、 xn的频数分别为 f1 、 f 2 、…、fk , 那么样本平均数为
当数据量大且重复率高时 , 后一个公式可减少计算量
某公司实行薪资保密制度 , 员工只知道自己的工作所得 , 而不知道其他员工的薪资 . 现要了解该公司员工的平均年薪 、 中等年薪以及赚取人数最多的那种年薪 . 在公司员工的花名册中随机抽取 15 名员工 , 调查得到这 15 名员工的年薪 ( 单位 : 万元 )如下 :
公司全体员工的平均年薪可用样本的平均数来估计 , 员工的中等年薪可用样本的中位数来估计 , 而赚取人数最多的那种年薪可用样本的众数来估计
把所有年薪从低到高排序 , 中间第 8 个数 8. 2 即是样本中位数 .8. 1 出现了 3 次 , 次数最多 , 即样本的众数为 8. 1
于是 , 我们估计该公司员工的平均年薪可能为 8. 7 万元 , 中等年薪可能为 8. 2 万元 , 赚取 8. 1 万元年薪的可能性最大 . 当然 ,这样的估计是否合理 , 还取决于样本的容量与代表性
例2. 为了解某体校学生跑步的情况 , 观察随机抽取的20 名学生一周内跑步的累计数 ( 单位 : km ), 在各区间内的频数记录如表 13-6 所示 .
试估计一周内该校学生平均跑步累计数 .
解 先求出各区间的中点值 : 8 、 13 、 18 、 23 、 28 、 33 、 38.则一周内这 20 名学生跑步累计的平均数为
由于这 20 名学生是随机抽取的 , 因此可以估计一周内该校学生平均跑步累计约 24. 5km.
2. 2 通过样本估计总体的离散程度
现在我们介绍如何用数量来描述数据的另外一种统计特征 ——— 样本数据的离散程度 .
在一次男子 10 米气手枪射击比赛中 , 甲运动员的成绩 ( 单位 :环 ) 为 7. 5 、 7. 8 、… 、 10. 9 ; 乙运动员的成绩为 8. 4 、 8. 5 、… 、10. 7 , 如图 13-5-3 所示 .
射击队想从两位选手中选取一名外出参加比赛 , 经过计算可知 , 两位选手 20 次射击的平均环数都是 9. 6 , 但从图 13-5-3 中看 , 甲的成绩比较分散 , 乙的成绩则相对稳定在高环数段 . 但看上去 “ 比较分散 ” 和 “ 相对稳定 ” 只是一种直观的描述 , 我们需要用一些具有统计意义的数量来刻画数据的波动情况
设样本数据为 x1 、 x2 、…、 xn , 我们知道 表示的是样本平均数 . 在 13. 4 节中我们已学习过极差 , 它反映了样本数据变化的最大幅度 , 是样本数据离散程度的一种刻画方式 . 极差对极端数据很敏感 , 也就是说它是不稳定的 .此外 , 在初中阶段我们已学习过用样本数据的方差
来衡量一组数据的波动大小 . 一组数据的方差越大 , 表明这组数据波动越大 .我们把方差的算术平方根
叫做样本数据的 标准差 ( standarddeviation ), 它同样是一个用来衡量样本数据波动大小的统计量
方差和标准差都反映了一组数据围绕平均数波动的大小 , 方差的单位是观测数据的单位的平方 , 而标准差的单位与观测数据的单位一致 , 因此我们常常用标准差来描述数据的离散程度
我们可以得出上述例子中甲 、 乙两名运动员的射击成绩的标准差 :
由于 S甲 > S乙 , 说明甲的成绩确实较乙的成绩更为离散 , 即乙的成绩较为稳定 , 与从茎叶图上观察到的结论一致 , 射击队应选拔乙参加比赛
例3. 在 13. 4 节中 , A 校抽取了 66 名高一年级学生 , 测量他们的身高数据 , 如表 132 所示 . 根据这些数据来比较该校高一年级男生和女生身高 . ( 结果精确到 0. 1cm)
解 根据表 13-2 中的数据 , 可以计算出男生和女生身高样本均值和样本标准差分别为
即这 66 名学生中 , 男生身高的平均值大于女生 , 且男生身高的离散程度也高于女生 . 据此可知 , 该校高一学生中 , 男生的平均身高大于女生 , 且男生身高的分布也较为分散 .
根据表 13-2 我们还可以计算出这 66 名学生身高的平均值和标准差 :
并且样本数据在[ 167. 4-7. 7 , 167. 4+7. 7 ] 中的有 43 个 , 样本数据在 [ 167. 4-2×7. 7 ,167. 4+2×7. 7 ] 中的有 65 个 , 在此区间外的只有 1 个 , 也就是说 ,区间 包含了大部分的数据
例4.某果园种植了 120 棵苹果树 , 为调查苹果产量 , 从中随机抽取了 10 棵苹果树 , 测得其产量 ( 单位 :kg) 分别为 24 、25 、 28 、 32 、 20 、 26 、 33 、 26 、 27 、 30. 试预估该果园的苹果产量
解 容易算得这 10 棵苹果树的平均产量为 27. 1kg , 由于这10 棵苹果树是随机抽取的 , 我们可以预估该果园的苹果产量约为120×27. 1=3252 (kg)
信息技术 : 计算样本数据的数字特征
当样本量很大时 , 纸笔计算样本的数字特征非常麻烦 , 而计算机或计算器可以帮助我们方便地得到数据的数字特征 . 下面 ,作为一个示例 , 我们介绍利用电子表格办公软件计算平均数的操作步骤 :( 1 ) 在空白表格中输入要处理的数据 , 单击某空白单元格 .( 2 ) 单击公式菜单中的 “ 插入函数 ”, 选择统计类别中的“ AVERAGE ”; 单元格中则会出现 “ =AVERAGE ( )”; 也可以直接在单元格中输入 “ =AVERAGE ( )” .( 3 ) 将光标放在括号内 , 然后选择这组数据 , 点击回车 , 平均数就计算出来了 , 如图 13-5-4 所示
类似地 , 我们可以用电子表格办公软件或计算器计算一组数据的方差 、 标准差等其他数字特征 .
1. 下列说法中有哪些是错误的?A. 一组数据中比中位数大的数和比中位数小的数一样多 ;B. 极差 、 方差 、 标准差都是描述一组数据的离散程度的统计量 ;C. 平均数 、 众数和中位数都是描述一组数据的集中趋势的统计量 ;D. 总体的数据都分布在样本的极差范围内 .
2. 掷一颗骰子 10 次 , 记录出现偶数点的比例 . 这样的试验共做了 100 次 , 所得数据如下表所示
( 1 ) 绘制频率分布条形图 ;( 2 ) 求偶数出现比例的平均值和标准差
3. 某果园种植了两个品种的苹果 , 现从两个品种中各随机抽取 10 个 , 测得它们的质量 ( 单位 : g ) 分别为 :
问 : 哪个品种的苹果质量更均匀?
1、下列说法错误的是( )A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.众数是一组数据中出现次数最多的数
【答案】B;【解析】平均数不大于最大值,不小于最小值;故B错;
2、下列说法正确的是( )A.在两组数据中,平均数较大的一组方差较大B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小C.方差的求法是求出各个数据与平均数的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高
【答案】B;【解析】A中平均数和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.
3、样本容量为100的频率直方图如图所示,根据样本频率直方图,得平均数为________.
4、已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
5、(1)某班45名同学的年龄(单位:岁)如下:14 15 14 16 15 17 16 15 16 16 15 1517 13 14 15 16 16 15 14 15 15 14 1516 17 16 15 15 15 16 15 13 16 15 1517 14 15 16 16 15 14 15 15求全班的平均年龄;(2)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如图所示的频率直方图.
试利用频率直方图估计高三年级学生的平均成绩.
(2)由频率直方图分布表与频率直方图,求样本平均数:是频率直方图的“重心”,即所有数据的平均数,取每个小矩形底边的中点值乘以每个小矩形的面积再求和即可.故平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.024×10)+95×(0.016×10)=76.2(分).
高中数学人教版新课标A必修32.2.2用样本的数字特征估计总体背景图课件ppt: 这是一份高中数学人教版新课标A必修32.2.2用样本的数字特征估计总体背景图课件ppt,共32页。PPT课件主要包含了学点一,学点二,学点三,总体平均数,样本平均数,第n个样本数据,样本容量,很接近,返回目录等内容,欢迎下载使用。
高中数学2.2.2用样本的数字特征估计总体集体备课ppt课件: 这是一份高中数学2.2.2用样本的数字特征估计总体集体备课ppt课件,共16页。PPT课件主要包含了标准差等内容,欢迎下载使用。
数学必修32.2.2用样本的数字特征估计总体备课ppt课件: 这是一份数学必修32.2.2用样本的数字特征估计总体备课ppt课件,共15页。PPT课件主要包含了标准差等内容,欢迎下载使用。