必修第二册第五章统计与概率5.2 数学探究活动:由编号样本估计总数及其模拟教案及反思

展开

这是一份必修第二册第五章统计与概率5.2 数学探究活动:由编号样本估计总数及其模拟教案及反思，共4页。

课题
由样本估计总数及其模拟
教科书
书名：普通高中教科书数学必修第二册
出版社：人民教育出版社出版日期：2019 年8月
教学目标
教学目标：通过数学探究活动，让学生经历数据收集、数据整理、数据分析以及统计推断的完整过程.
教学重点：三种利用编号样本估计总数的方法.
教学难点：比较哪种估计方法产生的误差较小.
教学过程
时间
教学环节
主要师生活动
1分钟
提出研究问题
教师介绍本次数学探究活动的研究背景.并提出本次活动的研究问题.
日常生活中,为了方便管理,人们经常会对人或物进行编号有时需要进行连续编号（即编号为001,002,003,……）.知道连续编号的最大值就能方便知道总数是多少.在很多情况下,得到最大的编号并不容易,但可以得到一些编号的样本.此时,能不能根据编号样本的信息,利用有关统计的知识,估计出人和物的总数呢？
4分钟
收集数据
整理数据
某小组的同学为了调查小黄车的总量,收集了一些小黄车的编号.
每辆小黄车都有唯一的二维码和编号与之对应（如图所示）,假设编号的前四位是分类编号,后六位是连续编号,小黄车的停放位置是随机的. 他们收集的样本数据，按照后六位从小到大的顺序排列如下：
8641154586 8650202964 8641216344 8641223043
8641228556 8653289157 8653295913 8650314817
8650399914 8650402206 8650405355 8650407701
8650413222 8641423105 8641425647 8641433522
8650545469 8650585197 8650695935 8650699600
8650735402 8641776103 8651798187 8651798971
8651810807 8651813331 8641815866 8651823585
8651828537 8651838735 8651841183 8651843709
8651846927 8651848451 8651848586
利用已有的样本数据,如何估计小黄车的总量呢？
甲同学提出:
可以用样本数据的最大值来估计小黄车的总量,
因为样本数据的最大值小于等于小黄车的总量.
乙同学认为,样本数据中恰好取到连续编号的最大值的概率很小,而样本的均值与总体的均值相差不大,所以可以利用样本均值约等于总体均值,去估计小黄车的总量.
教师提问：
有没有其它的估计方法？
哪种方法的估计结果更接近于真实值？
10分钟
数据分析
教师讲解二战期间的真实案例，并带领学生对比三种模拟方法.
第二次世界大战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军所生产的坦克数量.后来统计学家圆满地解决了这一问题.
随着战争的进行盟军缴获了一些坦克,截止到1942年6月,盟军缴获的所有坦克的编号为: 2,113,73,160,204,65,286
统计学家的估计方法:将 2,113,73,160,204,65,286 看成在序列0,1,2 ,n中随机取的数,则可以认为,这些取得的数是“均匀”分布在序列中的.考虑到一共取了7个数,因此每两个数之间的平均距离是，样本之间的平均距离是，，德军生产的坦克数量为n=327辆.
按照甲同学提出的最大值估计:德军生产的坦克数量为286辆.
按照乙同学提出的平均值估计:德军生产的坦克数量为257辆.
通过用样本均值去估计总体均值的方法,估计出来的坦克共
有257辆,但缴获的坦克中已经有编号286了,显然将坦克的总量估计为257是不合理的.此时,我们可以将坦克数量估计为286辆.
1940年6月,根据材料显示,当时盟军缴获的坦克的编号分别为:2,113
1941年6月,盟军缴获的所有坦克的编号为:2,113,73,160,204
按照上述三种方法给出的坦克数量估计值汇总如下：
年份
最大值估计
平均数估计
统计学家的估计
真实值
情报数据
1940年6月
113
114
169
122
1000
1941年6月
204
220
244
271
1550
1942年6月
286
286
327
342
1550
从上述表格中,我们可以明显地看到,不管是两位同学提出的最大值估计法,平均值估计法还是统计学家进行的估计,最终得到的结果都比情报数据更接近真实数据.从中我们可以统计方法的威力.
4分钟
计算机模拟
教师带领学生进行计算机模拟，计算三种估计方法的误差.
现在我们已经知道了事实上德军生产的坦克总量,那么我们就可以利用计算机模拟的方法,得到较多的样本数据,进而比较三种估计方法的误差大小.以1940年6月为例,德军实际生产的坦克是122辆.
在Excel中设定总数122,然后用随机数函RANDBETWEEN产生一些编号样本,为了对比三种估计方法,哪种方法的估计结果更接近122,可以多模拟产生几组样本数据.
按照前面提到的三种估计方法,通过每组样本数据得到的估计如下表所示:
最大值估计
112
116
102
平均数估计
139
121
105
“均匀分布”
118
122
107
真实值
122
122
122
整体来看,将样本数据看成在序列0,1,2 ,n中随机取的数.进而认为,这些取得的数是“均匀”分布在序列中的.这种估计方法产生的误差较小.
1分钟
统计推断
让我们回到小黄车的实际案例中,通过前面的分析,相信同学们对最初提出的两个问题都有了答案,请同学们课后按照所给的《由样本编号估计总数活动记录表》做进一步的整理和完善.
1分钟
布置作业
请与其它同学分工合作,寻找生活中有连续编号的实例,获取适当容量的编号样本,结合本节课所学知识,给出总数的一个估计.

相关教案更多