数学必修 第二册5.2 数学探究活动:由编号样本估计总数及其模拟课文内容课件ppt
展开日常生活中,为了方便管理,人们经常会对人或物进行编号,例如身份证号码.有时需要进行连续编号(即编号为001,002,003,……).例如学号的后两位,酒店某一层的房间号,共享单车编号等.知道连续编号的最大值就能方便知道总数是多少.
在很多情况下,得到最大的编号并不容易,但可以得到一些编号的样本.此时,能不能根据编号样本的信息,利用有关的统计知识,估计出人或物的总数呢?
某小组的同学为了调查小黄车的总量,收集了一些小黄车的编号(如右图所示).每辆小黄车都有唯一的二维码和编号与之对应,假设编号的前四位是分类编号,后六位是连续编号,小黄车的停放位置是随机的.
按照假设,知道了后六位的最大值也就知道了小黄车的总量,而且总量不超过999999.收集数据后,该组同学按照后六位数字(连续编号)从小到大的顺序,对样本数据做了一个整理.
8641154586 8650202964 8641216344 86412230438641228556 8653289157 8653295913 86503148178650399914 8650402206 8650405355 86504077018650413222 8641423105 8641425647 86414335228650545469 8650585197 8650695935 86506996008650735402 8641776103 8651798187 86517989718651810807 8651813331 8641815866 86518235858651828537 8651838735 8651841183 8651843709 8651846927 8651848451 8651848586
从整理的数据中我们可以看出,最小的编号是154586,最大的编号是848586.也可以计算样本数据的其它数据特征:样本均值、样本方差等.利用已有的样本数据,如何估计小黄车的总量呢?.
甲同学提出:可以用样本数据的最大值来估计小黄车的总量,因为样本数据的最大值小于等于小黄车的总量.
乙同学认为,样本数据中恰好取到连续编号的最大值的概率很小,而样本的均值与总体的均值相差不大,所以可以利用样本均值约等于总体均值,去估计小黄车的总量.
有没有其它的估计方法?哪种方法的估计结果更接近于真实值?
第二次世界大战期间,德军生产的坦克是连续编号的,盟军从战场上缴获了一些德军坦克,因此获得了一些坦克编号,盟军希望能根据这些样本数据估计出德军所生产的坦克数量.后来统计学家圆满地解决了这一问题.
1940年6月,情报估计德军的坦克数量是1000辆.根据材料显示,当时盟军缴获的坦克的编号分别为: 2,113统计学家如何利用样本数据去估计德军的坦克总量?
假设德军一共生产了 辆坦克.统计学家的估计方法: 将2,113看成在序列中随机取的数,则可以认为,这些取得的数是“均匀”分布在序列中的.用样本之间的平均距离估计总体的平均距离.
考虑到一共取了2个数,因此每两个数之间的平均距离是 .
德军生产的坦克数量为169辆.
样本之间的平均距离是:
按照平均值估计:德军生产的坦克数量为114辆.
按照最大值估计:德军生产的坦克数量为113辆.
样本容量很小,任何一种统计方法都可能产生很大的误差.
随着战争的进行盟军又缴获了一些坦克,1941年6月,缴获的所有坦克的编号为: 2,113,73,160,204
按照最大值估计:德军生产的坦克数量为204辆.
德军生产的坦克数量为220辆.
统计学家的估计方法: 将 2,113,73,160,204 看成在序列 中随机取的数,则可以认为,这些取得的数是“均匀”分布在序列中的.考虑到一共取了5个数,因此每两个数之间的平均距离是 .
样本之间的平均距离是: .
德军生产的坦克数量为244辆.
随着战争的进行盟军又缴获了一些坦克,1942年6月,缴获的所有坦克的编号为:2,113,73,160,204,65,286
统计学家的估计:德军生产的坦克数量为327辆.
按照最大值估计:德军生产的坦克数量为286辆.按照平均值估计:德军生产的坦克数量为257辆.通过用样本均值去估计总体均值的方法,估计出来的坦克共有257辆,但缴获的坦克中已经有编号286了,显然将坦克的总量估计为257是不合理的.此时,我们可以将坦克数量估计为286辆.
什么情况下会出现平均值估计的估计值比最大值估计的估计值还小呢?
当 ,平均值估计偏小.
从上述表格中,我们可以明显地看到,不管是两位同学提出的最大值估计法,平均值估计法还是统计学家进行的估计,最终得到的结果都比情报数据更接近真实数据.从中我们可以体会统计方法的威力.
现在我们已经知道了事实上德军生产的坦克总量,那么我们就可以利用计算机模拟的方法,得到较多的样本数据,进而比较三种估计方法的误差大小.
以1940年6月为例,德军实际生产的坦克是122辆.在Excel中设定总数122,然后用随机数函数RANDBETWEEN (1,122)产生一些编号样本,为了对比三种估计方法,哪种方法的估计结果更接近122,可以多模拟产生几组样本数据.
例如,通过计算机模拟产生了三组数据,每组样本数据15个.
按照前面提到的三种估计方法,通过每组样本数据得到的估计如右图所示:
整体来看,将样本数据看成在序列 中随机取的数.进而认为,这些取得的数是“均匀”分布在序列中的.这种估计方法产生的误差较小.
让我们回到小黄车的实际案例中,通过前面的分析,相信同学们对最初提出的两个问题都有了答案,请同学们课后按照所给的《由样本编号估计总数活动记录表》做进一步的整理和完善.
数学必修 第二册5.2 数学探究活动:由编号样本估计总数及其模拟教学课件ppt: 这是一份数学必修 第二册<a href="/sx/tb_c4000154_t3/?tag_id=26" target="_blank">5.2 数学探究活动:由编号样本估计总数及其模拟教学课件ppt</a>,共18页。PPT课件主要包含了整体概览,新知探究,2获取的编号样本,探究活动1,用计算机软件进行验证,活动总结,整理后的数据为,归纳小结,目标检测等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.2 数学探究活动:由编号样本估计总数及其模拟教学演示ppt课件: 这是一份高中数学人教B版 (2019)必修 第二册5.2 数学探究活动:由编号样本估计总数及其模拟教学演示ppt课件,共13页。PPT课件主要包含了学生探索活动分享,方法概括理解应用,回溯实例计算模拟,优化过程小结反思等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体图文ppt课件: 这是一份高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体图文ppt课件,共19页。PPT课件主要包含了情境与问题,简单随机抽样结果,结果分析,尝试与发现,课堂小结等内容,欢迎下载使用。