![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件01](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327669/0.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件02](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327750/1.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件03](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327780/2.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件04](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327812/3.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件05](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327838/4.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件06](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327866/5.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件07](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327904/6.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![高中数学RJB必修第二册 第5章 5.1 5.1.4 用样本估计总体 PPT课件08](http://www.enxinlong.com/img-preview/3/3/15867720/0-1718591327943/7.jpg?x-oss-process=image/resize,w_794/sharpen,100)
高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体课堂教学课件ppt
展开1.会用样本的数字特征估计总体的数字特征.(重点)2.能用样本的分布来估计总体的分布.(难点)3.会应用相关知识解决实际统计问题.(难点)
以下是某学校高一年级 98 位学生的身高 (单位: cm):
1.用样本的数字特征估计总体的数字特征
已知这组数的总体平均数为 163.5,总体方差为 56.3. 用简单随机抽样的方法从总体中抽取容量为 10 的样本 3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较.
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差 (也称为样本方差)与总体对应的值相差不会太大. 例如,上述数据中,如果用简单随机抽样抽得的序号分别为 90,35,63,68,66,9,30,56,50,49,则对应的样本为 169,169,163,175,163,170,164,151,155,165,容易算出,样本均值为 164.4,样本方差为 45.84,它们与总体对应的值差别都不大.
这就说明,在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等. 另外,有时候总体的数字特征不可能获得,比如质监部门想知道市场上节能灯的平均使用寿命,不可能把所有节能灯都拿来检测,此时只能用样本的数字特征去估计总体的数字特征.
需要强调的是,估计一般是有误差的,例如,如果总体平均数记为从,样本均值记为工,一般来说,从>z,从z,从<元 都有可能.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大. 一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可. 下面我们来讨论一种稍微复杂一点的情况:假设样本是用分层抽样的方法得到的,而且我们知道了每一层样本的数字特征,该怎样估计总体的数字特征呢?
在考察某中学的学生身高时,如果采用分层抽样的方法,得到了男生身高的平均数为 170,方差为16;女生身高的平均数为 165,方差为25.如果没有其他信息,怎样估计总体的平均数与方差?如果知道抽取的样本中,男生有 20 人,女生有 15 人,怎样估计总体的平均数与方差?
作为估计来说,我们当然可以选择男生(或女生) 样本的平均数与方差作为总体对应值的估计,但这样的选择没有充分利用E好;另外一种估计的办法是取每一层样本数字特征的算估计,即估计总体平均数为
类似地,总体方差可估计为1_______________.
但第二种估计方法也还不太理想,因为对于分层抽样来说,每一层所抽取的个体数目一般来说是不相等的,简单的求数字特征的算术平均值体现不出这一点.怎样才能体现这一点呢?尤其是,当我们把各层中得到的个体放在一起作为一个样本时,样本均值与样本方差该如何计算呢?此时,当然可以把各层数据集中在一起来重新计算,但也可以去考虑整个样本的数字特征与每一层的数字特征之间的关系来实现,后者在大数据时代的并行计算中经常使用.
依照上述公式可以算出,前述尝试与发现 (2) 中总体的平均数可以估计为 167.86,总体的方差可以估计为 25.98.
样本数字特征所反映的样本的特征 一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.
前面我们已经看到,总体的数字特征可以用样本的数字特征来估计,那么,总体的分布是否也可以用样本的分布来近似刻画呢?这是接下来要讨论的问题.
2.用样本的分布来估计总体的分布
通过对某中学 1257 名高一学生期中考试的数学成绩 (具体数据参见这一小节的附录) 进行整理,可以得到如下数据,并由此可作出频率分布直方图和折线图如图 5-1-15 所示. 从附录的数据中抽取容量为 100 的样本,整理类似的表格,并制作频率分布直方图.
同前面一样,如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.例如,如果从上述尝试与发现中提到的数据中,抽取两个容量为 100 的样本(分别记为样本 A,样本 B,具体数据参见这一小节的附录),则可以得到如下频数、频率对应表,它们的频率分布直方图分别如图 5-1-16 (1)(2) 所示.
这就说明,同前面一样,如果容许有一定误差,则可以用样本的分布去估计总体的分布.而且,在总体的分布不可能获得时,只能用样本的分布去估计总体的分布.
不等于零,同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
为了快速了解某学校学生体重 (单位:kg)的大致情况,随机抽取了 10 名学生称重,得到的数据整理成茎叶图如图 5-1-17 所示.估计这个学校学生体重的平均数和方差.
将样本中的每一个数都减去 50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为
因此可估计这个学校学生体重的平均数为 51,方差为 30.4.
极差、方差与标准差的区别与联系数据的离散程度可以通过极差、方差或标准差来描述.(1)极差是数据的最大值与最小值的差,它反映了一组数据变化的最大幅度,它对一组数据中的极端值非常敏感.(2)方差或标准差则反映了一组数据围绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度通常用标准差,即样本方差的算术平方根,是样本数据到平均数的一种平均距离.
我国是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年 100 个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3.4),[4,5] 分成5组,制成了如图5-1-18 所示的频率分布直方图.
(1) 求图中a 的值;(2)设该市有 10 万个家庭,估计全市月均用水量不低于 3t 的家庭数;(3) 假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.
因为频率分布直方图所有矩形的面积之和为 1,所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.
(2) 抽取的样本中,月均用水量不低于 3 t 的家庭所占比例为 (a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于 3 t的家庭所占比例也为 30%,所求家庭数为100 000×30%=30 000.
(3) 因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为 2.46.
1.利用频率分布直方图求数字特征(1)众数是最高的矩形的底边的中点;(2)中位数左右两侧直方图的面积相等;(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
用样本估计总体的失败案例
我们已经知道,用样本估计总体是有可能会犯错误的。下面是美国总统选举中的两个估计失败的案例.1936 年美国总统选举前,一家很有名的杂志社,通过电话簿和各种俱乐部信息等抽取了约 240 万人,调查他们的选举意向。根据调查数据,这家杂志社给出了预测得票率,但选举结果与预测结果相差很大,如下表所示.
事实上,在 1936 年的美国,一般只有富人才拥有电话、能参加俱乐部,因此这家杂志社所得到的样本不能反映总体的情况. 2016年美国总统选举前,一个很擅长数据分析的网站,给出了基于民意调查的两位候选人获胜概率预测,如下图所示。然而,这一次的选举最后以特朗普获胜告终,实际上,这次选举绝大多数的预测都是错误的!原因都与祥本的代表性有关. 失败案例的存在是不是意味着用样本估计总体不科学呢?不是!这只是说明,在用祥本估计总体时,要保证拍样方案科学合理,实际上,美国总统选举的绝大多数预测都是正确的,即使是上述两年所说的选举,也有调查机构根据民意调查正确地预测了结果.
随着数据收集以及数据存储技术的不断进步,现在人们能够以非常便捷的方式、非常低廉的成本、非常快的速度,收集规模非常宏大的数据集合“大数据”时代已经悄然来临. “大数据”的出现,让人们对“数据”本身有了许多新的认识.除了传统的数值数据外,文本、图像、音频、视频等都可以被“数据化”, 网民的搜索行为和浏览记录、法律判决文书、病人的就诊病例和 CT影像(即计算机层成像)、聊天语音、视频监控录像等信息都可以被记录下来并且被“数据化”凡是可以被“数据化”的信息载体都可以看成数据.信息载体包括的数据量达到一定的规模或者达到一定的复杂程度,都可以被认为是“大数据”.
“大数据”的出现,让人们认识到了数据本身的价值:根据网民的搜索行为和浏览记录所反映出来的个人偏好,可以用于精准推送合适的新闻或商品;分析法律判决文书的历史信息,有助于准确识别虚假诉讼、实现案件繁简分离、提高审判效率;将病人的就诊病例、CT 影像数据等与医生的诊断结果结合后,可以用于训练精确的统计模型,实现优质医疗资源共享;准确识别后的语音信息,可以非常快速、便捷地转换为操作指令,提高工作效率;视频监控录像可以为警察破案提供非常重要的线索······
“大数据”的价值远远不止于此.事实上,“大数据”作为信息资源,与土地、劳动力和资本等生产要素一样,正在成为促进经济增长和社会发展的基本要素.“大数据”已被普遍认为是非常重要的国家战略资源.未来,作为重要生产要素和国家战略资源的“大数据”资源,将渗透至我们的日常生活、社会经济活动以及政府管理决策之中,进一步提高我们的生活质量,改进企业的生产效率,提升政府部门快速响应和合理决策的能力,等等.
1.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534 石,验得米内夹谷,抽样取米一把,数得 254 粒内夹谷28 粒,估计这批米内所夹的谷有多少石。2.代课教师为了了解某班级学生的数学成绩,随机抽查了 5位学生的成绩,得到的数据为92,78,56,75,62.试估计该班学生数学成绩的平均数与方差。
3.某学校为了了解高中学生用手机上网的时间,随机抽查了若干位学生进行调查,收集到的日平均上网时间 (单位: h) 都在区间 [0,3] 内,且频率分布直方图如图所示。分别估计这所学校学生中,日平均上网时间不到 1h 和超过了 2 h的学生所占的百分比.
1.为了考察某地 6 月份最高气温的情况,随机抽取了5 天,所得数据 (单位:C) 可以绘制成如图所示茎叶图,估计该地6 月份最高气温的平均值与方差。2.为了了解上、下班时段的交通情况,某市抽取了 12 辆机动28930 1(第 1)车行驶的速度,得到了如下数据 (单位: km/h).上班时段:30 33 18 27 32 40 26 28 21 28 35 20下班时段:27 19 32 29 36 29 30 22 25 16 17 30 用茎叶图表示这些数据,并分别估计出该市上、下班时段机动车行驶的平均速度.
3.某学校为了调查高一年级学生的体育锻炼情况,从甲、乙、丙3 个班中,按分层抽样的方法获得了部分学生一周的锻炼时间 (单位: h),数据如下.求三个班中学生人数之比;估计这个学校高一年级学生中,一周的锻炼时间超过 10 h的百分比;(3) 估计这个学校高一年级学生一周的平均锻炼时间.
一、知识总结1.利用样本原始数据(柱形图、扇形图、茎叶图)求得的样本数字特征都是真实值,而不是估计值.利用频率分布表、频率分布直方图得到的样本数字特征均为估计值,它们都可用以估计总体.
2.在分层抽样时,如果总体分为k层,而且第j层抽取的样本量为nj,第j层的样本均值为,样本方差为 记n ,则所有数据的样本均值和方差分别为 二、常见误区1.计算标准差或方差时易将公式记错而致误.2.利用频率分布直方图求数字特征时易出现理解错误而致错.
高中数学人教B版 (2019)必修 第二册第四章 指数函数、对数函数与幂函数4.2 对数与对数函数4.2.2 对数运算法则集体备课ppt课件: 这是一份高中数学人教B版 (2019)必修 第二册<a href="/sx/tb_c4000138_t3/?tag_id=26" target="_blank">第四章 指数函数、对数函数与幂函数4.2 对数与对数函数4.2.2 对数运算法则集体备课ppt课件</a>,共20页。PPT课件主要包含了学习目标,讲授新课,商幂的对数,尝试与发现,由此可知,其中k是正整数,典例精析,计算下列各式的值,规律方法,换底公式等内容,欢迎下载使用。
数学人教B版 (2019)第五章 统计与概率5.1 统计5.1.4 用样本估计总体课文配套ppt课件: 这是一份数学人教B版 (2019)第五章 统计与概率5.1 统计5.1.4 用样本估计总体课文配套ppt课件,共39页。PPT课件主要包含了目录索引等内容,欢迎下载使用。
人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体作业ppt课件: 这是一份人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体作业ppt课件,共22页。