人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体教案配套ppt课件
展开1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.
2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
3.会用样本的基本数字特征估计总体的基本数字特征.
同学们,你们想拥有一个健康的体魄吗?拥有健康的体魄是我们学习和生活的基础,为了提高大家的体质健康水平,教育部决定,在全国范围内开展“全国亿万青少年学生阳光体育运动”,使大部分学生能做到每天锻炼一小时,我们在座的同学达到目标了吗?我校的同学达到了这个标准了吗?
用样本的数字特征估计总体的数字特征
1.用样本的数字特征来估计总体的数字特征(1)一般情况下,如果样本的容量 ,抽样方法又 的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.(2)在容许一定误差存在的前提下,可以用 的数字特征去估计总体的数字特征,这样就能节省人力和物力等.另外,有时候总体的数字特征不可能获得,此时只能用样本的数字特征去估计总体的数字特征.
2.众数、中位数、平均数
(1)利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.(2)一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以 ×(2+4+6+8+7+7+8+9+9+10)=7;
乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
(2)请从四个不同的角度对这次测试进行分析:①从平均数和方差结合分析偏离程度;②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环及以上的次数相结合看谁的成绩好些;④从折线图上两人射击命中环数及走势分析谁更有潜力.
①甲、乙的平均数相同,均为7,但说明甲偏离平均数的程度小,而乙偏离平均数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶成绩比甲好.
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:
(1)试估计这种日光灯的平均使用寿命;
各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).
(2)若定期更换,则选择多长时间统一更换合适?
s2= [1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,故标准差s= ≈46(天).由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故在222天到314天内统一更换较合适.
分层抽样的平均数、方差
(多选)某分层抽样中,有关数据如下:
则下列叙述正确的是(结果保留两位小数)A.第1,2层所有数据的均值为5.75B.第1,2层所有数据的方差为1.50C.第1,2,3层所有数据的均值约为7.68D.第1,2,3层所有数据的方差约为5.23
运用公式求分层抽样的均值与方差时要注意(1)清楚公式中各个符号的含义,避免代入数据混乱.(2)运算要格外仔细,并按要求保留有效小数.
某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.
∴全体学生的平均分为115分.全体学生成绩的方差为
=85+180=265.
用样本的分布估计总体的分布
1.同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说, (πi-pi)2=_______________________________不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来 .
2.用样本的分布来估计总体的分布如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多,特别地,每一组的频率与总体对应的频率相差不会太大.
为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
由已知得0.70=a+0.20+0.15,故a=0.35,b=1-0.05-0.15-0.70=0.10.
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能比较准确的估计其众数、中位数和平均数.
某城市一入城交通路段限速60公里/小时,现对某时段通过该交通路段的n辆小汽车车速进行统计,并绘制成频率分布直方图(如图).若这n辆小汽车中,速度在50~60公里/小时之间的车辆有200辆.(1)求n的值;
由直方图可知,速度在50~60公里/小时之间的频率为0.04×10=0.4,
(2)估计这n辆小汽车车速的平均数、中位数.
这n辆小汽车车速的平均数的估计值为25×0.06+35×0.1+45×0.3+55×0.4+65×0.1+75×0.04=50.设这n辆小汽车车速的中位数为x,则0.006×10+0.01×10+0.03×10+0.04×(x-50)=0.5,解得x=51.
1.知识清单: (1)样本的数字特征. (2)用样本的数字特征估计总体的数字特征. (3)用样本的分布估计总体的分布.2.方法归纳:数据处理.3.常见误区:样本的数字特征只能估计总体的特征,不能替代总体.
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.
2.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为 和B,样本标准差分别为sA和sB,则
由题图知,A组数据分布在[2.5,10]内,B组数据分布在[10,15]内,显然 .又由图形可知,B组数据的分
布比A组的均匀,变化幅度不大,故B组数据比较稳定,方差较小,从而标准差较小,所以sA>sB.
3.某台机床加工的1 000只产品中次品数的频率分布如下表:则次品数的众数、平均数依次为A.0,1.1 B.0,1 C.4,1 D.0.5,2
数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn.因此次品数的平均数为0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1.由频率知,次品数的众数为0.
4.样本容量为9的四组数据,它们的平均数都是5,它们的柱形统计图如图所示,则标准差最大的一组是
A.第一组 B.第二组 C.第三组 D.第四组
方法一 第一组中,样本数据都为5,数据没有波动幅度,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为 ;
第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为 .故标准差最大的一组是第四组.
第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为 ;
方法二 从四个柱形图可看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.
5.某校组织了一场演讲比赛,五位评委对某位参赛选手的评分分别为9,x,8,y,9.已知这组数据的平均数为8.6,方差为0.24,则|x-y|=________.
由题可知,8.6= (9+8+9+x+y),整理得x+y=17,0.24= [(9-8.6)2+(x-8.6)2+(8-8.6)2+(y-8.6)2+(9-8.6)2],整理得(x-8.6)2+(y-8.6)2=0.52,
得x2-17x+72=0,解得x=8或x=9,对应y=9或y=8,故|x-y|=1.
1.在用样本频率分布估计总体分布的过程中,下列说法中正确的是A.样本容量一定时总体容量越大,估计越精确B.总体容量与估计的精确度无关C.总体容量一定时样本容量越大,估计越精确D.总体容量一定时样本容量越小,估计越精确
当样本容量越大时,估计总体越精确.
2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可估计我国13岁男孩的平均身高为 m m m m
从北方抽取了300个男孩,平均身高为1.60 m,从南方抽取了200个男孩,平均身高为1.50 m,则这500个13岁男孩的平均身高是 =1.56(m),据此可估计我国13岁男孩的平均身高为1.56 m.
3.(多选)甲、乙两名同学六次数学测验成绩(百分制)如图所示,下面说法正确的是A.甲同学成绩的中位数大于乙同学成绩的中位数B.甲同学成绩的平均分比乙同学的高C.甲同学成绩的平均分比乙同学的低D.甲同学成绩的方差小于乙同学成绩的方差
甲的中位数为81,乙的中位数为87.5,故A错误;
甲的极差为18,乙的极差为27,且甲的成绩比较均衡,故甲的成绩的方差小于乙成绩的方差,D正确.
4.(多选)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的条形图,下列结论正确的是A.甲地该月14时的平均气温低于 乙地该月14时的平均气温B.甲地该月14时的平均气温高于乙地该月14时的平均气温C.甲地该月14时的气温的极差大于乙地该月14时的气温的极差D.甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差
甲地数据为26,28,29,31,31;乙地数据为28,29,30,31,32.
5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)的统计图如图所示,假设得分分值的中位数为me,众数为m,平均数为 ,则
由柱形统计图可知,30名学生的得分依次为2个3分,3个4分,10个5分,6个6分,3个7分,2个8分,2个9分,2个10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故m=5.
6.在某市“创建文明城市”知识竞赛中,考评组从所有2 000份试卷中抽取200份试卷进行分析,其分数的频率分布直方图如图所示,则本次竞赛分数在区间[60,70)内的人数大约有________.
根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,可估计本次竞赛分数在区间[60,70)内的人数为2 000×0.4=800.
7.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:(单位:小时)
这些节能灯泡使用寿命的平均数是
则这些节能灯泡使用寿命的平均数是________.
8.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点
值作为代表,观察图形的信息,据此估计本次考试数学成绩的平均分为________.
在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
9.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么全部100件产品的平均尺寸和方差分别是多少?
甲机床生产的零件的平均尺寸、方差分别为
乙机床生产的零件的平均尺寸、方差分别为
所以100件产品的平均尺寸
所以100件产品的方差
10.某网站从春节期间参与收发网络红包的手机用户中随机抽取2 000名进行调查,将受访用户按年龄分成5组[10,20),[20,30),…,[50,60],并整理得到如图所示的频率分布直方图.(1)求a的值;
根据频率分布直方图可知10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率;
根据题意,得样本中年龄低于40岁的频率为10×(0.01+0.035+0.03)=0.75,所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率为0.75.
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
根据题意,得春节期间参与收发网络红包的手机用户的平均年龄约为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5(岁).
11.设矩形的长为a,宽为b,其比满足b∶a= ≈0.618,这种矩形给 人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639乙批次:0.618 0.613 0.592 0.622 0.620
根据题述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定
计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.
12.为了了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为,0.96 ,96C.27,0.96 D.27,96
由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.
视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
13.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
14.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则
在[55,75)的人数为(0.040×10+0.025×10)×20=13.
(1)这20名工人中一天生产该产品数量在[55,75)的人数是________;
(2)这20名工人一天生产该产品数量的中位数为________;
由图可知,中位数在[55,65)范围内.设中位数为x,则0.2+(x-55)×0.04=0.5,解得x=62.5.
(3)这20名工人一天生产该产品数量的平均数为________.
0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
15.某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100名用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图如图所示.
若甲地区和乙地区用户满意度评分的中位数分别为m1,m2,平均数分别为x1,x2,则下列结论正确的是A.m1>m2,x1>x2B.m1>m2,x1
由频率分布直方图得,甲地区[40,60)内的频率为(0.015+0.020)×10=0.35,[60,70)内的频率为0.025×10=0.25,所以甲地区用户满意度评分的中位数
m1=60+ ×10=66,平均数x1=45×0.015×10+55×0.020×10+65×0.025×10+75×0.020×10+85×0.010×10+95×0.010×10=67.
乙地区[50,70)内的频率为(0.005+0.020)×10=0.25,[70,80)内的频率为0.035×10=0.35,所以乙地区用户满意度评分的中位数m2=70+
×10≈77.1,平均数x2=55×0.005×10+65×0.020×10+75×0.035×10+85×0.025×10+95×0.015×10=77.5.所以m1
(1)求出表中M,p及图中a的值;
由分组[10,15)内的频数是10,频率是0.25,知 =0.25,所以M=40.
所以10+24+m+2=40,解得m=4,
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.
(3)估计该校高三年级学生参加社区服务次数的平均数.
因为n= =0.6,又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25.所以估计该校高三年级学生参加社区服务次数的平均数是17.25.
新教材人教B版步步高学习笔记【同步课件】模块综合试卷(二): 这是一份新教材人教B版步步高学习笔记【同步课件】模块综合试卷(二),共60页。
新教材人教B版步步高学习笔记【同步课件】模块综合试卷(一): 这是一份新教材人教B版步步高学习笔记【同步课件】模块综合试卷(一),共60页。
2021学年5.4 统计与概率的应用说课ppt课件: 这是一份2021学年5.4 统计与概率的应用说课ppt课件,共60页。PPT课件主要包含了统计的应用,如图所示,反思感悟,概率的应用,统计与概率的综合应用,=8725,师生的满意指数为,=0804,随堂演练,课时对点练等内容,欢迎下载使用。