高中人教B版 (2019)5.1.4 用样本估计总体课堂教学ppt课件
展开5.1.4 用样本估计总体
课标要求
1.能用样本的数字特征估计总体的数字特征.2.能用样本的分布估计总体的分布.
素养要求
通过用样本估计总体的学习,提升学生的数据分析、数学运算和逻辑推理素养.
问题导学预习教材必备知识探究
互动合作研析题型关键能力提升
拓展延伸分层精练核心素养达成
内容索引
WEN TI DAO XUE YU XI JIAO CAI BI BEI ZHI SHI TAN JIU
问题导学预习教材 必备知识探究
1
1.思考 用简单随机抽样的方法从总体100中抽取容量为20的样本,分别计算样本平均数与样本方差s2,这与总体的平均数和方差有什么关系?
2.填空 用样本的分布估计总体的分布 (1)一般情况下,如果样本的容量______,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大. (2)在容许一定误差存在的前提下,可以用______的数字特征去估计总体的数字特征.
恰当
样本
温馨提醒 一般地,平均数反映的是样本个体的平均水平,众数和中位数则反映样本中个体的“重心”,而标准差则反映了样本的波动程度、离散程度,即均衡性、稳定性、差异性等.因此,我们可以根据问题的需要选择用样本的不同数字特征来分析问题.
3.做一做 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图,已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为 .
480
HU DONG HE ZUO YAN XI TI XING GUAN JIAN MENG LI TI SHENG
互动合作研析题型 关键能力提升
2
用样本的特征数估计总体的特征数
题型一
例1 若甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;
(2)根据计算结果判断哪台机床加工零件的质量更稳定.
(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体.(2)此类问题需计算样本的平均值和方差来估计总体.
训练1 为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.
解 将样本中的每一个数都减去50,可得-5,-1,-3,-1,-4,-4,1,8,9,10,
样本中10个数的平均数为50+1=51,方差为
=30.4.因此可估计这个学校学生体重的平均数为51,方差为30.4.
分层抽样的平均数、方差
题型二
例2 在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?(保留小数点后两位有效数字)
≈51.49.我们可以计算出总样本的方差约为51.49,并据此估计高一年级学生身高的总体方差约为51.49.
训练2 某学校有高中学生500人,其中男生320人,女生180人.有人为了获得该校全体高中学生的身高信息,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得男生样本的均值为173.5,方差为17,女生样本的均值为163.83,方差为30.03. 根据以上信息,能够计算出总样本的平均数和方差吗?(保留小数点后两位有效数字)
故总样本的平均数约为170.02,方差约为43.24.
题型三
频率分布直方图与数字特征的综合应用
例3 我国是世界上严重缺水的国家,某市政府为了鼓 励居民节约用水,计划调整居民生活用水收费方案, 拟确定一个合理的月用水量标准x(吨),一位居民 的月用水量不超过x的部分按平价收费,超出x的部分 按议价收费.为了了解居民用水情况,通过抽样,获 得了某年100位居民每人的月均用水量(单位:吨), 将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成 9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
解 由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.
由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
解 由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.
解 因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,由0.3×(x-2.5)=0.85-0.73,所以x=2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.①众数是最高的矩形的底边的中点;②中位数左右两侧直方图的面积相等;③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.(2)用样本的频率分布估计总体的分布.
训练3 某网站从春节期间参与收发网络红包的手机用户中随机抽取2 000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),…,[50,60],并整理得到如图所示的频率分布直方图.
(1)求a的值;
解 根据频率分布直方图可知10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率;
解 根据题意,得样本中年龄低于40岁的频率为10×(0.01+0.035+0.03)=0.75,所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率为0.75.
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
解 根据题意,得春节期间参与收发网络红包的手机用户的平均年龄约为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5(岁).
课堂小结
1.用样本估计总体: (1)用样本的数字特征(或分布)估计总体的数字特征(或分布)一般是有误差的.利用样本原始数据(柱形图、扇形图、茎叶图)求得的样本数字特征都是真实值,而不是估计值.利用频率分布表、频率分布直方图得到的样本数字特征均为估计值,它们都可用以估计总体. (2)当样本容量越来越大时,估计的误差很小的可能性将越来越大.2.两个易错点: (1)用频率分布直方图求数字特征时,易将纵坐标当作频率而出错. (2)用样本数据得到的是总体的估计值,而不是准确值.
TUO ZHAN YAN SHEN FEN CENG JING LIAN HE XING SU YANG DA CHENG
拓展延伸分层精练 核心素养达成
3
1.有一个容量为66的样本, 数据的分组及各组的频数如下: [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5] 3 则总体中大于或等于31.5的数据约占( )
B
2.(多选)第十二届全国少数民族传统体育运动会将于2023年在海南举行.如图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法不正确的是( )
ABD
A.甲的平均数大于乙的平均数B.甲的中位数大于乙的中位数C.甲的方差大于乙的方差D.甲的极差小于乙的极差
甲的中位数为26,乙的中位数为28,26<28,故B错误.
甲的极差为59-11=48,乙的极差为51-12=39,48>39,故D错误.故选ABD.
3.(多选)下列说法中正确是( ) A.数据的极差越小,样本数据分布越集中、稳定 B.数据的平均数越小,样本数据分布越集中、稳定 C.数据的标准差越小,样本数据分布越集中、稳定 D.数据的方差越小,样本数据分布越集中、稳定
ACD
解析 由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故B不正确,ACD正确.
4.为了解某地区1 500名高三男生的身体发育情况,抽查了该地区100名年龄为17~18岁的高三男生体重(kg),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在[56.5,64.5)kg的学生人数是( )
C
A.390 B.510 C.600 D.660
解析 由题意得体重在[56.5,64.5)kg的学生频率为(0.03+0.05+0.05+0.07)×2=0.4,其人数为1 500×0.4=600.
5.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.估计这次测试数学成绩的平均分为( )
C
A.50 B.60 C.72 D.80
解析 利用组中值估算学生的平均分为45f1+55f2+65f3+75f4+85f5+95f6=45×0.05+55×0.15+65×0.2+75×0.3+85×0.25+95×0.05=72.
6.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是 .
5.7%
所以该地拥有3套或3套以上住房的家庭共约有5 000+700=5 700(户).
7.某果园有苹果树100棵,为了估计该果园的苹果总产量,小王先按长势把苹果树分成了A,B,C三个级别,其中A级30棵,B级60棵,C级10棵,然后从A,B,C三个级别的苹果树中分别随机抽取了3棵、6棵、1棵,测出其产量,制成了如下统计表.小李看了这个统计表后马上正确估计出了该果园的苹果总产量,那么小李的估计值是 kg.
7 600
解析 由表格各等级苹果树的平均产量可估算果园的苹果总产量为(80×3+75×6+70×1)×10=7 600(kg).
8.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示).由图中数据可知a= .若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 .
0.030
3
解析 因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,
9.某校医务室抽查了高一10位同学的体重(单位:kg)如下:74,71,72,68,76,73,67,70,65,74. (1)求这10个学生体重数据的平均数、中位数、方差、标准差;
这10个学生体重数据从小到大依次为65,67,68,70,71,72,73,74,74,76,位于中间的两个数是71,72,
(2)估计高一所有学生体重数据的平均数、中位数、方差、标准差.
10.为了了解高一年级学生的体能情况,某校随机抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
解 频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?
11.(多选)在某次高中学科竞赛中,4 000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中的数据用该组区间的中点值为代表,则下列说法中正确的是( )
ABC
A.成绩在[70,80)分的考生人数最多B.不及格的考生人数为1 000人C.考生竞赛成绩的平均数约为70.5分D.考生竞赛成绩的中位数约为75分
设中位数约为x0分,因为(0.01+0.015+0.02)×10=0.45<0.5,(0.01+0.015+0.02+0.03)×10=0.75>0.5,所以0.45+(x0-70)×0.03=0.5,解得x0≈71.7,D错误.
12.如图是某班学生在一次数学考试中的成绩的频率分布直方图.根据直方图估计其成绩的众数是 ,中位数是 ,平均数是 .
75
76.5
平均数为(55×0.01+65×0.02+75×0.03+85×0.025+95×0.015)×10=76.5.
13.某市一个调查公司在一服务区从七座以下小型汽车中随机抽取40名驾驶员进行询问调查,将他们在某段高速公路的车速(km/h)分成六段:[60,65),[65,70),[70,75),[75,80),[80,85),[85,90]后得到如图的频率分布直方图.
(1)求图中a的值;
解 因为频率分布直方图所有矩形的面积之和为1,所以0.01×5+0.04×5+0.06×5+0.05×5+a×5×2=1,解得a=0.02.
(2)设该市有七座以下小型汽车10万辆,估计全市七座以下小型汽车在该段高速公路的车速不低于80的辆数;
解 抽取的样本中,在该段高速公路的车速不低于80的七座以下小型汽车所占的比例为(0.05+0.02)×5=0.35=35%,因此估计在该段高速公路的车速不低于80的全市七座以下小型汽车所占的比例也为35%,所求车辆数约为100 000×35%=35 000.
(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市七座以下小型汽车在该段高速公路的车速平均数.
解 因为0.01×5×62.5+0.02×5×67.5+0.04×5×72.5+0.06×5×77.5+0.05×5×82.5+0.02×5×87.5=77,
因此估计全市七座以下小型汽车在该段高速公路的车速平均数为77.
14.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
(1)作出这些数据的频率分布直方图;
解 频率分布直方图如图.
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104,所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
解 质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.
2020-2021学年5.1.4 用样本估计总体课文课件ppt: 这是一份2020-2021学年5.1.4 用样本估计总体课文课件ppt,共60页。PPT课件主要包含了情境导学·探新知,NO1,合作探究·释疑难,NO2,当堂达标·夯基础,NO3等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体教案配套ppt课件: 这是一份高中数学人教B版 (2019)必修 第二册第五章 统计与概率5.1 统计5.1.4 用样本估计总体教案配套ppt课件,共37页。PPT课件主要包含了新知初探·自主学习,课堂探究·素养提升,答案D等内容,欢迎下载使用。
数学必修 第二册5.1.4 用样本估计总体习题课件ppt: 这是一份数学必修 第二册5.1.4 用样本估计总体习题课件ppt,文件包含进阶训练5范围513~514pptx、进阶训练5范围513~514DOCX等2份课件配套教学资源,其中PPT共25页, 欢迎下载使用。