数学人教B版 (2019)5.1.4 用样本估计总体学案
展开5.1.4 用样本估计总体
学习目标 1.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3.会用样本的基本数字特征估计总体的基本数字特征.
知识点一 用样本的数字特征来估计总体的数字特征
众数
众数是最高长方形的中点所对应的数据
中位数
(1)在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;
(2)表示样本数据所占频率的等分线
平均数
(1)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和;
(2)平均数是频率分布直方图的重心,是频率分布直方图的平衡点
一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
知识点二 用样本的分布估计总体的分布
同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
1.样本的平均数描述了样本数据的平均水平.( √ )
2.方差越大、数据越集中在平均数左右.( × )
3.中位数是样本数据中最中间位置的数据.( × )
4.用样本估计出的总体中位数一定是样本数据中的某个数.( × )
一、用样本的数字特征估计总体的数字特征
例1 甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:
(1)填写下表;
平均数
方差
中位数
命中9环及以上
甲
7
1.2
1
乙
5.4
3
(2)请从四个不同的角度对这次测试进行分析:
①从平均数和方差结合分析偏离程度;
②从平均数和中位数结合分析谁的成绩好些;
③从平均数和命中9环及以上的次数相结合看谁的成绩好些;
④从折线图上两人射击命中环数及走势分析谁更有潜力.
解 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10,所以乙=(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:
平均数
方差
中位数
命中9环及以上
甲
7
1.2
7
1
乙
7
5.4
7.5
3
(2)①甲、乙的平均数相同,均为7,但s
③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.
④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.
反思感悟 在日常生活中,当面对一组数据时,相比每一个观测值,有时我们更关心的是能反映这组数据特征的一些值,例如上述数据,我们可以从平均数、中位数、百分位数、众数、极差、方差、标准差等角度进行比较.
跟踪训练1 为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:
天数
151~180
181~210
211~240
241~270
271~300
301~330
331~360
361~390
日光灯数
1
11
18
20
25
16
7
2
(1)试估计这种日光灯的平均使用寿命;
(2)若定期更换,可选择多长时间统一更换合适?
解 (1)各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).
(2)s2=[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,故标准差s=≈46(天).
由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故可在222天到314天内统一更换较合适.
二、频率分布直方图与数字特征的综合应用
例2 已知一组数据:
125 121 123 125 127 129 125 128 130 129
126 124 125 127 126 122 124 125 126 128
(1)填写下面的频率分布表;
分组
个数累计
频数
频率
[120.5,122.5)
[122.5,124.5)
[124.5,126.5)
[126.5,128.5)
[128.5,130.5]
合计
(2)作出频率分布直方图;
(3)以这组数据为样本估计总体的众数、中位数和平均数.
解 (1)
分组
个数累计
频数
频率
[120.5,122.5)
2
0.1
[122.5,124.5)
3
0.15
[124.5,126.5)
8
0.4
[126.5,128.5)
4
0.2
[128.5,130.5]
3
0.15
合计
20
1
(2)
(3)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5.设中位数为x,则0.25+(x-124.5)×0.2=0.5,解得x=125.75.使用“组中值”求平均数:=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8.
所以可估计总体的众数为125.5,中位数为125.75,平均数为125.8.
(学生留)反思感悟 (1)利用频率分布直方图求数字特征
①众数是最高的矩形的底边的中点;
②中位数左右两侧直方图的面积相等;
③平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、中位数和平均数.
跟踪训练2 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图.求:
(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
解 (1)由题图可知众数为65,
又因为第一个小矩形的面积为0.3,
所以设中位数为60+x,则0.3+x×0.04=0.5,得x=5,
所以中位数为60+5=65.
(2)依题意,平均成绩为55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,
所以高一参赛学生的平均成绩约为67.
1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
答案 B
解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.
2.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( )
A.A>B,sA>sB B.AsB
C.A>B,sA
解析 由题图知,A组数据分布在[2.5,10]内,B组数据分布在[10,15]内,显然A
3.某台机床加工的1 000只产品中次品数的频率分布如下表:
次品数
0
1
2
3
4
频率
0.5
0.2
0.05
0.2
0.05
则次品数的众数、平均数依次为( )
A.0,1.1 B.0,1 C.4,1 D.0.5,2
答案 A
解析 数据xi出现的频率为pi(i=1,2,…,n),则x1,x2,…,xn的平均数为x1p1+x2p2+…+xnpn.因此次品数的平均数为0×0.5+1×0.2+2×0.05+3×0.2+4×0.05=1.1.由频率知,次品数的众数为0.
4.样本容量为9的四组数据,它们的平均数都是5,它们的柱形统计图如图所示,则标准差最大的一组是( )
A.第一组 B.第二组
C.第三组 D.第四组
答案 D
解析 方法一 第一组中,样本数据都为5,数据没有波动幅度,标准差为0;
第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为;
第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为;
第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为2.
故标准差最大的一组是第四组.
方法二 从四个柱形图可看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义可以直观得到答案.
5.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.
答案 甲 甲
解析 甲=70,乙=68.s=×(22+12+12+22)=2,s=×(52+12+12+32)=7.2.
1.知识清单:
(1)样本的数字特征.
(2)用样本的数字特征估计总体的数字特征.
(3)用样本的分布估计总体的分布.
2.方法归纳:数据处理.
3.常见误区:样本的数字特征只能估计总体的特征,不能替代总体.
1.在用样本频率分布估计总体分布的过程中,下列说法中正确的是( )
A.样本容量一定时总体容量越大,估计越精确
B.总体容量与估计的精确度无关
C.总体容量一定时样本容量越大,估计越精确
D.总体容量一定时样本容量越小,估计越精确
答案 C
解析 当样本容量越大时,估计总体越精确.
2.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高为1.60 m;从南方抽取了200个男孩,平均身高为1.50 m.由此可估计我国13岁男孩的平均身高为( )
A.1.57 m B.1.56 m C.1.55 m D.1.54 m
答案 B
解析 从北方抽取了300个男孩,平均身高为1.60 m,从南方抽取了200个男孩,平均身高为1.50 m,则这500个13岁男孩的平均身高是=1.56(m),据此可估计我国13岁男孩的平均身高为1.56 m,故选B.
3.某班有50名学生,男女人数不相等.随机询问了该班5名男生和5名女生的某次数学测试成绩,用茎叶图记录如图所示,则下列说法一定正确的是( )
A.这5名男生成绩的标准差大于这5名女生成绩的标准差
B.这5名男生成绩的中位数大于这5名女生成绩的中位数
C.该班男生成绩的平均数一定大于该班女生成绩的平均数
D.这种抽样方法是一种分层抽样
答案 A
解析 5名男生成绩的平均数为=90,
5名女生成绩的平均数为=91,
这5名男生成绩的方差为×(22+42+22+42)=8,女生成绩的方差为×(22×3+32×2)=6,男生方差大于女生方差,所以男生标准差大于女生标准差,所以A对;
这5名男生成绩的中位数是90,5名女生成绩的中位数为93,所以B错;
该班男生和女生成绩的平均数可通过样本估计,但不能通过样本计算得到平均数准确值,所以C错;若抽样方法是分层抽样,因为男生女生不等,所以分别抽取的人数不等,所以D错.故选A.
4.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的柱形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
答案 C
解析 由柱形统计图知:
甲射靶5次的成绩分别为4,5,6,7,8;
乙射靶5次的成绩分别为5,5,5,6,9,
所以甲==6;乙==6.
所以甲=乙.故A不正确.
甲的成绩的中位数为6,乙的成绩的中位数为5,故B不正确.
s=[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=×10=2,
s=[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=×12=,
因为2<,所以s
5.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)的统计图如图所示,假设得分分值的中位数为me,众数为mo,平均数为,则( )
A.me=mo= B.me=mo<
C.me
解析 由柱形统计图可知,30名学生的得分依次为2个3分,3个4分,10个5分,6个6分,3个7分,2个8分,2个9分,2个10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故mo=5.
=
≈5.97.
于是得mo
答案 800
解析 根据频率分布直方图,分数在区间[60,70)上的频率为0.04×10=0.4,∴可估计分数在区间[60,70)上的人数为2 000×0.4=800.
7.为了鉴定某种节能灯泡的质量,对其中100只节能灯泡的使用寿命进行测量,结果如下表:(单位:小时)
寿命
450
550
600
650
700
只数
20
10
30
15
25
则这些节能灯泡使用寿命的平均数是________.
答案 597.5
解析 这些节能灯泡使用寿命的平均数是
=597.5.
8.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试数学成绩的平均分为________.
答案 71
解析 在频率分布直方图中,所有小长方形的面积和为1,
设[70,80)的小长方形面积为x,则(0.01+0.015×2+0.025+0.005)×10+x=1,
解得x=0.3,即该组频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.
9.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从甲、乙生产的零件中分别抽取40件、60件,甲的平均尺寸为10,方差为20,乙的平均尺寸为12,方差为40.那么全部100件产品的平均尺寸和方差分别是多少?
解 甲机床生产的零件的平均尺寸、方差分别为
甲=10,s=20,
乙机床生产的零件的平均尺寸、方差分别为
乙=12,s=40,
所以100件产品的平均尺寸
===11.2,
所以100件产品的方差
s2=×[40s+60s+×(10-12)2]=×[(40×20+60×40)+24×4]=32.96.
10.某网站从春节期间参与收发网络红包的手机用户中随机抽取2 000名进行调查,将受访用户按年龄分成5组:[10,20),[20,30),…,[50,60],并整理得到如图所示的频率分布直方图.
(1)求a的值;
(2)从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率;
(3)估计春节期间参与收发网络红包的手机用户的平均年龄.
解 (1)根据频率分布直方图可知10×(a+0.005+0.01+0.02+0.03)=1,解得a=0.035.
(2)根据题意,得样本中年龄低于40岁的频率为10×(0.01+0.035+0.03)=0.75,
所以从春节期间参与收发网络红包的手机用户中随机抽取一人,估计其年龄低于40岁的频率为0.75.
(3)根据题意,得春节期间参与收发网络红包的手机用户的平均年龄约为15×0.1+25×0.35+35×0.3+45×0.2+55×0.05=32.5(岁).
11.从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人的成绩的标准差为( )
分数
5
4
3
2
1
人数
20
10
30
30
10
A. B. C.3 D.
答案 B
解析 平均数为=3.
故s2=×[20×(5-3)2+10×(4-3)2+30×(3-3)2+30×(2-3)2+10×(1-3)2]=.
故s==.
12.为了了解某校学生的视力情况,随机抽查了该校的100名学生,得到如图所示的频率分布直方图.由于不慎将部分数据丢失,但知道前4组的频数和为40,后6组的频数和为87.设最大频率为a,视力在4.5到5.2之间的学生人数为b,则a,b的值分别为( )
A.0.27,0.96 B.0.27,96
C.27,0.96 D.27,96
答案 B
解析 由频率分布直方图知组距为0.1,由前4组的频数和为40,后6组的频数和为87,知第4组的频数为40+87-100=27,即视力在4.6到4.7之间的频数最大,为27,故最大频率a=0.27.视力在4.5到5.2之间的频率为1-0.01-0.03=0.96,故视力在4.5到5.2之间的学生人数b=0.96×100=96.
13.某高校有甲、乙两个数学建模兴趣班.其中甲班有40人,乙班有50人.现分析两个班的一次考试成绩,算得甲班的平均成绩是90分,乙班的平均成绩是81分,则该校数学建模兴趣班的平均成绩是________分.
答案 85
解析 由题意得,该校数学建模兴趣班的平均成绩是=85(分).
14.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图,则
(1)这20名工人中一天生产该产品数量在[55,75)的人数是________;
(2)这20名工人一天生产该产品数量的中位数为________;
(3)这20名工人一天生产该产品数量的平均数为________.
答案 (1)13 (2)62.5 (3)64
解析 (1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.
(2)由图可知,中位数在[55,65)范围内.设中位数为x,则0.2+(x-55)×0.04=0.5,解得x=62.5.
(3)0.2×50+0.4×60+0.25×70+0.1×80+0.05×90=64.
15.设矩形的长为a,宽为b,其比满足b∶a=≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:
甲批次:0.598 0.625 0.628 0.595 0.639
乙批次:0.618 0.613 0.592 0.622 0.620
根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确的结论是( )
A.甲批次的总体平均数与标准值更接近
B.乙批次的总体平均数与标准值更接近
C.两个批次总体平均数与标准值接近程度相同
D.两个批次总体平均数与标准值接近程度不能确定
答案 A
解析 计算可得甲批次样本的平均数为0.617,乙批次样本的平均数为0.613,由此估计两个批次的总体平均数分别为0.617,0.613,则甲批次的总体平均数与标准值更接近.故选A.
16.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
10
0.25
[15,20)
24
n
[20,25)
m
p
[25,30]
2
0.05
合计
M
1
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计该校高三年级学生参加社区服务次数的平均数.
解 (1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.
所以10+24+m+2=40,解得m=4,
所以p===0.1,a==0.12.
(2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.
(3)因为n==0.6,
又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25.
所以估计该校高三年级学生参加社区服务次数的平均数是17.25.
人教B版 (2019)必修 第二册5.1.4 用样本估计总体学案: 这是一份人教B版 (2019)必修 第二册5.1.4 用样本估计总体学案,共14页。学案主要包含了课程标准等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体导学案: 这是一份高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体导学案,共17页。学案主要包含了分层抽样的平均数,用样本的分布估计总体的分布等内容,欢迎下载使用。
高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体学案及答案: 这是一份高中数学人教B版 (2019)必修 第二册5.1.4 用样本估计总体学案及答案,共3页。学案主要包含了学习目标,学习重难点,学习过程,学习总结,达标检测等内容,欢迎下载使用。