必修 第二册9.1 随机抽样综合训练题
展开知识精讲
知识点01频率分布直方图
制作频率分布直方图的步骤
(1)求极差;(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.
注意点:
组数太多或太少,都会影响我们了解数据的分布情况.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.决定组距与组数:当样本容量不超过100时,常分成5~12组,为了方便起见,一般取等长组距,并且组距应力求“取整”.
【即学即练1】 从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
解 (1)频率分布表如下,
(2)频率分布直方图如图所示.
(3)学生成绩在[60,90)的频率为(0.2+0.3+0.24)×100%=74%,所以估计成绩在[60,90)的学生比例为74%.
反思感悟 对频率分布直方图的理解
(1)各组频率的和等于1,因此,各小矩形的面积的总和也等于1;
(2)频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律;
(3)横轴表示样本数据,纵轴表示eq \f(频率,组距),这样每一组的频率可以用该组的组距为底、eq \f(频率,组距)为高的小矩形的面积来表示.其中,矩形的高=eq \f(频率,组距)=eq \f(1,组距×样本容量)×频数.
知识点02频率分布直方图的应用
【即学即练2】为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110(含110)以上为达标,则该校高一年级全体学生的达标率约为多少?
解 (1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小,
第二小组的频率为eq \f(4,2+4+17+15+9+3)=0.08.
因为第二小组的频率=eq \f(第二小组的频数,样本容量),
所以样本容量=eq \f(第二小组的频数,第二小组的频率)=eq \f(12,0.08)=150.
(2)由频率分布直方图可知该校高一年级全体学生的达标率约为eq \f(17+15+9+3,2+4+17+15+9+3)×100%=88%.
反思感悟 频率分布直方图的性质
①因为小矩形的面积=组距×eq \f(频率,组距)=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
②eq \f(频数,相应的频率)=样本容量.
③频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
能力拓展
考法01频率分布直方图
【典例1】为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级部分女生身高进行了一次测量,所得数据整理后列出频率分布表如下所示:
(1)求出表中m,n,M,N所表示的数分别是多少?
(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5cm以上的频率.
解 (1)方法一 N=1.00,n=1-(0.02+0.08+0.40+0.30+0.16)=0.04,eq \f(m,0.04)=eq \f(8,0.16),
解得m=2,M=1+4+20+15+8+2=50.
方法二 M=eq \f(1,0.02)=50,m=50-(1+4+20+15+8)=2,N=1.00,n=eq \f(m,M)=eq \f(2,50)=0.04.
(2)作出平面直角坐标系,组距为4,纵轴表示eq \f(频率,组距),横轴表示身高,画出频率分布直方图如图所示.
(3)由频率分布直方图可知,样本中身高在[153.5,157.5)范围内的人数最多,且身高在161.5cm以上的频率为0.16+0.04=0.20,由此可估计全体女生中身高在[153.5,157.5)范围内的人数最多,九年级学生中女生的身高在161.5cm以上的频率约为0.20.
【变式训练】
考法02频率分布直方图的应用
【典例2】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4,
所以从总体的400名学生中随机抽取一人,估计其分数小于70的概率约为0.4.
(2)根据题意可知样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
样本中分数在区间[40,50)内的人数为100-100×0.9-5=5,
所以估计总体中分数在区间[40,50)内的人数约为400×eq \f(5,100)=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为
60×eq \f(1,2)=30,
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2,
所以估计总体中男生和女生人数的比例约为3∶2.
分层提分
题组A基础过关练
1.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
答案 C
解析 用样本频率分布估计总体频率分布时,若总体一定,则样本的容量越大,估计就越精确.
2.一个容量为20的样本数据,分组与频数如表所示:
则样本在[10,50)内的频率为( )
A.0.5B.0.24C.0.6D.0.7
答案 D
解析 因为样本在[10,50)内的频数为2+3+4+5=14,样本容量为20,所以在[10,50)内的频率为eq \f(14,20)=0.7.
3.某地政府调查了工薪阶层1000人的月工资(单位:百元),并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资的满意程度,要用按比例分配分层随机抽样的方法从调查的1000人中抽出100人做电话询访,则应在月工资在区间[30,35)内的工薪阶层中抽出________人.
答案 15
解析 月工资落在区间[30,35)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=0.15,
所以应在月工资在区间[30,35)内的工薪阶层中抽出100×0.15=15(人).
4.为了解今年某校高三毕业班准备报考飞行员的学生的体重(单位:千克)情况,将所得数据整理后,画出频率分布直方图,如图所示,已知图中从左到右的前三个小组的频率之比为1∶2∶3,其中第2小组的频数为12.则该校报考飞行员的总人数为________.
答案 48
解析 设报考飞行员的总人数为n,
设第1小组的频率为a,则有a+2a+3a+(0.013+0.037)×5=1,解得a=0.125,
所以第2小组的频率为0.25.
又第2小组的频数为12,则有0.25=eq \f(12,n),
解得n=48.
题组B能力提升练
1.对于频率分布直方图,下列说法中正确的是( )
A.小长方形的高表示取某数的频率
B.小长方形的高表示该组个体在样本中出现的频数
C.小长方形的高表示该组个体在样本中出现的频率与组距的比
D.小长方形的高表示该组个体在样本中出现的频数与组距的比
答案 C
解析 在频率分布直方图中,各小长方形的面积表示相应各组的频率,小长方形的高表示该组个体在样本中出现的频率与组距的比.
2.从一堆苹果中任取10个,称得它们的质量(单位:克)如下:
125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5)内的频率为( )
A.0.2B.0.3C.0.4D.0.5
答案 C
解析 在125,120,122,105,130,114,116,95,120,134这10个数中,落在[114.5,124.5)内的有116,120,120,122,共4个,
则样本数据落在[114.5,124.5)内的频率为eq \f(4,10)=0.4.
3.在抽查产品尺寸的过程中,将其尺寸分成若干组,[a,b)是其中的一组,该组的频率为m,在频率分布直方图中,该组的小长方形的高为h,则|a-b|等于( )
A.hmB.eq \f(m,h)C.eq \f(h,m)D.h+m
答案 B
解析 eq \f(频率,组距)=h,故|a-b|=组距=eq \f(频率,h)=eq \f(m,h).
4.容量为100的样本数据,按从小到大的顺序分为8组,如下表:
第三组的频数和频率分别是( )
A.14和0.14B.0.14和14
C.eq \f(1,14)和0.14D.eq \f(1,3)和eq \f(1,14)
答案 A
解析 第三组的频数x=100-(10+13+14+15+13+12+9)=100-86=14,频率为eq \f(14,100)=0.14.
5.学校为了调查学生在课外读物方面的支出情况,抽取了一个样本容量为n的样本,其频率分布直方图如图所示,其中支出(单位:元)在[50,60]内的学生有30人,则n的值为( )
A.100B.1000C.90D.900
答案 A
解析 由频率分布直方图可知,
前三组的频率之和为(0.01+0.024+0.036)×10=0.7,
∴支出在[50,60]内的频率为1-0.7=0.3,
∴n=eq \f(30,0.3)=100.
6.(多选)样本容量为100的样本,其数据分布在[2,18]内,将样本数据分为4组:[2,6),[6,10),[10,14),[14,18],得到频率分布直方图如图所示,则下列说法中正确的是( )
A.样本数据分布在[6,10)内的频率为0.32
B.样本数据分布在[10,14)内的频数为40
C.样本数据分布在[2,10)内的频数为40
D.估计总体数据大约有10%分布在[10,14)内
答案 ABC
解析 对于A,由题图可得,样本数据分布在[6,10)内的频率为0.08×4=0.32,故A正确;对于B,由题图可得,样本数据分布在[10,14)内的频数为100×0.1×4=40,故B正确;对于C,由题图可得,样本数据分布在[2,10)内的频数为100×(0.02+0.08)×4=40,故C正确;对于D,由题图可估计,总体数据分布在[10,14)内的比例约为0.1×4=0.4=40%,故D错误.
7.在样本的频率分布直方图中,共有5个小长方形,已知中间一个小长方形面积是其余4个小长方形面积之和的eq \f(1,3),且中间一组的频数为10,则样本容量是______.
答案 40
解析 设中间长方形的面积为x,样本容量为n.
由题意得x=eq \f(1,3)(1-x),解得x=eq \f(1,4),即中间一组的频率为eq \f(1,4),∴eq \f(10,n)=eq \f(1,4),解得n=40.
8.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是________.
答案 90
解析 ∵样本中产品净重小于100克的频率为
(0.050+0.100)×2=0.3,频数为36,
∴样本容量为eq \f(36,0.3)=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.
9.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试计算样本在[40,50),[50,60)内的数据个数之和.
解 根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.
∵样本中数据在[20,60)内的频率为0.6,样本容量为50,
∴eq \f(4+5+x+y,50)=0.6,
解得x+y=21.
即样本在[40,50),[50,60)内的数据个数之和为21.
10.从全校参加期末考试的试卷中抽取一个样本,考察成绩(均为整数,单位:分)的分布,将样本分成5组,绘成频率分布直方图如图所示,从左到右各小组的小矩形的高之比为2∶3∶6∶4∶1,最左边的一组频数为6.
(1)求样本容量;
(2)求105.5~120.5这一组的频数及频率;
(3)如果成绩大于120分为优秀,估计这次考试成绩的优秀率.
解 在频率分布直方图中频数之比等于频率之比且样本的所有频率之和等于1.
(1)小矩形的高之比为频率之比,
∴从左到右各小组的频率之比为2∶3∶6∶4∶1,
∴最左边的一组所占的频率为eq \f(2,2+3+6+4+1)=eq \f(1,8),
∴样本容量=eq \f(频数,频率)=eq \f(6,\f(1,8))=48.
(2)105.5~120.5这一组的频率为eq \f(6,2+3+6+4+1)=eq \f(3,8),
∴频数为48×eq \f(3,8)=18.
(3)成绩大于120分的频率为eq \f(4+1,2+3+6+4+1)=eq \f(5,16),
∴考试成绩的优秀率约为eq \f(5,16)×100%=31.25%.
题组C培优拔尖练
11.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )
A.588B.480C.450D.120
答案 B
解析 ∵少于60分的学生人数为600×(0.05+0.15)=120,
∴不少于60分的学生人数为600-120=480.
12.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是( )
A.32,0.4B.8,0.1C.32,0.1D.8,0.4
答案 A
解析 样本数据落在[6,10)内的频率为0.08×4=0.32,则a=100×0.32=32;样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b=0.08+0.32=0.4.
13.(多选)供电部门对某社区1000位居民12月份人均用电情况进行统计后,按人均用电量分为[0,10),[10,20),[20,30),[30,40),[40,50]五组,整理得到如下的频率分布直方图,则有关这1000位居民,下列说法正确的是( )
A.12月份人均用电量人数最多的一组有400人
B.12月份人均用电量在[20,30)内的有300人
C.12月份人均用电量不低于20度的有500人
D.在这1000位居民中任选1位协助收费,选到的居民用电量在[30,40)一组的概率为eq \f(1,20)
答案 ABC
解析 根据频率分布直方图知,12月份人均用电量人数最多的一组是[10,20),有1000×
0.04×10=400(人),A正确;12月份人均用电量在[20,30)内的人数为1000×0.03×10=300,B正确;12月份人均用电量不低于20度的频率是(0.03+0.01+0.01)×10=0.5,有1000×0.5=500(人),C正确;用电量在[30,40)内的有0.01×10×1000=100(人),所以1000位居民中任选1位,选到的居民用电量在[30,40)一组的概率为eq \f(100,1 000)=eq \f(1,10),D错误.故选ABC.
14.为了解某地居民的月收入情况,一个社会调查机构调查了20000人,并根据所得数据画出样本的频率分布直方图如图所示(最后一组包含两端值,其他组包含最小值,不包含最大值).现按月收入分层,用按比例分配分层随机抽样的方法在这20000人中抽出200人进一步调查,则月收入(单位:元)在[1500,2000)内的应抽取________人.
答案 40
解析 月收入在[1500,2000)内的频率为1-(0.0002+0.0005×2+0.0003+0.0001)×500=0.2,故应抽取200×0.2=40(人).
15.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图如图所示,其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则
(1)图中的x=________;
(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.
答案 (1)0.0125 (2)72
解析 (1)由频率分布直方图知20x=1-20×(0.025+0.0065+0.003+0.003),
解得x=0.0125.
(2)上学时间不少于1小时的学生的频率为0.003×2×20=0.12,因此估计该校600名新生中约有0.12×600=72(人)可以申请住宿.
16.某电视台随机在本省内15~65岁的人群中抽取n人回答问题“本省内著名旅游景点有哪些”,统计结果如图表所示.
(1)分别求出a,b,x,y的值;
(2)从第2,3,4组回答正确的人中用按比例分配分层随机抽样的方法抽取6人,求第2,3,4组每组各抽取多少人?
解 (1)由频率分布表中第4组数据可知,第4组总人数为eq \f(9,0.36)=25,再结合频率分布直方图可知
n=eq \f(25,0.025×10)=100,
所以a=100×0.01×10×0.5=5,
b=100×0.03×10×0.9=27,
x=eq \f(18,0.02×10×100)=0.9,y=eq \f(3,0.015×10×100)=0.2.
(2)第2,3,4组回答正确的共有18+27+9=54(人).
利用按比例分配分层随机抽样在54人中抽取6人,所以第2组抽取eq \f(18,54)×6=2(人);第3组抽取eq \f(27,54)×6=3(人);第4组抽取eq \f(9,54)×6=1(人).课程标准
课标解读
1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.
收集数据是为了寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.
成绩分组
频数累计
频数
频率
[40,50)
2
0.04
[50,60)
3
0.06
[60,70)
10
0.2
[70,80)
15
0.3
[80,90)
12
0.24
[90,100]
8
0.16
合计
50
1.00
分组
频数
频率
[145.5,149.5)
1
0.02
[149.5,153.5)
4
0.08
[153.5,157.5)
20
0.40
[157.5,161.5)
15
0.30
[161.5,165.5)
8
0.16
[165.5,169.5]
m
n
合计
M
N
分组
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
[60,70]
频数
2
3
4
5
4
2
组号
1
2
3
4
5
6
7
8
频数
10
13
x
14
15
13
12
9
组号
分组
回答正确的人数
回答正确的人数占本组的频率
第1组
[15,25)
a
0.5
第2组
[25,35)
18
x
第3组
[35,45)
b
0.9
第4组
[45,55)
9
0.36
第5组
[55,65]
3
y
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体测试题: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体测试题,文件包含人教A版高中数学必修第二册同步讲义第41讲总体离散程度的估计原卷版doc、人教A版高中数学必修第二册同步讲义第41讲总体离散程度的估计含解析doc等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。
高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体练习: 这是一份高中数学人教A版 (2019)必修 第二册9.2 用样本估计总体练习,文件包含人教A版高中数学必修第二册同步讲义第40讲总体集中趋势的估计原卷版doc、人教A版高中数学必修第二册同步讲义第40讲总体集中趋势的估计含解析doc等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。
高中数学9.2 用样本估计总体复习练习题: 这是一份高中数学9.2 用样本估计总体复习练习题,文件包含人教A版高中数学必修第二册同步讲义第39讲总体百分位数的估计原卷版doc、人教A版高中数学必修第二册同步讲义第39讲总体百分位数的估计含解析doc等2份试卷配套教学资源,其中试卷共24页, 欢迎下载使用。