北师大版 (2019)必修 第一册第六章 统计3 用样本估计总体分布3.2 频率分布直方图优质教案设计
展开3.2 频率分布直方图
1.频率分布直方图
频率分布直方图中每个矩形的底边长是该组的组距,矩形的高是该组的频率与组距的比,从而矩形的面积等于这个组的频率,即矩形的面积=组距× eq \f(频率,组距)=频率.我们把这样的图叫作频率分布直方图.频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小.
2.频率分布直方图的应用
当考虑数据落在若干个组内的频率之和时,可以用相应矩形面积之和来表示.
3.画频率分布直方图的步骤
(1)计算极差:即一组数据中最大值和最小值的差;
(2)确定组距与组数:当数据在120个以内时,通常按照数据的多少分成5~12组,在实际操作中,一般要求各组的组距相等.
(3)分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.
(4)列表:一般分四列:宽度分组、频数、频率、 eq \f(频率,组距).其中频数合计应是样本容量,频率合计是1.
(5)画频率分布直方图:画图时,应以横轴表示分组,纵轴表示 eq \f(频率,组距),其相应组距上的频率等于该组上的小长方形的面积.即每个小长方形的面积=组距× eq \f(频率,组距)=频率.
4.频率折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.有时也用它来估计总体的分布情况.
随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
思考:1.为什么需要用频率分布直方图对原始数据进行整理?
[提示] 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.正因为如此我们才用频率分布直方图来整理数据.
2.为什么要对样本数据进行分组?
[提示] 不分组很难看出样本中的数字所包含的信息,分组后,计算出频率,从而估计总体的分布特征.
1.如图所示是一容量为100的样本的频率分布直方图,则由图中的数据可知,样本落在[15,20]内的频数为( )
A.20 B.30 C.40 D.50
B [样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.]
2.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
D [由题意知,共20个数据,频率为0.2,在此范围内的数据有20×0.2=4个,只有在11.5~13.5范围内有4个数据:13,12,12,12,故选D.]
3.某地为了了解该地区10 000户家庭的用电情况,采用分层随机抽样的方法抽取了500户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图如图所示,则该地区10 000户家庭中月平均用电度数在[70,80)的家庭有________户.
1 200 [根据频率分布直方图得该地区10 000户家庭中月平均用电度数在[70,80)的家庭有10 000×0.012×10=1 200(户).]
频率分布直方图的绘制
【例1】 考察某校初二年级男生的身高,随机抽取40名初二男生,实测身高数据(单位:cm)如下:
171 163 163 166 166 168 168 160 168 165
171 169 167 169 151 168 170 160 168 174
165 168 174 159 167 156 157 164 169 180
176 157 162 161 158 164 163 163 167 161
(1)作出频率分布表;
(2)画出频率分布直方图和频率折线图.
[解] (1)最低身高151,最高身高180,它们的极差为180-151=29.
确定组距为3,组数为10,列表如下:
(2)频率分布直方图和频率折线图如图所示.
绘制频率分布直方图应注意的问题
(1)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度是不一致的,合理的定高方法是“以一个恰当的单位长度”(没有统一规定),然后以各组的“ eq \f(频率,组距)”所占的比例来定高.如我们预先设定以“”为1个单位长度,代表“0.1”,则若一个组的 eq \f(频率,组距)为0.2,则该小矩形的高就是“”(占两个单位长度),如此类推.
(2)数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.
eq \a\vs4\al([跟进训练])
1.如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).
(1)列出样本频率分布表;
(2)画出频率分布直方图;
(3)估计身高小于134 cm的人数占总人数的百分比.
[解] (1)样本频率分布表如下:
(2)其频率分布直方图如下:
(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.
频率分布直方图的应用
【例2】 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?
[解] (1)第二小组的频率为 eq \f(4,2+4+17+15+9+3)=0.08.
又因为第二小组的频率= eq \f(第二小组的频数,样本容量),
所以样本容量= eq \f(第二小组的频数,第二小组的频率)= eq \f(12,0.08)=150.
(2)由直方图可估计该校高一年级学生的达标率为 eq \f(17+15+9+3,2+4+17+15+9+3)×100%=88%.
频率分布直方图的性质
(1)因为小矩形的面积=组距× eq \f(频率,组距)=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
(2)在频率分布直方图中,各小矩形的面积之和等于1.
(3)样本容量= eq \f(频数,相应的频率).
eq \a\vs4\al([跟进训练])
2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
D [由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,故每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]
频率分布与数字特征的综合应用
[探究问题]
1.什么是一组数据的众数,中位数,平均数?
提示:设一组数据为x1,x2,…,xn,则其中出现次数最多的数是众数,把这n个数据按照从小到大的顺序排列,最“中间”的数就是中位数,即当n为奇数时,中间的一个数就是本组数据的中位数;当n为偶数时,中间的两个数的平均数就是本组数据的中位数.
本组数据的平均数 eq \x\t(x)= eq \f(x1+x2+…+xn,n).
2.如何利用频率分布直方图估计数据的众数、中位数和平均数?
提示:(1)众数是最高的矩形的底边的中点;
(2)中位数左右两侧小矩形的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
【例3】 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组,绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
[思路点拨] (1)根据频率分布直方图的数据,最高小矩形的底边中点就是数据的众数,数据的中位数左右两边的面积和相等,都等于0.5;
(2)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[解] (1)由题图可知众数为65,又∵第一个小矩形的面积为0.3,∴设中位数为60+x,
则0.3+x×0.04=0.5,得x=5,∴中位数为60+5=65.
(2)依题意, eq \x\t(x)=55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67,∴平均成绩约为67分.
1.在本例中若高一参赛学生的人数为1 000,若规定成绩不低于80分者为优秀选手,那么高一年级参赛学生中共有多少名优秀选手?
[解] 由频率分布直方图可知,高一年级参赛学生中的优秀选手共有1 000×10(0.005+0.01)=150(名).
2.若本例中的频率分布直方图换为下图.
(1)求图中的数字;
(2)根据频率分布直方图估计该组数据的中位数.
[解] (1)由10(0.005+a+0.025+0.035+0.01+0.01)=1,解得a=0.015.
(2)由频率分布直方图可知第1组的频率为0.05,第2组的频率为0.15,第3组的频率为0.25,第4组的频率为0.35,所以设该组数据的中位数为70+x,
则0.45+x×0.035=0.5,得x≈1.43,∴中位数为70+1.43=71.43.
1.利用频率分布直方图估计数字特征
(1)众数是最高的矩形的底边的中点;
(2)中位数左右两侧小矩形的面积相等;
(3)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
2.利用直方图求众数、中位数、平均数均为估计值,与实际数据可能不一致.
1.总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.
2.当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
3.绘制频率分布直方图的步骤:
(1)计算极差,(2)决定组距与组数,(3)分组,(4)列频率分布表,(5)绘制频率分布直方图.
1.思考辨析(正确的画“√”,错误的画“×”)
(1)频率分布直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值.( )
(2)频率分布直方图中小矩形的面积表示该组的个体数.( )
(3)频率分布直方图中所有小长方形面积之和为1.( )
[提示] (1)正确.
(2)错误.频率分布直方图中小矩形的面积表示该组的频率.
(3)正确.
[答案] (1)√ (2)× (3)√
2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.6 B.8 C.12 D.18
C [志愿者的总人数为 eq \f(20,(0.24+0.16)×1)=50,所以第三组人数为50×0.36×1=18,
所以有疗效的人数为18-6=12.]
3.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示.
已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
100 0.15 [设参赛的人数为n,第二小组的频率为0.4,依题意 eq \f(40,n)=0.4,
∴n=100,优秀的频率=0.10+0.05=0.15.]
4.随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求频率分布直方图中x的值及身高在170 cm以上的学生人数;
(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.
[解] (1)由频率分布直方图可知5×(0.01+0.02+0.04+x+0.07)=1,
解得x=0.06.身高在170 cm以上的学生人数为100×(0.06×5+0.04×5+0.02×5)=60(人).
(2)A组人数为100×0.06×5=30(人),
B组人数为100×0.04×5=20(人),
C组人数为100×0.02×5=10(人),
由题意可知抽样比k= eq \f(6,60)= eq \f(1,10),
故应从A,B,C三组中分别抽取30× eq \f(1,10)=3(人),20× eq \f(1,10)=2(人),10× eq \f(1,10)=1(人).学 习 目 标
核 心 素 养
1.学会用频率分布表,画频率分布直方图表示样本数据.(重点)
2.能通过频率分布表或频率分布直方图对数据做出总体统计.(难点、易混点)
1.通过对频率分布直方图画法的学习,培养数据分析素养.
2.通过与频率分布直方图有关的计算,培养数学运算素养.
身高分组
频数
频率
eq \f(频率,组距)
[150.5,153.5)
1
0.025
0.008 3
[153.5,156.5)
1
0.025
0.008 3
[156.5,159.5)
4
0.1
0.033 3
[159.5,162.5)
5
0.125
0.041 7
[162.5,165.5)
8
0.2
0.066 7
[165.5,168.5)
11
0.275
0.091 7
[168.5,171.5)
6
0.15
0.05
[171.5,174.5)
2
0.05
0.016 7
[174.5,177.5)
1
0.025
0.008 3
[177.5,180.5]
1
0.025
0.008 3
区间界限
[122,126)
[126,130)
[130,134)
[134,138)
[138,142)
人数
5
8
10
22
33
区间界限
[142,146)
[146,150)
[150,154)
[154,158]
人数
20
11
6
5
分组
频数
频率
[122,126)
5
0.04
[126,130)
8
0.07
[130,134)
10
0.08
[134,138)
22
0.18
[138,142)
33
0.28
[142,146)
20
0.17
[146,150)
11
0.09
[150,154)
6
0.05
[154,158]
5
0.04
合计
120
1.00
2024年高考数学重难点突破讲义:学案 特别策划2 微切口1 频率分布直方图的分析与应用: 这是一份2024年高考数学重难点突破讲义:学案 特别策划2 微切口1 频率分布直方图的分析与应用,共6页。
高中数学6.4 用样本估计总体导学案及答案: 这是一份高中数学6.4 用样本估计总体导学案及答案,共14页。
湘教版(2019)必修 第一册6.4 用样本估计总体导学案: 这是一份湘教版(2019)必修 第一册6.4 用样本估计总体导学案,共9页。