


所属成套资源:高考数学一轮复习讲义
高考数学一轮复习讲义第11章第2节用样本估计总体
展开
这是一份高考数学一轮复习讲义第11章第2节用样本估计总体,共16页。
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离.
(2)标准差:
s=eq \r(\f(1,n)[x1-\x\t(x)2+x2-\x\t(x)2+…+xn-\x\t(x)2]).
(3)方差:s2=eq \f(1,n)[(x1-eq \x\t(x))2+(x2-eq \x\t(x))2+…+(xn-eq \x\t(x))2](xn是样本数据,n是样本容量,eq \x\t(x)是样本平均数).
【知识拓展】
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为eq \x\t(x),那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是meq \x\t(x)+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
【思考辨析】
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ )
(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )
(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ )
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × )
1.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5B.91.5和92
C.91和91.5D.92和92
答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是eq \f(91+92,2)=91.5,
平均数eq \x\t(x)=eq \f(87+89+90+91+92+93+94+96,8)=91.5.
2.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A.93B.123C.137D.167
答案 C
解析 由题干扇形统计图可得该校女教师人数为110×70%+150×(1-60%)=137.故选C.
3.(2016·四川宜宾模拟)若数据x1,x2,x3,…,xn的平均数为eq \x\t(x)=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为( )
A.5,2B.16,2
C.16,18D.16,9
答案 C
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴eq \f(x1+x2+x3+…+xn,n)=5,
∴eq \f(3x1+3x2+3x3+…+3xn,n)+1=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
4.(2016·江苏)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.
答案 0.1
解析 eq \x\t(x)=eq \f(4.7+4.8+5.1+5.4+5.5,5)=5.1,
则方差s2=eq \f(1,5)[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.
5.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.
答案 24
解析 底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100cm的株数为(0.15+0.25)×60=24.
题型一 频率分布直方图的绘制与应用
例1 (2016·北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.
解 (1)如图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即该市居民该月的人均水费估计为10.5元.
思维升华 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均数及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)如图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均数高于A地区用户满意度评分的平均数;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
题型二 茎叶图的应用
例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温;
②甲地该月14时的平均气温高于乙地该月14时的平均气温;
③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;
④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.
其中根据茎叶图能得到的统计结论的编号为( )
A.①③B.①④C.②③D.②④
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )
A.2,5B.5,5C.5,8D.8,8
答案 (1)B (2)C
解析 (1)甲地5天的气温为26,28,29,31,31,
其平均数为eq \x\t(x)甲=eq \f(26+28+29+31+31,5)=29;
方差为seq \\al(2,甲)=eq \f(1,5)[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;
标准差为s甲=eq \r(3.6).
乙地5天的气温为28,29,30,31,32,
其平均数为eq \x\t(x)乙=eq \f(28+29+30+31+32,5)=30;
方差为seq \\al(2,乙)=eq \f(1,5)[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;
标准差为s乙=eq \r(2).
∴eq \x\t(x)甲<eq \x\t(x)乙,s甲>s乙.
(2)由茎叶图及已知得x=5,又乙组数据的平均数为16.8,即eq \f(9+15+10+y+18+24,5)=16.8,解得y=8.
引申探究
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好.
解 由原题可知x=5,
则甲组平均数为eq \f(9+12+15+24+27,5)=17.4.
而乙组平均数为16.8,所以甲组成绩较好.
2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差.
解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24.
故中位数为18,众数为18.
②s2=eq \f(1,5)[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2]=23.76.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(1)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:
则7个剩余分数的方差为( )
A.eq \f(116,9)B.eq \f(36,7)C.36D.eq \f(6\r(7),7)
答案 (1)A (2)B
解析 (1)由于频率分布直方图的组距为5,排除C、D,又[0,5),[5,10)两组各一人,排除B,应选A.
(2)由题意知eq \f(87+94+90+91+90+90+x+91,7)=91,解得x=4.所以s2=eq \f(1,7)[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]
=eq \f(1,7)(16+9+1+0+1+9+0)=eq \f(36,7).
题型三 用样本的数字特征估计总体的数字特征
例3 (1)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.
答案 2
解析 eq \x\t(x)甲=eq \f(1,5)(87+91+90+89+93)=90,
eq \x\t(x)乙=eq \f(1,5)(89+90+91+88+92)=90,
seq \\al(2,甲)=eq \f(1,5)[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4,
seq \\al(2,乙)=eq \f(1,5)[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.
(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
①分别求出两人得分的平均数与方差;
②根据图和上面算得的结果,对两人的训练成绩作出评价.
解 ①由图象可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
eq \x\t(x)甲=eq \f(10+13+12+14+16,5)=13;
eq \x\t(x)乙=eq \f(13+14+12+12+14,5)=13,
seq \\al(2,甲)=eq \f(1,5)[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;
seq \\al(2,乙)=eq \f(1,5)[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
②由seq \\al(2,甲)>seq \\al(2,乙),可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2016·全国乙卷)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得以下柱状图:
记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.
(1)若n=19,求y与x的函数解析式;
(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;
(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?
解 (1)当x≤19时,y=3800;
当x>19时,y=3800+500(x-19)=500x-5700.
所以y与x的函数解析式为
y=eq \b\lc\{\rc\ (\a\vs4\al\c1(3800,x≤19,,500x-5700,x>19))(x∈N).
(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.
(3)若每台机器在购机的同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3800元,20台的费用为4300元,10台的费用为4800元,因此这100台机器在购买易损零件上所需费用的平均数为
eq \f(1,100)(3800×70+4300×20+4800×10)=4000(元),
若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4000元,10台的费用为4500元,因此这100台机器在购买易损零件上所需费用的平均数为
eq \f(1,100)(4000×90+4500×10)=4050(元).
比较两个平均数可知,购买1台机器的同时应购买19个易损零件.
9.高考中频率分布直方图的应用
考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
典例 (12分)(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
规范解答
解 (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.[3分]
由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.[5分]
(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.[8分]
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.
而前4组的频率之和为
0.04+0.08+0.15+0.21=0.48
