最高考文数考点一遍过(讲义) 考点41 用样本估计总体
展开课本上和老师讲解的例题,一般都具有一定的典型性和代表性。要认真研究,深刻理解,要透过“样板”,学会通过逻辑思维,灵活运用所学知识去分析问题和解决问题,特别是要学习分析问题的思路、解决问题的方法,并能总结出解题的规律。
2、精练习题
复习时不要搞“题海战术”,应在老师的指导下,选一些源于课本的变式题,或体现基本概念、基本方法的基本题,通过解题来提高思维能力和解题技巧,加深对所学知识的深入理解。在解题时,要独立思考,一题多思,一题多解,反复玩味,悟出道理。
3、加强审题的规范性
每每大考过后,总有同学抱怨没考好,纠其原因是考试时没有注意审题。审题决定了成功与否,不解决这个问题势必影响到高考的成败。那么怎么审题呢? 应找出题目中的已知条件 ;善于挖掘题目中的隐含条件 ;认真分析条件与目标的联系,确定解题思路 。
4、重视错题
“错误是最好的老师”,但更重要的是寻找错因,及时进行总结,三五个字,一两句话都行,言简意赅,切中要害,以利于吸取教训,力求相同的错误不犯第二次。
专题41 用样本估计总体
用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
一、数字特征
1.众数、中位数、平均数
2.极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:.
标准差:.
注:平均数反映了数据取值的平均水平,方差和标准差反映了数据波动程度的大小.标准差、方差越大,数据的离散程度越大,越波动;标准差、方差越小,数据的离散程度越小,越稳定.
3.性质
(1)若的平均数为,那么的平均数为.
(2)数据与数据的方差相等,即数据经过平移后方差不变.
(3)若的方差为s2,那么的方差为.
二、茎叶图
1.定义
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
2.表示方法
(1)对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.
(2)对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎.
三、统计表
1.频率分布直方图
(1)画频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图(以横轴表示样本分组,纵轴表示频率与组距的比值).
(2)频率分布直方图的性质
①落在各小组内的频率用各小长方形的面积表示,且各小长方形的面积的和等于1.
②频率分布直方图与众数、中位数与平均数的关系
A.最高的小长方形底边中点的横坐标即是众数;
B.中位数左边和右边的小长方形的面积和是相等的;
C.平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.各种统计表的优点与不足
考向一 数字特征的应用
明确数字特征的意义:
平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
典例1 为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为x,则m,n,x的大小关系为________.(用“<”连接)
【答案】n
=(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.
故n
A.平均数为20,方差为8B.平均数为20,方差为10
C.平均数为21,方差为8D.平均数为21,方差为10
2.已知一组数据3,5,7,x,10的平均数为6,则这组数据的方差为
A.B.6
C.D.5
考向二 茎叶图的应用
茎叶图中的三个关注点:
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
茎叶图的优、缺点:
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示,其缺点是当样本容量较大时,作图较繁琐.
典例2 为了了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示,如图所示.
据此可估计上学期该校400名教师中,使用多媒体进行教学次数在[16,30)内的人数为
A.100 B.160
C.200 D.280
【答案】B
【解析】由茎叶图,可知在20名教师中,上学期使用多媒体进行教学的次数在[16,30)内的人数为8,据此可以估计400名教师中,使用多媒体进行教学的次数在[16,30)内的人数为400×eq \f(8,20)=160.
3.第十一届全国少数民族传统体育运动会将于2019年9月8日至16日在郑州举行.如下图所示的茎叶图是两位选手在运动会前期选拔赛中的比赛得分,则下列说法正确的是
A.甲的平均数大于乙的平均数 B.甲的中位数大于乙的中位数
C.甲的方差大于乙的方差 D.甲的极差小于乙的极差
4.如图,茎叶图表示甲、乙两人在次测验中的数学分数,其中有一个被污损,若乙的中位数恰好等于甲的平均数,则的值为_________.
考向三 频率分布直方图的应用
频率分布直方图是用样本估计总体的一种重要方法,是高考命题的一个热点,多以选择题或填空题的形式呈现,试题难度不大,多为容易题或中档题,且主要有以下几个命题角度:
(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.
(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.
(3)与概率有关的综合问题,可先求出频率,再利用古典概型等知识求解.
典例3 某商店为调查进店顾客的消费水平,调整营销思路,统计了一个月来进店的2000名顾客的消费金额(单位:元),并从中随机抽取了100名顾客的消费金额按[0,50],(50,100],(100,150],(150,200],(200,250]进行统计,得到如图所示的频率分布直方图.已知a,b,c成等差数列,则该商店这一个月来消费金额超过150元的顾客数量约为
A.600B.30
C.60D.300
【答案】A
【解析】因为a,b,c成等差数列,所以2b=a+c,
由频率分布直方图可得a+b+c=150-(0.002+0.006)=0.012,所以b=0.004.
故消费金额超过150元的频率为(b+0.002)×50=0.3.
故该商店这一个月来消费金额超过150元的顾客数量约为2000×0.3=600.
故选A.
5.统计某校名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:
,得到频率分布直方图如图所示,若不低于140分的人数为110.
①; ②;
③100分的人数为60; ④分数在区间的人数占大半.
则说法正确的是
A.①②B.①③
C.②③D.②④
典例4 为了增强学生的环保意识,某中学随机抽取了50名学生举行了一次环保知识竞赛,并将本次竞赛的成绩(得分均为整数,满分100分)进行整理,制成下表:
(1)作出被抽查学生成绩的频率分布直方图;
(2)若从成绩在[40,50)中选1名学生,从成绩在[90,100]中选2名学生,共3名学生召开座谈会,求[40,50)组中学生A1和[90,100]组中学生B1同时被选中的概率.
【解析】(1)由题意可知,各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,所以图中各组的纵坐标分别为:0.004,0.006,0.028,0.030,0.024,0.008,则被抽查学生成绩的频率分布直方图如图所示:
(2)记[40,50)组中的学生为A1,A2,
[90,100]组中的学生为B1,B2,B3,B4,
A1和B1同时被选中记为事件M.
由题意可得,全部的基本事件为:
A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,
事件M包含的基本事件为:A1B1B2,A1B1B3,A1B1B4,共3个,
所以学生A1和B1同时被选中的概率为P(M)==.
6.伴随着科技的迅速发展,国民对“5G”一词越来越熟悉,“5G”全称是第五代移动电话行动通信标准,也称第五代移动通信技术.2017年12月10日,工信部正式对外公布,已向中国电倌、中国移动、中国联通发放了5G系统中低频率使用许可.2019年2月18日上海虹桥火车站正式启动5G网络建设.为了了解某市市民对“5G”的关注情况,通过问卷调查等方式研究市民对该市300万人口进行统计分析,数据分析结果显示:约60%的市民“掌握一定5G知识(即问卷调查分数在80分以上)”,将这部分市民称为“5G爱好者”.某机构在“5G爱好者”中随机抽取了年龄在15-45岁之间的100人按照年龄分布(如图所示),其分组区间为:,,,,,.
(1)求频率分布直方图中的a的值;
(2)估计全市居民中35岁以上的“5G爱好者”的人数;
(3)若该市政府制定政策:按照年龄从小到大,选拔45%的“5G爱好者”进行5G的专业知识深度培养,按照上述政策及频率分布直方图,估计该市“5G爱好者”的年龄上限.
1.有下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有
A.0个 B.1个
C.2个 D.3个
2.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是
A.A县 B.B县
C.A县、B县两个地区相等 D.无法确定
3.某仪器厂从新生产的一批零件中随机抽取40个检测.如图是根据抽样检测后零件的质量(单位:克)绘制的频率分布直方图,样本数据分8组,分别为[80,82)、[82,84),[84,86)、[86,88)、[88,90)、[90,92)、[92,94)、[94,96],则样本的中位数在
A.第3组 B.第4组
C.第5组 D.第6组
4.在如图所示的茎叶图中,有一个数字模糊不清,但某同学曾经计算得到该组数据的极差与中位数之和为61,则模糊不清的数字为
A.1B.2
C.3D.4
5.某人为了检测自己的解题速度,记录了5次解题所花的时间(单位:分)分别为,已知这组数据的平均数为55,方差为,则
A.1分B.2分
C.3分D.4分
6.一次数学考试后,某老师从自己所带的两个班级中各抽取6人,记录他们的考试成绩,得到如图所示的茎叶图.已知甲班6名同学成绩的平均数为82,乙班6名同学成绩的中位数为77,则
A.3 B.
C.4 D.
7.在某次高中数学竞赛中,随机抽取90名考生,其分数如图所示,若所得分数的平均数,众数,中位数分别为a,b,c,则a,b,c的大小关系为
A.bC.c8.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取的学生进行调查,则样本容量和抽取的高中生近视人数分别为
A.100,10B.100,20
C.200,10D.200,20
9.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若,由图中可知,身高落在范围内的学生人数是
A.35B.24
C.46D.65
10.为普及校园安全知识,某校举行了由全部学生参加的校园安全知识考试,从中抽出60名学生,将其成绩分成六段[40,50),[50,60),…,[90,100]后画出如图所示的频率分布直方图.观察图形的信息,估计这次考试的及格率(60分及以上为及格)、平均分分别为
A.75%,71B.80%,85
C.85%,90D.70%,65
11.某赛季甲、乙两名篮球运动员每场比赛的得分如茎叶图所示,则下列结论错误的是
A.乙运动员得分的中位数是36
B.甲运动员发挥的稳定性比乙运动员发挥的稳定性差
C.甲运动员的平均分为27分
D.乙运动员的得分有集中在茎3上
12.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10天,每天新增疑似病例不超过7人”,根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是
A.甲地:总体均值为3,中位数为4
B.乙地:总体均值为1,总体方差大于0
C.丙地:总体均值为2,总体方差为3
D.丁地:中位数为2,众数为3
13.一个样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,则这个样本的方差是
A.3 B.4
C.5 D.6
14.某网店在2019年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:(0,1],(1,2],(2,3],(3,4],(4,5],(5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的35,则消费金额超过4千元的人数为
A.12B.15
C.16D.18
15.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为,则
A.B.
C.D.
16.某市安踏专卖店为了了解某日旅游鞋的销售情况,抽取了部分顾客所购旅游鞋的尺寸,将所得数据整理后,画出频率分布直方图.已知从左到右前3个小组的频率之比为1∶2∶3,第4小组与第5小组的频率分布直方图如图所示,第2小组的频数为10,则第5小组的频数是
A.4B.5
C.8D.10
17.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是
A.成绩在分的考生人数最多B.不及格的考生人数为1000人
C.考生竞赛成绩的平均分约70.5分D.考生竞赛成绩的中位数为75分
18.某次知识竞赛中,五个参赛小队的初始积分都是50,在答题过程中,各小队每答对一题可使本队积分增加5,每答错一题本队积分不变,若答题过程中五个小队答对的题数分别是4,7,6,2,5,则这五个小队积分的方差为 .
19.某市为了增加2020届高三毕业生对各著名高校的了解,从而调动他们的学习动力,利用2019年暑假组织部分有意愿的学生赴部分大学参加夏令营,各大学夏令营的天数都在[2,12]内,现从中抽出100名学生,统计他们参加夏令营的天数,绘制成如图所示的频率分布直方图,则这100名学生中参加夏令营的天数在[6,10)的人数为 .
20.某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则+的最小值为________.
21.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久的历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份的含量(单位:g)与药物功效(单位:药物单位)之间具有关系:.检测这种药品一个批次的5个样本,得到成份的平均值为8g,标准差为2g,估计这批中成药的药物功效的平均值为_____________药物单位.
22.为组织好第十一届全国少数民族传统体育运动会,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:
(1)年龄在[25,30)内对应小长方形的高度为______________;
(2)这800名志愿者中年龄在[25,35)内的人数为______________.
23.某届马拉松招聘志愿者,报名者首先进入笔试,按笔试成绩选出参加面试的人员,最后确定入选名单.现从报名的所有人中按男女比例采用分层抽样的方式抽取了100名,统计了他们的笔试成绩(满分100分),统计结果见如下所示的频率分布表,其中分数在区间[90,100]内的人员直接进入面试阶段,若分数在区间[80,90)内,则需要进行短期的培训后,再参加第二次笔试,从而确定能否参加面试.
(1)求a与b的值,并作出频率分布直方图;
(2)(i)根据表中数据,估计这100名人员笔试成绩的中位数 (精确到小数点后1位);
(ii)分析知,这100名人员在各分数段内的男女比例如下表所示,那么若以频率分布表中的频率近似作为概率,在总共2000名参考人员中,求经过第一次考试就可直接进入面试的男女人数的估计值.
24.随着科技发展,手机成了人们日常生活中必不可少的通信工具,现在的中学生几乎都拥有了属于自己的手机了.为了调查某地区高中生一周使用手机的频率,某机构随机调查了该地区100名高中生某一周使用手机的时间(单位:小时),所取样本数据分组区间为[0,2)、[2,4)、[4,6)、[6,8)、[8,10)、[10,12),由此得到如图所示的频率分布直方图.
(1)求a的值并估计该地区高中生一周使用手机时间的平均值;
(2)从使用手机时间在[6,8)、[8,10)、[10,12)、[12,14]的四组学生中,用分层抽样方法抽取13人,则每层各应抽取多少人?
25.某校高一某班的一次数学测试成绩的茎叶图和频率分布直方图因事故都受到不同程度的损坏,但可见部分如下,据此解答如下问题:
(1)求分数在[50,60)的频率及全班人数;
(2)求分数在[80,90)的频数,并计算频率分布直方图中[80,90)间的矩形的高;
(3)若规定:90分(包含90分)以上为优秀,现从分数在80分(包含80分)以上的试卷中任取两份分析学生失分情况,求在抽取的试卷中至少有一份优秀的概率.
26.某市为了制定合理的节电方案,对居民用电情况进行了调查,通过抽样,获得了某年200户居民每户的月均用电量(单位:百千瓦·时),将数据按[0,1),[1,2),[2,3),[3,4),[4,5),[5,6),[6,7),[7,8),[8,9)分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中m的值;
(2)设该市有100万户居民,估计全市每户居民中月均用电量不低于6百千瓦·时的人数及每户居民月均用电量的中位数;
(3)政府计划对月均用电量在4百千瓦·时以下的用户进行奖励,月均用电量在[0,1)内的用户奖励20元/月,月均用电量在[1,2)内的用户奖励10元/月,月均用电量在[2,4)内的用户奖励2元/月.若该市共有400万户居民,试估计政府执行此计划的年度预算.
27.某数学兴趣小组有男、女生各5名,以下茎叶图记录了该小组同学在一次数学测试中的成绩(单位:分).已知男生数据的中位数为125,女生数据的平均数为126.8.
(1)求的值;
(2)现从成绩高于125分的同学中随机抽取两名同学,求抽取的两名同学恰好为一男一女的概率.
28.已知经销某种商品的电商在任何一个销售季度内,每售出吨该商品可获利润万元,未售出的商品,每吨亏损万元.根据往年的销售经验,得到一个销售季度内市场需求量的频率分布直方图如图所示.已知电商为下一个销售季度筹备了吨该商品.现以(单位:吨,)表示下一个销售季度的市场需求量,(单位:万元)表示该电商下一个销售季度内经销该商品获得的利润.
(1)根据频率分布直方图,估计一个销售季度内市场需求量的平均数与中位数的大小;
(2)根据频率分布直方图估计利润不少于57万元的概率.
1.(2017新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是
A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数
2.(2017山东文科)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为
A.3,5 B.5,5
C.3,7 D.5,7
3.(2017新课标全国Ⅲ文科)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
4.(2016新课标全国Ⅲ文科)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C,B点表示四月的平均最低气温约为5C.下面叙述不正确的是
A.各月的平均最低气温都在0C以上
B.七月的平均温差比一月的平均温差大
C.三月和十一月的平均最高气温基本相同
D.平均最高气温高于20C的月份有5个
5.(2016山东文科)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是,样本数据分组为 .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是
A.56B.60
C.120D.140
6.(2019年高考江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.
7.(2018江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 ▲ .
8.(2019年高考全国Ⅱ卷文数)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
9.(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
10.(2018新课标全国Ⅰ文科)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
11.(2018新课标全国Ⅲ文科节选)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
12.(2017新课标全国Ⅱ文科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg), 其频率分布直方图如下:
(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
.
13.(2017北京文科)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30],[30,40],,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
14.(2016新课标全国Ⅱ文科)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
随机调查了该险种的200名续保人在一年内的出险情况,得到如下统计表:
(1)记A为事件:“一续保人本年度的保费不高于基本保费”,求P(A)的估计值;
(2)记B为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求P(B)的估计值;
(3)求续保人本年度的平均保费估计值.
15.(2016北京文科)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
16.(2016四川文科)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5), [0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;
(3)估计居民月均用水量的中位数.
变式拓展
1.【答案】A
【解析】由题得样本的平均数为,方差为.
故选A.
2.【答案】C
【解析】先根据平均数公式求出x,再利用方差公式求解.
由题意,得3+5+7+x+10=6×5,得x=5,
所以这组数据的方差s2=(9+1+1+1+16)=.
3.【答案】C
【解析】由于,故A选项错误.
甲的中位数为,乙的中位数为,,故B选项错误.
,故C选项判断正确.
甲的极差为,乙的极差为,,故D选项错误.
综上所述,本小题选C.
4.【答案】
【解析】乙的中位数为,设的值为,
所以,
解得,
故填.
5.【答案】B
【解析】由题意,根据频率分布直方图的性质得,
解得.故①正确;
因为不低于140分的频率为,所以,故②错误;
由100分以下的频率为,所以100分以下的人数为,故③正确;
分数在区间的人数占,占小半.故④错误.
所以说法正确的是①③.
故选B.
6.【解析】(1)依题意:,
所以,.
(2)根据题意,全市“5G爱好者”共(万人),
由样本频率分布直方图可知,35岁以上“5G爱好者”的频率为,
据此可估计全市35岁以上“5G爱好者”的人数为(万人).
(3)样本频率分布直方图中前2组的频率之和为,
前3组的频率之和为,
所以,年龄在25-30之间,不妨设年龄上限为,
由,
得.
所以,估计该市“5G爱好者”的年龄上限为28岁.
专题冲关
1.【答案】C
【解析】对于①,由于一组数据的众数不唯一,故①错误;
对于②,一组数据的方差必须是非负数,故②错误;
对于③,根据方差的定义知③正确;
对于④,根据频率分布直方图中频率的意义知④正确.
综上可得①②错误.
故选C.
2.【答案】A
【解析】根据茎叶图中的数据可知,A县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B县的数据分布比较分散,不如A县数据集中,所以A县的方差较小.
3.【答案】B
【解析】由图计算可得前四组的频数是22,其中第4组的频数为8,故本题正确答案是B.
4.【答案】B
【解析】设模糊不清的数字为x,由题意知该组数据的极差为48-20=28,所以中位数为61-28=33,
所以30+x+342=x2+32=33,解得x=2,
即模糊不清的数字为2.
5.【答案】B
【解析】因为这组数据的平均数为55,方差为,所以.
设,因为,所以,即,则.选B.
6.【答案】C
【解析】由,可得.
由,可得,
,故选C.
7.【答案】D
【解析】经计算得平均值a=5923,众数为b=50,中位数为c=50+602=55,故b
【解析】由题得样本容量为,
抽取的高中生人数为人,则近视人数为人,故选D.
9.【答案】D
【解析】因为,所以,
又,由两式解得,
所以身高落在内的频率为,
所以身高落在范围内的学生人数为.
故选D.
10.【答案】A
【解析】及格的各组的频率和是(0.015+0.030+0.025+0.005)×10=0.75,即及格率为75%;
样本的均值为45×0.10+55×0.15+65×0.15+75×0.30+85×0.25+95×0.05=71,
用这个分数估计总体的分数即得总体的平均分数为71.
故选A.
【名师点睛】利用频率分布直方图求众数、中位数和平均数时,应注意三点:
①最高的小长方形底边中点的横坐标即是众数;
②中位数左边和右边的小长方形的面积和是相等的;
③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
11.【答案】C
【解析】从茎叶图知,A,D是正确的,乙运动员的得分较集中,甲运动员的得分较分散,故B是正确的,甲运动员得分的平均分为<27.故选C.
12.【答案】C
【解析】A选项:若天内数据为:,满足均值为,中位数为,存在超过人的情况,不符合该标志,则A错误;
B选项:若天内数据为:,满足均值为,方差大于,存在超过人的情况,不符合该标志,则B错误;
C选项:设天内存在一天超过人,为最低的超过标志的人数:人,则必有,可知方差不可能为,可知假设错误,则必符合该标志,则C正确;
D选项:若天内数据为:,满足中位数为,众数为,存在超过人的情况,不符合该标志,则D错误.
故选C.
13.【答案】C
【解析】∵样本,3,5,7的平均数是,且,分别是数列的第2项和第4项,
∴,.
故选C.
14.【答案】B
【解析】∵消费金额不超过3千元的人数占总人数的35,∴第4,5,6组的频率之和为1-0.6=0.4,从图中可知第4组的频率为0.25,∴第5,6组的频率之和为0.4-0.25=0.15,∴消费金额超过4千元的人数为15.
15.【答案】A
【分析】分别根据数据的平均数和方差的计算公式,求得的值,即可得到答案.
【解析】由题意,可得,
设收集的48个准确数据分别记为,
则
,
,
所以.故选A.
【名师点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.
16.【答案】B
【解析】设从左到右前3个小组的频率分别为x,2x,3x,第5小组的频数是y,
则解得故选B.
17.【答案】D
【解析】由频率分布直方图可得,成绩在的频率最高,因此考生人数最多,故A正确;
由频率分布直方图可得,成绩在的频率为,因此,不及格的人数为,故B正确;
由频率分布直方图可得:平均分等于,故C正确;
因为成绩在的频率为,由的频率为,所以中位数为,故D错误.
故选D.
18.【答案】74
【解析】由题意知,五个小队的积分分别是70,85,80,60,75,
所以五个小队的积分的平均值为=74,
所以五个小队的积分的方差为=74.
19.【答案】58
【解析】由频率分布直方图可得参加夏令营的天数在[6,10)的频率为1-(0.04+0.12+0.05)×2=0.58,则参加夏令营的天数在[6,10)的人数为100×0.58=58.
20.【答案】
【解析】由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y-6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b成等差数列,可得G=2,a+b=2G=4,所以+=(+)×(+)=(1+++4)≥×(5+4)=(当且仅当b=2a时取等号).故+的最小值为.
21.【答案】92
【解析】5个样本成份的平均值为8g,标准差为2g,所以,,即,解得,
因为,
所以,
所以这批中成药的药物功效的平均值为药物单位.
22.【答案】(1)0.04;(2)440
【解析】(1)因为所有小长方形的面积之和为1,所以年龄在[25,30)内对应小长方形的高度为15[1-(5×0.01+5×0.07+5×0.06+5×0.02)]=0.04.
(2)年龄在[25,35)内的频率为0.04×5+0.07×5=0.55,人数为0.55×800=440.
23.【解析】(1)由已知得a=0.26×100=26,分数区间[60,70)对应的频数为100-8-42-26-8=16,
因而b==0.16.
频率分布直方图如图.
(2)(i)设中位数为x分,则10×0.008+10×0.016+(x-70)×0.042=0.5,得x≈76.2.
(ii)已知100名报名者可直接进入面试的男女人数比例为3∶5,那么2000名参考人员中,经过第一次考试就可直接进入面试的男性人数为38×0.08×2000=60,女性人数为58×0.08×2000=100.
24.【解析】(1)由于小矩形的面积之和为1,
则(a+0.075+4a+0.15+5a+0.05+0.025)×2=1,
由此可得a=0.02.
该地区高中生一周使用手机时间的平均值为(1×0.02+3×0.075+5×0.08+7×0.15+9×0.1+11×0.05+13×0.025)×2=6.94.
(2)使用手机时间在[6,8)的学生有0.15×2×100=30人,
使用手机时间在[8,10)的学生有0.02×5×2×100=20人,
使用手机时间在[10,12)的学生有0.05×2×100=10人,
使用手机时间在[12,14]的学生有0.025×2×100=5人,
故用分层抽样法从使用手机时间在[6,8),[8,10),[10,12),[12,14]的四组学生中抽样,抽取人数分别为13×3030+20+10+5=6,13×2030+20+10+5=4,13×1030+20+10+5=2,13×530+20+10+5=1.
25.【解析】(1)分数在[50,60)的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60)的频数为2,
所以全班人数为.
(2)分数在[80,90)的频数为25-2-7-10-2=4,
则频率分布直方图中[80,90)间的矩形的高为.
(3)由(2)可知分数在[80,100)的人数为4+2=6.
设分数在[80,90)的试卷为A,B,C,D,分数在[90,100]的试卷为a,b,
则从6份卷中任取2份,共有15个基本事件,
分别是AB,AC,AD,Aa,Ab,BC,BD,Ba,Bb,CD,Ca,Cb,Da,Db,ab,
其中至少有一份优秀的事件共有9个,
分别是Aa,Ab,Ba,Bb,Ca,Cb,Da,Db,ab,
∴在抽取的试卷中至少有一份优秀的概率为.
26.【解析】(1)由题得1−1×(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=2m,
所以m=0.15.
(2)200户居民月均用电量不低于6百千瓦·时的频率为0.06+0.04+0.02=0.12,
100万户居民中月均用电量不低于6百千瓦·时的户数有1000000×0.12=120000;
设中位数是x百千瓦·时,因为前5组的频率之和0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和0.04+0.08+0.15+0.21=0.48<0.5,所以4
(3)该市月均用电量在[0,1),[1.2),[2,4)内的用户数分别为4000000×0.04=20000×8,4000000×0.08=20000×16,4000000×0.36=20000×72,所以每月预算为20000×(8×20+16×10+72×2)=20000×464(元),
故估计政府执行此计划的年度预算为20000×464×12=11136(万元)=1.1136(亿元).
27.【解析】(1)由男生成绩为119,122,,134,137 ,其中位数为,
得,解得,
又由女生成绩为119,125,,128,134,
得平均数为,解得:,
所以.
(2)成绩高于分的男生有2名,分别记为,
成绩高于分的女生有3名,分别记为,
从高于125分的同学中取两名同学的所有取法:
,共10种不同的取法,
其中恰好为一男一女的取法:,共有6种不同的取法,
故抽取的两名同学恰好为一男一女的概率为.
28.【解析】(1)估计一个销售季度内市场需求量的平均数为(吨).
由频率分布直方图易知,由于时,对应的频率为,而时,对应的频率为,
因此一个销售季度内市场需求量的中位数应属于区间,
于是估计中位数应为(吨).
(2)当时,;
当时,,
所以,.
当时,由,得;
当时,,
所以,利润不少于万元当且仅当,
于是由频率分布直方图可知,市场需求量的频率为,所以下一个销售季度内的利润不少于57万元的概率的估计值为.
直通高考
1.【答案】B
【解析】评估这种农作物亩产量稳定程度的指标是标准差或方差,故选B.
【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反映一组数据的多数水平;
中位数:一组数据中间的数(起到分水岭的作用),中位数反映一组数据的中间水平;
平均数:反映一组数据的平均水平;
方差:反映一组数据偏离平均数的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
标准差是方差的算术平方根,意义在于反映一组数据的离散程度.
2.【答案】A
【解析】由题意,甲组数据为56,62,65,,74,乙组数据为59,61,67,,78.要使两组数据的中位数相等,则,所以,又平均数相同,则,解得.故选A.
【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.缺点是当样本容量较大时,作图较烦琐. 利用茎叶图对样本进行估计时,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.【答案】A
【解析】由折线图,可知每年7月到8月折线图呈下降趋势,月接待游客量减少,A错误;
折线图整体呈现出增长的趋势,年接待游客量逐年增加,B正确;
每年的接待游客量7,8月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,C正确;
每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,D正确.
所以选A.
【名师点睛】用样本估计总体时统计图表主要有:
(1)频率分布直方图,特点:频率分布直方图中各小长方形的面积等于对应区间的频率,所有小长方形的面积之和为1;
(2)频率分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(3)茎叶图,对于统计图表类题目,最重要的是认真观察图表,从中提炼出有用的信息和数据.
4.【答案】D
【解析】由题图可知各月的平均最低气温都在0C以上,A正确;
由题图可知七月的平均温差大于7.5C,而一月的平均温差小于7.5C,所以七月的平均温差比一月的平均温差大,B正确;
由题图可知三月和十一月的平均最高气温都大约在10C,基本相同,C正确;
由题图可知平均最高气温高于20℃的月份有3个,所以不正确.
故选D.
5.【答案】D
【解析】自习时间不少于22.5小时为后三组,其频率和为,故人数为人,选D.
【名师点睛】本题主要考查频率分布直方图,是一道基础题目.从历年高考题目看,图表题已是屡见不鲜,作为一道应用题,考查考生的识图、用图能力,以及应用数学知识解决实际问题的能力.
6.【答案】
【解析】由题意,该组数据的平均数为,
所以该组数据的方差是.
7.【答案】90
【解析】由茎叶图可知,5位裁判打出的分数分别为89,89,90,91,91,故平均数为89+89+90+91+915=90.
8.【解析】(1)根据产值增长率频数分布表得,
所调查的100个企业中产值增长率不低于40%的企业频率为.
产值负增长的企业频率为.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2),
,
,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
9.【解析】(1)由已知得,故.
.
(2)甲离子残留百分比的平均值的估计值为
.
乙离子残留百分比的平均值的估计值为
.
10.【解析】(1)
(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为
0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,
因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.
(3)该家庭未使用节水龙头50天日用水量的平均数为
.
该家庭使用了节水龙头后50天日用水量的平均数为
.
估计使用节水龙头后,一年可节省水.
【名师点睛】该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.
11.【解析】(1)第二种生产方式的效率更高.
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.
以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.
(2)由茎叶图知.
列联表如下:
12.【解析】(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
K2=.
由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.
【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1.
(2)频率分布直方图中均值等于组中值与对应概率乘积的和.
(3)均值大小代表水平高低,方差大小代表稳定性.
13.【解析】(1)根据频率分布直方图可知,样本中分数不小于70的频率为,所以样本中分数小于70的频率为.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.
所以总体中分数在区间内的人数估计为.
(3)由题意可知,样本中分数不小于70的学生人数为,
所以样本中分数不小于70的男生人数为.
所以样本中的男生人数为,女生人数为,男生和女生人数的比例为.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为.
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法.分布表在数量表示上比较准确,而频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
14.【解析】(1)事件A发生当且仅当一年内出险次数小于2.由所给数据知,一年内出险次数小于2的频率为,
故P(A)的估计值为0.55.
(2)事件B发生当且仅当一年内出险次数大于1且小于4.由所给数据知,一年内出险次数大于1且小于4的频率为,
故P(B)的估计值为0.3.
(3)由所给数据得
调查的200名续保人的平均保费为
,
因此,续保人本年度平均保费的估计值为1.192 5a.
【名师点睛】样本的数字特征常见的命题角度有:(1)样本的数字特征与频率分布直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题交汇.
15.【解析】(1)由用水量的频率分布直方图知,
该市居民该月用水量在区间,,,,内的频率依次为,,,,.
所以该月用水量不超过立方米的居民占%,用水量不超过立方米的居民占%.
依题意,至少定为.
(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:
根据题意,该市居民该月的人均水费估计为:
(元).
【名师点睛】(1)用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法. 频率分布表在数量表示上比较准确,频率分布直方图比较直观.
(2)频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.
16.【解析】(1)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.
同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.
由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,
解得a=0.30.
(2)由(1),100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.
由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)设中位数为x吨.
因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,
而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5
所以2≤x<2.5.
由0.50×(x–2)=0.5–0.48,解得x=2.04.
故可估计居民月均用水量的中位数为2.04吨.
【名师点睛】本题主要考查频率分布直方图、频率、频数的计算公式等基础知识,考查学生的分析问题、解决问题的能力.在频率分布直方图中,第n个小矩形的面积就是相应组的频率,所有小矩形的面积之和为1,这是解题的关键,也是识图的基础.
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分左右两个面积相等的分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小矩形的面积乘以小矩形底边中点的横坐标之和
优点
不足
频率分布表
表示数据较确切
分析数据分布的总体态势不方便
频率分布直方图
表示数据分布情况非常直观
原有的具体数据信息被抹掉了
频率分布折线图
能反映数据的变化趋势
不能显示原有数据
茎叶图
一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况
样本数据较多或数据位数较多时,不方便表示数据
成绩
[40,50)
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
3
14
15
12
4
分数区间
频数
频率
[50,60)
8
0.08
[60,70)
b
[70,80)
42
0.42
[80,90)
a
0.26
[90,100]
8
合计
100
1.00
分数段
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
男女比例
1∶1
3∶1
3∶4
7∶6
3∶5
的分组
企业数
2
24
53
14
7
日用水量
频数
1
3
2
4
9
26
5
日用水量
频数
1
5
13
10
16
5
超过
不超过
第一种生产方式
第二种生产方式
箱产量<50 kg
箱产量≥50 kg
旧养殖法
新养殖法
P(K2≥k)
0.050 0.010 0.001
k
3.841 6.635 10.828
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
出险次数
0
1
2
3
4
≥5
频数
60
50
30
30
20
10
超过
不超过
第一种生产方式
15
5
第二种生产方式
5
15
箱产量<50 kg
箱产量≥50 kg
旧养殖法
62
38
新养殖法
34
66
保费
0.85a
a
1.25a
1.5a
1.75a
2a
频率
0.30
0.25
0.15
0.15
0.10
0.05
组号
1
2
3
4
5
6
7
8
分组
频率
最高考文数考点一遍过(讲义) 考点37 双曲线: 这是一份最高考文数考点一遍过(讲义) 考点37 双曲线,共36页。学案主要包含了双曲线的定义和标准方程,双曲线的几何性质等内容,欢迎下载使用。
最高考文数考点一遍过(讲义) 考点36 椭圆: 这是一份最高考文数考点一遍过(讲义) 考点36 椭圆,共35页。学案主要包含了椭圆的定义,椭圆的标准方程,椭圆的图形及其简单几何性质,必记结论等内容,欢迎下载使用。
最高考文数考点一遍过(讲义) 考点34 圆的方程: 这是一份最高考文数考点一遍过(讲义) 考点34 圆的方程,共22页。学案主要包含了圆的方程,点与圆的位置关系,必记结论等内容,欢迎下载使用。