所属成套资源:新人教版高二暑期数学衔接讲义(学生版+解析)
新人教版高二暑期数学衔接第04讲用样本估计总体(主干知识复习)讲义(学生版+解析)
展开
这是一份新人教版高二暑期数学衔接第04讲用样本估计总体(主干知识复习)讲义(学生版+解析),共10页。学案主要包含了学习目标,基础知识,考点剖析,真题演练,过关检测等内容,欢迎下载使用。
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),
3.结合实例,理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),4.结合实例,理解离散程度参数的统计含义,
5.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义
【基础知识】
一、频率分布直方图
1.制作频率分布直方图的步骤
第一步:求极差,决定组数和组距,组距=eq \f(极差,组数);
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图。
2.解决频率分布直方图问题时要抓住3个要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示eq \f(频率,组距),故每组样本的频率为组距×eq \f(频率,组距),即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
二、样本的数字特征
1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数
3.平均数:样本数据的算术平均数,即.
4.百分位数:求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.
5.方差与标准差
(1)标准差是样本数据到平均数的一种平均距离.
(2)方差:(是样本数据,是样本容量,是样本平均数).
(3)标准差:.
6.平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为eq \(x,\s\up6(-)),方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为meq \(x,\s\up6(-))+a,方差为m2s2.
7.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.
8.用频率分布直方图估计众数、中位数、平均数的方法
(1)众数为频率分布直方图中最高矩形底边中点横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
三、统计图
1.统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.
2. 茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
3.折线图
折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势.折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布.另外,在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来.所以,折线图常用来分析数据随时间的变化趋势,也可用来分析多组数据随时间变化的相互作用和相互影响.例如可用来分析某类商品或是某几类相关的商品随时间变化的销售情况,从而进一步预测未来的销售情况.在折线图中,一般x轴用来表示时间的推移,并且间隔相同;而y轴代表不同时刻的数据的大小.
四、频率分布折线图和总体密度曲线
1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
【考点剖析】
考点一:频率分布直方图
例1.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )
A.0.028B.0.029C.0.280D.0.290
考点二:折线图
例2.(2022学年山东省滨州市阳信县高一下学期期中)走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11600B.这一星期内甲的日步数的平均值大于乙
C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7030
考点三:其他统计图表
例3.(多选)(2020-2021学年湖南师范大学附属中学高一下学期期末)中兴、华为事件暴露了我国计算机行业中芯片、软件两大短板,为防止“卡脖子”事件的再发生,科技专业人才就成了决胜的关键.为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中正确的是( )
A.芯片、软件行业从业者中,"90后”占总人数的比例超过60%
B.芯片、软件行业中从事技术、设计岗位的"90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
考点四:众数与中位数
例4.(多选)(2022学年吉林省长春市第二实验中学高一下学期期中)某人射箭10次,射中的环数依次为:8,7,8,9,7,6,9,8,10,8关于这组数据,下列说法正确的是( )
A.这组数据的众数是8B.这组数据的平均数是8
C.这组数据的中位数是8D.这组数据的方差是
考点五:百分位数
例5.(2022学年山西省太原市第五中学校高一下学期5月阶段性检测)互不相等的5个正整数从小到大排序为1,,,,,若它们的和为18,且其分位数是分位数的2倍,则的值为_________.
考点六:平均数与方差
例6.已知某省二、三、四线城市数量之比为1∶3∶6,2019年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为________.
考点七:用样本估计总体
例7. (2022学年福建省德化一中、永安一中、漳平一中三校协作高一5月联考)2021年根据移动通信协会监测,某校全体教师通讯费用(单位:元)如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100].
(1)若该校有200名教师,采用分层抽样的方法从这200名教师中抽取容量为20的样本,求每组应抽取的样本量;
(2)估计该校教师话费的80%分位数;
(3)估计该校教师通讯费用的众数和平均数.
考点八:平均数与方差的实际应用
例8.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
分别计算两组数据的平均数,从计算结果看,估计哪种药的疗效更好?
【真题演练】
1.(多选)(2021新高考全国卷Ⅰ卷)有一组样本数据,,,,由这组数据得到新样本数据,,,,其中,2,,,为非零常数,则
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
2. (2021新高考全国卷Ⅱ)下列统计量中,能度量样本的离散程度的是( )
A. 样本的标准差B. 样本的中位数
C. 样本的极差D. 样本的平均数
3. (2021高考全国卷Ⅱ)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是
A.该地农户家庭年收入低于4.5万元的农户比率估计为
B.该地农户家庭年收入不低于10.5万元的农户比率估计为
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
4.(2018高考全国卷Ⅰ)某地区经过一一年的新农村建设,农村的经济收入增加了一倍,实现
翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成
比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
5.(2021高考全国卷Ⅰ)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
6.(2019高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200
只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只
小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的
百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【过关检测】
1. (2022学年河南省豫西部分名校高一下学期月考)某实验围种植甲、乙两种水稻,面积相等的两块稻田(种植环境相同)连续5次的产量如下:
则下列说法错误的是( )
A.甲种水稻产量的众数为250
B.乙种水稻产量的极差为70
C.甲种水稻产量的平均数大于乙种水稻产量的平均数
D.甲种水稻产量的方差小于乙种水稻产量的方差
2.(2022学年山东省淄博市博山区、沂源县联考高一6月份月考)排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5——40之间,估计垫球数的样本数据的75%分位数是( )
A.25B.26C.27D.28
3.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为,则( )
A.,B.,
C.,D.,
4.(2022学年山西省高一下学期第三次月考)有一组样本数据,由这组数据得到的另一组数据,,…,,满足(c为非零常数),则下列结论一定成立的是( )
A.两组数据的样本平均数不同B.两组数据的中位数相同
C.两组数据的样本方差相同D.两组数据的样本标准差不同
5.(多选)(2022学年山东省济南市第一中学高一5月月考)根据关于世界人口变化情况的三幅统计图(如图所示),有下列四个结论:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中所有正确结论的编号是( )
A.①B.②C.③D.④
6.(多选)(2022学年三湘名校教育联盟高一下学期5月联考)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续天,每天新增疑似病例不超过人”,过去天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:中位数为,极差为;乙地:平均数为,众数为;丙地:平均数为,中位数为;丁地:平均数为,方差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地B.乙地C.丙地D.丁地
7.(2022学年广东省广州市八十六中高一下学期期中) 若样本数据的方差为8,则数据的方差为________.
8. (2022学年湖南师范大学附属中学高一下学期期中)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:
由此,你估计这批棉花的第95百分位数为________.
9. (2022学年浙江省金华十校高一下学期期末)某大学为调研学生在 两家餐厅用餐的满意度,从在 两家都用过餐的学生中随机抽取了 100 人,每人分别对这两家餐厅进行评分,满分均为 60 分. 整理评分数据,将分数以 10 为组距分为 6 组: ,得到餐厅分数的频率分布直方图和餐厅分数的频数分布表:
(1)在抽样的 100 人中,求对餐厅评分低于30分的人数;
(2)如果从 两家餐厅中选择一家用餐,你会选择哪一家? 说明理由.
10. (2022学年广东省广州市执信中学高一下学期5月月考)为响应十九大报告中提出的“绿水青山就是金山银山”的号召,某市旅游局投入若干经费对全市各旅游景区的环境进行综合治理,并且对各旅游景区收益的增加值作了初步的估计.根据旅游局的治理规划方案,收集了各旅游景区在治理后收益的增加值,将所有数据按照[0,2),[2,4),…,[10,12)分成6组,绘制出如下频率分布直方图.
(1)求图中m的值;
(2)利用频率分布直方图估算全市旅游景区收益增加值的平均数(以各组的区间中点值代表该组的取值);
(3)若该市旅游局打算奖励收益增加值前10%的旅游景区,需要制定一个标准t万元(即收益增加值大于t则奖励)估计t的值,并说明理由.旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
甲/kg
260
250
210
250
280
乙/kg
220
260
230
250
290
25
28
33
50
52
58
59
60
61
62
82
86
113
115
140
143
146
170
175
195
202
206
233
236
238
255
260
263
264
265
293
293
294
296
301
302
303
305
305
306
321
323
325
326
328
340
343
346
348
350
352
355
357
357
358
360
370
380
383
385
餐厅分数的频数分布表
分数区间
频数
2
3
5
15
40
35
第04讲 用样本估计总体
【学习目标】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),
3.结合实例,理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),4.结合实例,理解离散程度参数的统计含义,
5.能用样本估计总体的取值规律,能用样本估计百分位数,理解百分位数的统计含义
【基础知识】
一、频率分布直方图
1.制作频率分布直方图的步骤
第一步:求极差,决定组数和组距,组距=eq \f(极差,组数);
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图。
2.解决频率分布直方图问题时要抓住3个要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示eq \f(频率,组距),故每组样本的频率为组距×eq \f(频率,组距),即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
二、样本的数字特征
1.众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.
2.中位数:将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数
3.平均数:样本数据的算术平均数,即.
4.百分位数:求总体百分位数的估计,首先要从小到大排列数据,然后计算出i=n×p%,当i不是整数要取整,当i是整数,则百分位数为第i项与第(i+1)项数据的平均数.
5.方差与标准差
(1)标准差是样本数据到平均数的一种平均距离.
(2)方差:(是样本数据,是样本容量,是样本平均数).
(3)标准差:.
6.平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为eq \(x,\s\up6(-)),方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为meq \(x,\s\up6(-))+a,方差为m2s2.
7.平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.
8.用频率分布直方图估计众数、中位数、平均数的方法
(1)众数为频率分布直方图中最高矩形底边中点横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和。
三、统计图
1.统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.
2. 茎叶图的画法步骤
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将最小茎与最大茎之间的数按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的两侧.
3.折线图
折线图是用直线段将各数据点连接起来而组成的图形,以折线方式显示数据的变化趋势.折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.在折线图中,类别数据沿水平轴均匀分布,所有值数据沿垂直轴均匀分布.另外,在折线图中,数据是递增还是递减、增减的速率、增减的规律(周期性、螺旋性等)、峰值等特征都可以清晰地反映出来.所以,折线图常用来分析数据随时间的变化趋势,也可用来分析多组数据随时间变化的相互作用和相互影响.例如可用来分析某类商品或是某几类相关的商品随时间变化的销售情况,从而进一步预测未来的销售情况.在折线图中,一般x轴用来表示时间的推移,并且间隔相同;而y轴代表不同时刻的数据的大小.
四、频率分布折线图和总体密度曲线
1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
【考点剖析】
考点一:频率分布直方图
例1.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)为了解学生在“弘扬传统文化,品读经典文学”月的阅读情况,现从全校学生中随机抽取了部分学生,并统计了他们的阅读时间(阅读时间),分组整理数据得到如图所示的频率分布直方图.则图中a的值为( )
A.0.028B.0.029C.0.280D.0.290
【答案】A
【解析】由得.故选A
考点二:折线图
例2.(2022学年山东省滨州市阳信县高一下学期期中)走路是“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两名同学在同一星期内日步数的折线统计图,则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11600B.这一星期内甲的日步数的平均值大于乙
C.这一星期内甲的日步数的方差大于乙D.这一星期内乙的日步数的30%分位数是7030
【答案】D
【解析】对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:,.
所以.故B正确;对于C:所以.故C正确;甲的步数从小到大排列为:5340,7030,10060,11600,12300,12970,14200,
,故这一星期内乙的日步数为分位数是10060,故D错误.故选D.
考点三:其他统计图表
例3.(多选)(2020-2021学年湖南师范大学附属中学高一下学期期末)中兴、华为事件暴露了我国计算机行业中芯片、软件两大短板,为防止“卡脖子”事件的再发生,科技专业人才就成了决胜的关键.为了解我国在芯片、软件方面的潜力,某调查机构对我国若干大型科技公司进行调查统计,得到了这两个行业从业者的年龄分布的饼形图和“90后”从事这两个行业的岗位分布雷达图,则下列说法中正确的是( )
A.芯片、软件行业从业者中,"90后”占总人数的比例超过60%
B.芯片、软件行业中从事技术、设计岗位的"90后”人数超过总人数的25%
C.芯片、软件行业从事技术岗位的人中,“90后”比“80后”多
D.芯片、软件行业中,“90后”从事市场岗位的人数比“80前”的总人数多
【答案】BD
【解析】对于A,由饼形图知,芯片、软件行业从业者中,"90后”占总人数的比例为55%,没超过60%,A不正确;
对于B,由雷达图和饼形图知,芯片、软件行业中从事技术、设计岗位的"90后”人数占总人数的,B正确;
对于C,芯片、软件行业从事技术岗位的人中,“90后”占总人数的,
而“80后”占总人数的40%,从事技术岗位的人数比例不知,无法确定两者间的大小关系,C不正确;
对于D,芯片、软件行业中,从事市场岗位的“90后”人数占总人数的,而“80前”总数占总人数的5%,D正确.故选BD
考点四:众数与中位数
例4.(多选)(2022学年吉林省长春市第二实验中学高一下学期期中)某人射箭10次,射中的环数依次为:8,7,8,9,7,6,9,8,10,8关于这组数据,下列说法正确的是( )
A.这组数据的众数是8B.这组数据的平均数是8
C.这组数据的中位数是8D.这组数据的方差是
【答案】ABCD
【解析】数据从小到大排列为:,
所以众数为,A选项正确;中位数为,C选项正确;
平均数为,所以B选项正确;
方差为,
所以D选项正确.故选ABCD
考点五:百分位数
例5.(2022学年山西省太原市第五中学校高一下学期5月阶段性检测)互不相等的5个正整数从小到大排序为1,,,,,若它们的和为18,且其分位数是分位数的2倍,则的值为_________.
【答案】
【解析】因为,所以这组数据的分位数为,同理可知这组数据的分位数为,据题意有,若,则这5个数为1,3,,6,,由,,,
知,不满足题意,所以,则这5个数为1,2,,4,,由,,
知,由,知.
考点六:平均数与方差
例6.已知某省二、三、四线城市数量之比为1∶3∶6,2019年8月份调查得知该省所有城市房产均价为1.2万元/平方米,方差为20,二、三、四线城市的房产均价分别为2.4万元/平方米,1.8万元/平方米,0.8万元/平方米,三、四线城市房价的方差分别为10,8,则二线城市房价的方差为________.
【答案】
【解析】设二线城市的房价的方差为,由题意可知
解得,即二线城市房价的方差为.
考点七:用样本估计总体
例7. (2022学年福建省德化一中、永安一中、漳平一中三校协作高一5月联考)2021年根据移动通信协会监测,某校全体教师通讯费用(单位:元)如图所示,数据分组依次为[20,40),[40,60),[60,80),[80,100].
(1)若该校有200名教师,采用分层抽样的方法从这200名教师中抽取容量为20的样本,求每组应抽取的样本量;
(2)估计该校教师话费的80%分位数;
(3)估计该校教师通讯费用的众数和平均数.
【解析】 (1)
采用分层抽样的方法从这200名该校教师中抽取容量为20的样本,
即费用(单位:元)在[20,40)中抽取2位教师
在[40,60)中抽取4位教师.
在[60,80)中抽取8位教师
在[80,100]中抽取6位教师.
(2)该校教师话费在80元以下的频率为:,
该校教师话费在[80,100]的频率为0.3,
因此,该校教师话费的80%分位数在[80,100]内,
由.
可以估计该校教师话费的80%分位数为.
(3)该校教师通讯费用的众数为70;
平均数为:
考点八:平均数与方差的实际应用
例8.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:
服用A药的20位患者日平均增加的睡眠时间:
0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2
3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1
2.3 2.4
服用B药的20位患者日平均增加的睡眠时间:
3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3
1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2
2.7 0.5
分别计算两组数据的平均数,从计算结果看,估计哪种药的疗效更好?
【解析】设A药观测数据的平均数为,B药观测数据的平均数为.由观测结果可得
=×(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,
=×(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.
由以上计算结果可得>,因此可以估计A药的疗效更好
【真题演练】
1.(多选)(2021新高考全国卷Ⅰ卷)有一组样本数据,,,,由这组数据得到新样本数据,,,,其中,2,,,为非零常数,则
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
【答案】CD
【解析】对于,两组数据的平均数的差为,故错误;
对于,两组样本数据的样本中位数的差是,故错误;
对于,标准差,
两组样本数据的样本标准差相同,故正确;
对于,,2,,,为非零常数,
的极差为,的极差为,
两组样本数据的样本极差相同,故正确.
故选.
2. (2021新高考全国卷Ⅱ)下列统计量中,能度量样本的离散程度的是( )
A. 样本的标准差B. 样本的中位数
C. 样本的极差D. 样本的平均数
【答案】AC
【解析】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC
3. (2021高考全国卷Ⅱ)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是
A.该地农户家庭年收入低于4.5万元的农户比率估计为
B.该地农户家庭年收入不低于10.5万元的农户比率估计为
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【解析】对于,该地农户家庭年收入低于4.5万元的农户比率为,故选项正确;
对于,该地农户家庭年收入不低于10.5万元的农户比率为,故选项正确;
对于,估计该地农户家庭年收入的平均值为万元,故选项错误;
对于,家庭年收入介于4.5万元至8.5万元之间的频率为,
故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项正确.
故选.
4.(2018高考全国卷Ⅰ)某地区经过一一年的新农村建设,农村的经济收入增加了一倍,实现
翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成
比例,得到如下饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A
【解析】设建设前经济收入为,建设后经济收入为.
A项,种植收入37×﹣60%=14%>0,故建设后,种植收入增加,故A项错误.
B项,建设后,其他收入为5%×2=10%,建设前,其他收入为4%,故10%÷4%=2.5>2,故B项正确.
C项,建设后,养殖收入为30%×2=60%,建设前,养殖收入为30%,故60%÷30%=2,故C项正确.
D项,建设后,养殖收入与第三产业收入总和为(30%+28%)×2=58%×2a,经济收入为2,故(58%×2a)÷2a=58%>50%,故D项正确,因为是选择不正确的一项.
故选A.
5.(2021高考全国卷Ⅰ)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.
(1)求,,,;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【解析】(1)由题中的数据可得,,
,
;
;
(2),
,
所以,
故新设备生产产品的该项指标的均值较旧设备有显著提高.
6.(2019高考全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200
只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只
小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的
百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【解析】(1)由已知得,故,.
(2)甲离子残留百分比的平均值的估计值为
.
乙离子残留百分比的平均值的估计值为
.
【过关检测】
1. (2022学年河南省豫西部分名校高一下学期月考)某实验围种植甲、乙两种水稻,面积相等的两块稻田(种植环境相同)连续5次的产量如下:
则下列说法错误的是( )
A.甲种水稻产量的众数为250
B.乙种水稻产量的极差为70
C.甲种水稻产量的平均数大于乙种水稻产量的平均数
D.甲种水稻产量的方差小于乙种水稻产量的方差
【答案】C
【解析】根据给定数表知,甲种水稻产量的众数为250,乙种水稻产量的极差为,A,B都正确;
甲种水稻产量平均数为,乙种水稻产量平均数为,C错误;
甲种水稻产量方差为,乙种水稻产量方差为,D正确.故选C
2.(2022学年山东省淄博市博山区、沂源县联考高一6月份月考)排球社的同学为训练动作组织了垫排球比赛,以下为排球社50位同学的垫球个数所做的频率分布直方图,所有同学垫球数都在5——40之间,估计垫球数的样本数据的75%分位数是( )
A.25B.26C.27D.28
【答案】D
【解析】由已知,根据频率分布直方图可得:
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
垫球数在的人数为,占总数的;
因为分位数位于内,由,
所以估计垫球数的样本数据的75%分位数是.故选D.
3.(2022学年河北省邢台市卓越联盟高一下学期第三次月考)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为,则( )
A.,B.,
C.,D.,
【答案】D
【解析】设7个数为,
则,
,
所以,
所以,
则这个数的平均数为,
方差为.
故选D.
4.(2022学年山西省高一下学期第三次月考)有一组样本数据,由这组数据得到的另一组数据,,…,,满足(c为非零常数),则下列结论一定成立的是( )
A.两组数据的样本平均数不同B.两组数据的中位数相同
C.两组数据的样本方差相同D.两组数据的样本标准差不同
【答案】C
【解析】设的平均数是,,,…,的平均数是,
由题意,如果,则,否则,A不正确;
同理如果的中位数是,则两者中位数相同,否则不相同,B不正确;
设的方差是,,,…,的差是,
则,
又,,所以,,2,…,n,所以,从而,所以方差相同,标准差也相同,C正确,D不正确,故选C.
5.(多选)(2022学年山东省济南市第一中学高一5月月考)根据关于世界人口变化情况的三幅统计图(如图所示),有下列四个结论:
①从折线统计图能看出世界人口的变化情况;
②2050年非洲人口将达到大约15亿;
③2050年亚洲人口比其他各洲人口的总和还要多;
④从1957年到2050年各洲中北美洲人口增长速度最慢.
其中所有正确结论的编号是( )
A.①B.②C.③D.④
【答案】AC
【解析】①从折线统计图能看出世界人口的变化情况,故①正确;
②从条形统计图中可得到:2050年非洲人口大约将达到18亿,故②错;
③从扇形统计图中能够明显的得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;
④由上述三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.
因此正确的命题有①③.故选AC.
6.(多选)(2022学年三湘名校教育联盟高一下学期5月联考)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标准为“连续天,每天新增疑似病例不超过人”,过去天,甲、乙、丙、丁四地新增疑似病例数据信息如下:甲地:中位数为,极差为;乙地:平均数为,众数为;丙地:平均数为,中位数为;丁地:平均数为,方差为,甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是( )
A.甲地B.乙地C.丙地D.丁地
【答案】ACD
【解析】甲地的中位数为,极差为,所以,最大值不大于,故A符合;
若乙地过去天每天新增疑似病例人数分别为、、、、、、、、、,
则满足平均数为,众数为,但不满足每天新增疑似病例不超过人,故B不符合;
假设丙地至少有一天新增疑似病例人数超过人,
由中位数为可得平均数的最小值为,
与题意矛盾,故C符合;假设至少有一天新增疑似病例超过人,则方差的最小值为,与题意矛盾,故D符合.故选ACD.
7.(2022学年广东省广州市八十六中高一下学期期中) 若样本数据的方差为8,则数据的方差为________.
【答案】32
【解析】若样本数据的方差为8,则数据的方差为
8. (2022学年湖南师范大学附属中学高一下学期期中)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:
由此,你估计这批棉花的第95百分位数为________.
【答案】375
【解析】∵,∴第95百分位数为第57、58项数据的平均值,为.
9. (2022学年浙江省金华十校高一下学期期末)某大学为调研学生在 两家餐厅用餐的满意度,从在 两家都用过餐的学生中随机抽取了 100 人,每人分别对这两家餐厅进行评分,满分均为 60 分. 整理评分数据,将分数以 10 为组距分为 6 组: ,得到餐厅分数的频率分布直方图和餐厅分数的频数分布表:
(1)在抽样的 100 人中,求对餐厅评分低于30分的人数;
(2)如果从 两家餐厅中选择一家用餐,你会选择哪一家? 说明理由.
【解析】 (1)从频率分布直方图得到评分低于30分的频率为,
所以抽样的 100 人中,求对餐厅评分低于30分的人数为;
(2)从分布表可以看出:在抽样的 100 人中,对B餐厅评分低于30分的人数为,因为评分总分为60分,故中位数为30分,显然评分低于30分的人数越少,说明餐厅的用餐满意度越好,
因为,所以选择B餐厅用餐.
10. (2022学年广东省广州市执信中学高一下学期5月月考)为响应十九大报告中提出的“绿水青山就是金山银山”的号召,某市旅游局投入若干经费对全市各旅游景区的环境进行综合治理,并且对各旅游景区收益的增加值作了初步的估计.根据旅游局的治理规划方案,收集了各旅游景区在治理后收益的增加值,将所有数据按照[0,2),[2,4),…,[10,12)分成6组,绘制出如下频率分布直方图.
(1)求图中m的值;
(2)利用频率分布直方图估算全市旅游景区收益增加值的平均数(以各组的区间中点值代表该组的取值);
(3)若该市旅游局打算奖励收益增加值前10%的旅游景区,需要制定一个标准t万元(即收益增加值大于t则奖励)估计t的值,并说明理由.
【解析】 (1)由,得.
(2).
(3)因为,
,
,
,
,
所以,
由,得.
旧设备
9.8
10.3
10.0
10.2
9.9
9.8
10.0
10.1
10.2
9.7
新设备
10.1
10.4
10.1
10.0
10.1
10.3
10.6
10.5
10.4
10.5
甲/kg
260
250
210
250
280
乙/kg
220
260
230
250
290
25
28
33
50
52
58
59
60
61
62
82
86
113
115
140
143
146
170
175
195
202
206
233
236
238
255
260
263
264
265
293
293
294
296
301
302
303
305
305
306
321
323
325
326
328
340
343
346
348
350
352
355
357
357
358
360
370
380
383
385
餐厅分数的频数分布表
分数区间
频数
2
3
5
15
40
35
相关学案
这是一份新人教版高二暑期数学衔接第05讲概率的计算(主干知识复习)讲义(学生版+解析),共9页。学案主要包含了学习目标,基础知识,考点剖析,真题演练,过关检测等内容,欢迎下载使用。
这是一份新人教版高二暑期数学衔接第01讲平面向量的数量积(主干知识复习)讲义(学生版+解析),共9页。学案主要包含了学习目标,基础知识,考点剖析,真题演练,过关检测等内容,欢迎下载使用。
这是一份新人教版高二暑期数学衔接第16讲抛物线讲义(学生版+解析),共31页。学案主要包含了学习目标,基础知识,考点剖析,真题演练,过关检测等内容,欢迎下载使用。