所属成套资源:新高考高中数学核心知识点全透视专题特训(必修)(精讲精析篇)(原卷版+解析)
新高考高中数学核心知识点全透视专题5.1统计(必修)(精讲精析篇)(原卷版+解析)
展开这是一份新高考高中数学核心知识点全透视专题5.1统计(必修)(精讲精析篇)(原卷版+解析),共28页。试卷主要包含了1 统计,用样本估计总体,分层抽样问题类型及解题思路等内容,欢迎下载使用。
一、核心素养
1.会用简单随机抽样方法从总体中抽取样本,凸显数据分析的核心素养.
2.借助频率分布表画频率分布直方图、频率折线图,提升读图、数据分析的能力,凸显直观想象、数据分析的核心素养.
3.能从样本数据中提取样本的数字特征(如平均数、标准差),并做出合理的解释,凸显数学运算的核心素养.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题,凸显数学建模的核心素养.
二、考试要求
1.随机抽样
(1)理解随机抽样的必要性和重要性.
(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
2.用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶
图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字
特征,理解用样本估计总体的思想.
(5)总体百分位的估计
(6)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
三、主干知识梳理
(一)简单随机抽样的特点
(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
2.抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
3.分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”.
提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·eq \f(Ni,N)(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
(二)1.频率、频数、样本容量的计算方法
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,
样本容量×频率=频数.
(3)各个小方形的面积总和等于1 .
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=极差/组数;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.
(三)中位数、众数、平均数、方差、标准差、百分位
1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
二、真题展示
1.(2023·天津高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A.B.C.D.
2.【多选题】(2023·全国高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样数据的样本极差相同
考点01 随机抽样
【典例1】(2023·全国高一课时练习)某班有30位同学,他们依次编号为01,02,,29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第7列和第8列数字开始,由左到右依次选取两个数字,则选出来的第5位同学的编号为( )
A.08B.21C.09D.29
【典例2】(2023·大同市平城中学校高一月考)我国古代数学名著《九章算术》有一抽样问题:“今有某地北面若干人,西面有7488人,南面有6912人,这三面要征调300人,而北面共征调108人(用分层简单抽样的方法),则北面共有多少人( )
A.8000B.8100C.8200D.8300
【总结提升】
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2. 分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
3. 两种抽样方法的特点、联系及适用范围
考点02 茎叶图及其应用
【典例3】(2023·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
【特别提醒】
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
②茎叶图上重复出现的数据要重复记录,不能遗漏.
考点03 频率分布直方图
【典例4】(2023·天津高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10B.18C.20D.36
【典例5】(2023·全国高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【总结提升】
1.两个主要考查角度:
(1)利用频率分布直方图求频率、频数.
(2)利用频率分布直方图估计总体
2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2) eq \f(频率,组距)×组距=频率;
(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数
3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率
考点04 样本的数字特征
【典例6】(2023·全国高考真题(文))设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01B.0.1C.1D.10
【典例7】(2023·全国高考真题(理))在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A.B.
C.D.
【典例8】(2023·全国高一课时练习)若某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,则这组数据的中位数是__________;平均数是__________;最大值是__________;25%分位数是__________.
【总结提升】
1.众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:s2=eq \f(1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-n eq \x\t(x)2]或写成s2=eq \f(1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \x\t(x)2,即方差等于原数据平方的平均数减去平均数的平方.
2.主要命题角度:
(1)样本的数字特征与频率分布直方图交汇
(2)样本的数字特征与茎叶图交汇
= 1 \* GB3 ①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
= 2 \* GB3 ②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.
(3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
= 1 \* GB3 ①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
= 2 \* GB3 ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
考点05 统计应用问题
【典例9】(2023·全国高一课时练习)抽样调查30个家庭某月的水电费用,得到如下数据(单位:元):
(1)取组距为60,起点为320,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计该月水电费用在内的家庭所占的百分比.
【典例10】(2023年高考全国Ⅱ卷文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
1.(2023·北京顺义·牛栏山一中高二期中)如表是某校120名学生假期阅读时间(单位:小时)的频率分布表,现按比例分层抽样的方法从,,,四组中抽取20名学生了解其阅读内容,那么从这四组中依次抽取的人数是( )
A.2,5,8,5B.2,5,12,1C.4,6,8,2D.3,6,10,1
2.【多选题】(2023·江苏省天一中学)给定一组数5,5,4,3,3,3,2,2,2,1,则( )
A.平均数为3B.标准差为
C.众数为2和3D.85%分位数为4.5
3.【多选题】(2023·邯山区新思路学本文化辅导学校高一月考)已知某校有高中学生6000人,该校高中年级的学生人数和肥胖情况分别如图1和图2所示.
图1 图2
下列说法错误的是( )
A.高一年级的学生肥胖人数最多
B.高三年级的学生肥胖人数最少
C.高一年级的学生肥胖人数与高二年级的学生肥胖人数相同
D.该校所有高中学生的肥胖率是12%
4.【多选题】(2023·江苏广陵·扬州中学)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:给出下面四个结论:
①甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前;
②丙同学的逻辑思维成绩排名比乙同学的逻辑思维成绩排名更靠前;
③甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前;
④乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前;
则所有正确结论的序号是( )
A.①B.②C.③D.④
5.(2023·全国高一课时练习)某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生__人.
6.(2023·河南)洛阳牡丹花会闻名全国.某园林企业先后培育出牡丹新品种,现选取部分样本,并测得花冠直径的数据为:(单位:),则该组数据的中位数和众数分别为___________.
7.(2023·江苏如皋·高一月考)已知样本数据的标准差为2,则数据的标准差为___________.
8.(2023·江苏南京·金陵中学高一月考)甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
甲:12,15,20,25,31,31,36,36,37,39,44,49.
乙:8,13,14,16,23,26,28,29,31,38,39,51.
则运动员甲得分的25百分位数与运动员乙得分的80百分位数的和为______.
9.(2023·河北运河·沧州市一中高一月考)数据,,,平均数为6,标准差为2,若数据,,,的平均数为a,方差为b,则______.
10.(2023·全国高一课时练习)某区高二年级的一次数学统考中,随机抽取M名同学的成绩,数据的分组统计表如下:
(1)表中m,n,p,M,N,P的值分别为___________,___________,___________,___________,___________,___________.
(2)若该区高二学生有5000人,估计这次统考中该区高二学生分数在区间内的人数为___________.41792
71635
86089
32157
95620
92109
29145
74955
82835
98378
83513
47870
20799
32122
类别
共同点
各自特点
联系
适用范围
简单随机抽样
①抽样过程中每个个体被抽到的可能性相等;
②每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样
总体由差异明显的几部分组成
的分组
企业数
2
24
53
14
7
分组
频数
频率
12
0.10
30
0.60
0.05
合计
120
1.00
分组
频数
频率
频率组距
2
4
11
38
11
合计
专题5.1 统计(必修)(精讲精析篇)
一、核心素养
1.会用简单随机抽样方法从总体中抽取样本,凸显数据分析的核心素养.
2.借助频率分布表画频率分布直方图、频率折线图,提升读图、数据分析的能力,凸显直观想象、数据分析的核心素养.
3.能从样本数据中提取样本的数字特征(如平均数、标准差),并做出合理的解释,凸显数学运算的核心素养.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题,凸显数学建模的核心素养.
二、考试要求
1.随机抽样
(1)理解随机抽样的必要性和重要性.
(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.
2.用样本估计总体
(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶
图,理解它们各自的特点.
(2)理解样本数据标准差的意义和作用,会计算数据标准差.
(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字
特征,理解用样本估计总体的思想.
(5)总体百分位的估计
(6)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
三、主干知识梳理
(一)简单随机抽样的特点
(1)抽取的个体数较少;(2)是逐个抽取;(3)是不放回抽取;(4)是等可能抽取.只有四个特点都满足的抽样才是简单随机抽样.
2.抽签法与随机数法的适用情况
(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.
(2)一个抽样试验能否用抽签法,关键看两点:
一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
3.分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=eq \f(样本容量,总体容量)=eq \f(各层样本数量,各层个体数量)”.
提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ni=n·eq \f(Ni,N)(i=1,2,…,k)个个体(其中i是层数,n是抽取的样本容量,Ni是第i层中个体的个数,N是总体容量).
(二)1.频率、频数、样本容量的计算方法
(1)eq \f(频率,组距)×组距=频率.
(2)eq \f(频数,样本容量)=频率,eq \f(频数,频率)=样本容量,
样本容量×频率=频数.
(3)各个小方形的面积总和等于1 .
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=极差/组数;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
(4)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.
(三)中位数、众数、平均数、方差、标准差、百分位
1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.
4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
二、真题展示
1.(2023·天津高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A.B.C.D.
答案:D
分析:
利用频率分布直方图可计算出评分在区间内的影视作品数量.
【详解】
由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
2.【多选题】(2023·全国高考真题)有一组样本数据,,…,,由这组数据得到新样本数据,,…,,其中(为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样数据的样本极差相同
答案:CD
分析:
A、C利用两组数据的线性关系有、,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B、D的正误.
【详解】
A:且,故平均数不相同,错误;
B:若第一组中位数为,则第二组的中位数为,显然不相同,错误;
C:,故方差相同,正确;
D:由极差的定义知:若第一组的极差为,则第二组的极差为,故极差相同,正确;
故选:CD
考点01 随机抽样
【典例1】(2023·全国高一课时练习)某班有30位同学,他们依次编号为01,02,,29,30,现利用下面的随机数表选取5位同学组建“文明校园督查组”.选取方法是从随机数表的第1行的第7列和第8列数字开始,由左到右依次选取两个数字,则选出来的第5位同学的编号为( )
A.08B.21C.09D.29
答案:D
分析:
利用随机数表的选取方法选出有效的编号,即可得解.
【详解】
依次从数表中读出的有效编号为:16,08,21,09,21,09,29,去掉重复的,得到选出来的第5位同学的编号为29.
故选:D.
【典例2】(2023·大同市平城中学校高一月考)我国古代数学名著《九章算术》有一抽样问题:“今有某地北面若干人,西面有7488人,南面有6912人,这三面要征调300人,而北面共征调108人(用分层简单抽样的方法),则北面共有多少人( )
A.8000B.8100C.8200D.8300
答案:B
分析:
设北面有人,根据分层抽样原理列方程求出的值.
【详解】
解:设北面人数为,根据题意知,
,
解得,
所以北面共有8100人.
故选:B
【总结提升】
1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.
2. 分层抽样的前提和遵循的两条原则
(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取.
(2)遵循的两条原则:
①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.
3. 两种抽样方法的特点、联系及适用范围
考点02 茎叶图及其应用
【典例3】(2023·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
答案:A
【解析】
由茎叶图,可得甲组数据的中位数为65,从而乙组数据的中位数也是65,所以y=5.
由乙组数据59,61,67,65,78,可得乙组数据的平均值为66,故甲组数据的平均值也为66,
从而有eq \f(56+62+65+74+70+x,5)=66,解得x=3.
【特别提醒】
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
②茎叶图上重复出现的数据要重复记录,不能遗漏.
考点03 频率分布直方图
【典例4】(2023·天津高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10B.18C.20D.36
答案:B
分析:
根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可.
【详解】
根据直方图,直径落在区间之间的零件频率为:,
则区间内零件的个数为:.
故选:B.
【典例5】(2023·全国高考真题(理))为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成两组,每组100只,其中组小鼠给服甲离子溶液,组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记为事件:“乙离子残留在体内的百分比不低于”,根据直方图得到的估计值为.
(1)求乙离子残留百分比直方图中的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
答案:(1) ,;(2) ,.
分析:
(1)由及频率和为1可解得和的值;(2)根据公式求平均数.
【详解】
(1)由题得,解得,由,解得.
(2)由甲离子的直方图可得,甲离子残留百分比的平均值为,
乙离子残留百分比的平均值为
【总结提升】
1.两个主要考查角度:
(1)利用频率分布直方图求频率、频数.
(2)利用频率分布直方图估计总体
2.熟记结论:(1)在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1;
(2) eq \f(频率,组距)×组距=频率;
(3)频数/样本容量=频率,此关系式的变形为频数/频率=样本容量,样本容量×频率=频数
3.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率
考点04 样本的数字特征
【典例6】(2023·全国高考真题(文))设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01B.0.1C.1D.10
答案:C
【解析】
因为数据的方差是数据的方差的倍,
所以所求数据方差为
故选:C
【典例7】(2023·全国高考真题(理))在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A.B.
C.D.
答案:B
【解析】
对于A选项,该组数据的平均数为,
方差为;
对于B选项,该组数据的平均数为,
方差为;
对于C选项,该组数据的平均数为,
方差为;
对于D选项,该组数据的平均数为,
方差为.
因此,B选项这一组的标准差最大.
故选:B.
【典例8】(2023·全国高一课时练习)若某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,则这组数据的中位数是__________;平均数是__________;最大值是__________;25%分位数是__________.
答案:91.5##
分析:
首先我们把数据从小到大排列,再根据相关定义进行计算.
【详解】
把这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是;平均数;
最大值为96;
因为数据个数为8,而且,因此这组数据的25%分位数是.
故答案为:91.5,91.5,96,89.5
【总结提升】
1.众数、中位数、平均数、方差的意义及常用结论
(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.
(2)方差的简化计算公式:s2=eq \f(1,n)[(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-n eq \x\t(x)2]或写成s2=eq \f(1,n)(xeq \\al(2,1)+xeq \\al(2,2)+…+xeq \\al(2,n))-eq \x\t(x)2,即方差等于原数据平方的平均数减去平均数的平方.
2.主要命题角度:
(1)样本的数字特征与频率分布直方图交汇
(2)样本的数字特征与茎叶图交汇
= 1 \* GB3 ①在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
= 2 \* GB3 ②茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.
(3)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据
= 1 \* GB3 ①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
= 2 \* GB3 ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
考点05 统计应用问题
【典例9】(2023·全国高一课时练习)抽样调查30个家庭某月的水电费用,得到如下数据(单位:元):
(1)取组距为60,起点为320,列出样本的频率分布表;
(2)画出频率分布直方图;
(3)根据频率分布直方图估计该月水电费用在内的家庭所占的百分比.
答案:(1)答案见解析;(2)答案见解析;(3)20%.
分析:
(1)根据已知条件,利用题中数据分别写出频数,然后计算频率,最后列表即可;(2)根据(1)中结论分别计算各组的频率与组距之比,然后根据频率分布表作图即可;(3)计算该月水电费用在内的家庭的频率之和即可求解.
【详解】
(1)由题中数据可得,频率分布表如下
(2)频率分布直方图如图:
(3)该月水电费用落在内的家庭所占的百分比为,所以估计该月水电费用在内的家庭所占的百分比为20%.
【典例10】(2023年高考全国Ⅱ卷文)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
答案:(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%;(2)这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
【解析】(1)根据产值增长率频数分布表得,
所调查的100个企业中产值增长率不低于40%的企业频率为.
产值负增长的企业频率为.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2),
,
,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
1.(2023·北京顺义·牛栏山一中高二期中)如表是某校120名学生假期阅读时间(单位:小时)的频率分布表,现按比例分层抽样的方法从,,,四组中抽取20名学生了解其阅读内容,那么从这四组中依次抽取的人数是( )
A.2,5,8,5B.2,5,12,1C.4,6,8,2D.3,6,10,1
答案:B
分析:
先求出小组的频率的值,由分层抽样抽样比相等,分别由乘以各组的频率即可得各组中依次抽取的人数,进而可得正确选项.
【详解】
根据题意,小组的频率为,
则第一小组抽取的人数为,
第二小组抽取的人数为,
第三小组抽取的人数为,
第四小组抽取的人数为.
即4个小组依次抽取的人数是2,5,12,1;
故选:B.
2.【多选题】(2023·江苏省天一中学)给定一组数5,5,4,3,3,3,2,2,2,1,则( )
A.平均数为3B.标准差为
C.众数为2和3D.85%分位数为4.5
答案:AC
分析:
根据平均数,方差、标准差的计算公式,可判定A、B项;由众数和百分位数的概念可判定C、D,即可求解.
【详解】
平均数为,故A正确;
标准差为,故B错误;
观察数据可得众数为2和3,故C正确;
将数据从小到大排序得1,2,2,2,3,3,3,4,5,5.
则,∴第85百分位数为5,故D错误.
故选:AC.
3.【多选题】(2023·邯山区新思路学本文化辅导学校高一月考)已知某校有高中学生6000人,该校高中年级的学生人数和肥胖情况分别如图1和图2所示.
图1 图2
下列说法错误的是( )
A.高一年级的学生肥胖人数最多
B.高三年级的学生肥胖人数最少
C.高一年级的学生肥胖人数与高二年级的学生肥胖人数相同
D.该校所有高中学生的肥胖率是12%
答案:BCD
分析:
根据题干数据以及饼状图和条形图的比例关系,即可判断
【详解】
由题意可得该校高一年级的学生人数为,肥胖人数为;
高二年级的学生人数为,肥胖人数为;高三年级的学生人数为,肥胖人数为,
则A正确,BC错误;
该校所有高中学生的肥胖率是,
则D错误.
故选:BCD
4.【多选题】(2023·江苏广陵·扬州中学)某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:给出下面四个结论:
①甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前;
②丙同学的逻辑思维成绩排名比乙同学的逻辑思维成绩排名更靠前;
③甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前;
④乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前;
则所有正确结论的序号是( )
A.①B.②C.③D.④
答案:AB
分析:
通过对两图形的阅读和理解,分别比较甲、乙、丙的纵横坐标,可以分析出来甲、乙、丙的类比情况,从而可得结论.
【详解】
根据图示可得:
甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故①正确;
丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则丙同学的逻辑思维成绩排名比乙同学的逻辑思维成绩排名更靠前,故②正确.
5.(2023·全国高一课时练习)某防疫站对学生进行身体健康调查,欲采用分层抽样的办法抽取样本.某中学共有学生2000名,抽取了一个容量为200的样本,已知样本中女生比男生少6人,则该校共有女生__人.
答案:970
分析:
求出样本中女生人数,求出抽样比,即可求出.
【详解】
因为样本容量为200,女生比男生少6人,所以样本中女生的人数为97,
因为分层抽样的抽取比例为,
所以总体中女生的人数为970人.
故答案为:970.
6.(2023·河南)洛阳牡丹花会闻名全国.某园林企业先后培育出牡丹新品种,现选取部分样本,并测得花冠直径的数据为:(单位:),则该组数据的中位数和众数分别为___________.
答案:,
分析:
将这组数据按从小到大的顺序排列,再由中位数和众数的定义即可求解.
【详解】
按照从小到大顺序排列为:,,,,,,,,
其中位数,众数.
故答案为:,.
7.(2023·江苏如皋·高一月考)已知样本数据的标准差为2,则数据的标准差为___________.
答案:6
分析:
先求出数据的方差,再求出新数据的方差即得解.
【详解】
由题得样本数据的方差为4,
所以数据的方差,
所以数据的标准差为6.
故答案为:6
8.(2023·江苏南京·金陵中学高一月考)甲、乙两名篮球运动员在随机抽取的12场比赛中的得分情况如下:
甲:12,15,20,25,31,31,36,36,37,39,44,49.
乙:8,13,14,16,23,26,28,29,31,38,39,51.
则运动员甲得分的25百分位数与运动员乙得分的80百分位数的和为______.
答案:
分析:
根据百分位数的计算规则计算可得;
【详解】
解:因为,故运动员甲得分的25百分位数为从小到大排列的第3和4个数的平均数,为;
又,所以运动员乙得分的80百分位数为从小到大排列的第10个数,为,所以
故答案为:
9.(2023·河北运河·沧州市一中高一月考)数据,,,平均数为6,标准差为2,若数据,,,的平均数为a,方差为b,则______.
答案:49
分析:
利用平均数和方差的线性关系的性质直接求出a、b,即可求出a+b.
【详解】
数据,,,平均数为6,所以数据,,,的平均数为,即a=13;
数据,,,的标准差为2,所以数据,,,的方差为4,
所以数据,,,的方差为,即b=36,
所以13+36=49.
故答案为:49.
10.(2023·全国高一课时练习)某区高二年级的一次数学统考中,随机抽取M名同学的成绩,数据的分组统计表如下:
(1)表中m,n,p,M,N,P的值分别为___________,___________,___________,___________,___________,___________.
(2)若该区高二学生有5000人,估计这次统考中该区高二学生分数在区间内的人数为___________.
答案:34 0.34 0.034 100 1 0.1 4150
分析:
(1)利用频率、频数以及样本容量之间的关系即可求得,,,进而可得到,再利用频率之和为1可得出,进而得到;(2)首先求出分数在区间内的频率之和,然后结合总人数即可求解.
【详解】
(1)当成绩分数在内时,频数为2,样本容量为,频率为0.02,
所以,
又因为,
所以,
从而,
,
又因为频率之和为1,即,
从而.
(2) 高二学生分数在区间内,其频率之和为,
故这次统考中该区高二学生分数在区间内的人数为.
故答案为:(1)34;0.34;0.034;100;1;0.1;(2)4150.
41792
71635
86089
32157
95620
92109
29145
74955
82835
98378
83513
47870
20799
32122
类别
共同点
各自特点
联系
适用范围
简单随机抽样
①抽样过程中每个个体被抽到的可能性相等;
②每次抽出个体后不再将它放回,即不放回抽样
从总体中逐个抽取
总体个数较少
分层
抽样
将总体分成几层,分层进行抽取
各层抽样时,采用简单随机抽样
总体由差异明显的几部分组成
分组
频数
频率
6
0.20
18
0.60
4
0.13
2
0.07
合计
30
1.00
的分组
企业数
2
24
53
14
7
分组
频数
频率
12
0.10
30
0.60
0.05
合计
120
1.00
分组
频数
频率
频率组距
2
4
11
38
11
合计
相关试卷
这是一份新高考高中数学核心知识点全透视专题3.7函数、方程与不等式的关系(精讲精析篇)(原卷版+解析),共26页。试卷主要包含了7 函数、方程与不等式的关系,是定义在上的增函数等内容,欢迎下载使用。
这是一份专题11 圆锥曲线-2021年高考冲刺之二轮专题精讲精析,文件包含专题11圆锥曲线原卷版-2021年高考冲刺之二轮专题精讲精析doc、专题11圆锥曲线解析版-2021年高考冲刺之二轮专题精讲精析doc等2份试卷配套教学资源,其中试卷共30页, 欢迎下载使用。
这是一份专题15 导数的应用-2021年高考冲刺之二轮专题精讲精析,文件包含专题15导数的应用原卷版-2021年高考冲刺之二轮专题精讲精析doc、专题15导数的应用解析版-2021年高考冲刺之二轮专题精讲精析doc等2份试卷配套教学资源,其中试卷共30页, 欢迎下载使用。