所属成套资源:2023年新高考数学考前提分锦囊【三轮冲刺】
专题09 统计与统计案例——【高考三轮冲刺】2023年新高考数学考前提分冲刺(原卷版+解析版)
展开这是一份专题09 统计与统计案例——【高考三轮冲刺】2023年新高考数学考前提分冲刺(原卷版+解析版),文件包含专题9统计与统计案例解析版docx、专题9统计与统计案例原卷版docx等2份试卷配套教学资源,其中试卷共56页, 欢迎下载使用。
专题九 统计与统计案例
一、考情分析
统计与统计案例也是考查热点,客观题与解答题都有可能考查,常考查的知识点有:抽样方法、用样本估计总体、回归分析及独立性检验。
二、三年新高考真题展示
1. (2020新高考山东卷)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
32
18
4
6
8
12
3
7
10
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面的列联表:
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
0.050 0.010 0.001
3841 6.635 10.828
【解析】(1)由表格可知,该市100天中,空气中的浓度不超过75,且浓度不超过150的天数有天,
所以该市一天中,空气中的浓度不超过75,且浓度不超过150的概率为;
(2)由所给数据,可得列联表为:
合计
64
16
80
10
10
20
合计
74
26
100
(3)根据列联表中的数据可得
,
因为根据临界值表可知,有的把握认为该市一天空气中浓度与浓度有关.
2.(2021新高考全国卷Ⅰ)有一组样本数据,,,,由这组数据得到新样本数据,,,,其中,2,,,为非零常数,则
A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同 D.两组样本数据的样本极差相同
【答案】CD
【解析】对于,两组数据的平均数的差为,故错误;
对于,两组样本数据的样本中位数的差是,故错误;
对于,标准差,
两组样本数据的样本标准差相同,故正确;
对于,,2,,,为非零常数,
的极差为,的极差为,
两组样本数据的样本极差相同,故正确.
故选.
3. (2021新高考全国卷Ⅱ)下列统计量中,能度量样本的离散程度的是( )
A. 样本的标准差 B. 样本的中位数
C. 样本的极差 D. 样本的平均数
【答案】AC
【解析】由标准差的定义可知,标准差考查的是数据的离散程度;
由中位数的定义可知,中位数考查的是数据的集中趋势;
由极差的定义可知,极差考查的是数据的离散程度;
由平均数的定义可知,平均数考查的是数据的集中趋势;故选AC
4. (2022新高考全国卷Ⅰ)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.与的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:;
(ⅱ)利用该调查数据,给出的估计值,并利用(ⅰ)的结果给出R的估计值.
附,
0.050
0.010
0.001
k
3.841
6.635
10.828
【解析】(1)由题意知,,
,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)证明:,
,
(ii) 由已知得,,
又,,所以
5.(2022新高考全国卷Ⅱ)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间的概率;
(3)已知该地区这种疾病的患病率为,该地区年龄位于区间的人口占该地区总人口的.从该地区中任选一人,若此人的年龄位于区间,求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【解析】(1)平均年龄
(岁).
(2)设{一人患这种疾病的年龄在区间},所以
.
(3)设任选一人年龄位于区间,任选一人患这种疾病,
则由条件概率公式可得
.
三、知识、方法、技能
1.简单随机抽样
(1)定义:设一个总体含有个个体,从中逐个不放回地抽取个个体作为样本,如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.(1)最常用的简单随机抽样的方法:抽签法和随机数表法.
(2)抽签法与随机数表法的区别与联系
抽签法和随机数表法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而随机数表法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数表法能够快速地完成抽样.
3.应用简单随机抽样应注意的问题
(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.
(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.
4.分层抽样的定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
5.分层抽样问题类型及解题思路
(1)求某层应抽个体数量:按该层所占总体的比例计算.
(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.
(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.
6. 制作频率分布直方图的步骤
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表;
第四步:画频率分布直方图.
7. 解决频率分布直方图问题时要抓住3个要点
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总体数.
8.样本的数字特征
(1)众数
在一组数据中,出现次数最多的数据叫做这组数据的众数.
(2)中位数
将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数
(3)平均数
样本数据的算术平均数,即.
(4)百分位数
定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
计算步骤:计算一组n个数据的第p百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
9.用频率分布直方图估计众数、中位数、平均数的方法
(1)众数为频率分布直方图中最高矩形底边中点横坐标;
(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;
(3)平均数等于每个小矩形面积与小矩形底边中点横坐标之积的和.
10.方差与标准差
(1)标准差是样本数据到平均数的一种平均距离.
(2)方差:(是样本数据,是样本容量,是样本平均数).
(3)标准差:.
11.平均数、方差公式的推广
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
12. 平均数和方差是重要的数字特征,是对总体的一种简明的阐述.平均数描述总体的平均水平,方差反映了数据偏离于平均数的程度,它们从整体和全局上刻画了总体特征,是生产实际中用于方案取舍的重要的理论依据,一般先比较平均数,若平均数相同,再用方差来决定.
13.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是确定性的函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系,带有随机性.
(2)相关关系与函数关系的异同点
相同点:两者均是指两个变量的关系.
不同点:
①函数关系是一种确定性关系,而相关关系是一种非确定性关系;
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
14.两个变量的线性相关
(1)如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫回归直线.
15. 回归直线方程
(1)通过求的最小值而得出回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.该式取最小值时的,的值即分别为,.
(2)两个具有线性相关关系的变量的一组数据:,,…,,其回归方程为,则
16. 相关系数
r=,当时,表示两个变量正相关;当时,表示两个变量负相关.的绝对值越接近1,表示两个变量的线性相关性越强;的绝对值越接近0,表示两个变量的线性相关性越弱.通常当的绝对值大于时,便认为两个变量具有很强的线性相关关系.
17. 样本点的中心一定在回归直线上
18. 散点图
(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面
直角坐标系中得到的图形.
(2)从散点图上看,如果点分布在从左下角到右上角的区域内,那么两个变量的这种相关关系称为正相关;如果点分布在从左上角到右下角的区域内,那么两个变量的这种相关关系称为负相关.
19. 若所有样本点都在回归直线上,则。
20. 相关系数.越大,说明残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.在线性回归模型中,表示解释变量对于预报变量变化的贡献率,越接近于1,表示回归的效果越好.
21. 非线性回归问题的处理方法
一般地,有些非线性回归模型通过变换可以转化为线性回归模型,即借助于线性回归模型研究呈非线性回归关系的两个变量之间的关系:
(1)如果散点图中的点分布在一个直线状带形区域,可以选用线性回归模型来建模;
(2)如果散点图中的点分布在一个曲线状带形区域,要先对变量作适当的变换,再利用线性回归模型来建模.
(3)非线性回归方程的求法
①根据原始数据(x,y)作出散点图;
②根据散点图,选择恰当的拟合函数.
22.分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这
类随机变量称为分类变量.分类变量的取值可以用实数表示.
23.列联表
假设两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为
X
Y
合计
y1
y2
x1
a
b
a+b
x2
c
d
c+d
合计
a+c
b+d
a+b+c+d
24. ,其中为样本容量.
25.应用独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释;
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较;
(3)根据检验规则得出推断结论;
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规
律.
注意,上述几个环节的内容可以根据不同情况进行调整.例如,在有些时候,分类变量
的抽样数据列联表是问题中给定的.
四、新高考地区最新模拟试题精选
一、单选题
1.(2023届河北省衡水市高三1月月考)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1200人,其每天睡眠时间均值为8小时,方差为,则估计该地区中学生每天睡眠时间的方差为( )
A. B. C. D.
【答案】B
【解析】该地区中学生每天睡眠时间的平均数为:(小时),
该地区中学生每天睡眠时间的方差为:
.故选B
2.(2023届福建省莆田第一中学高三上学期段考)为考查A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )
A.药物B的预防效果优于药物A的预防效果
B.药物A的预防效果优于药物B的预防效果
C.药物A,B对该疾病均有显著的预防效果
D.药物A,B对该疾病均没有预防效果
【答案】B
【解析】根据两个表中的等高条形图知,药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,所以药物A的预防效果优于药物B的预防效果,故选B.
3.(2022届山东省济宁市高三二模)为研究变量x,y的相关关系,收集得到下面五个样本点:
x
5
6.5
7
8
8.5
y
9
8
6
4
3
若由最小二乘法求得y关于x的回归直线方程为,则据此计算残差为0的样本点是( )
A. B. C. D.
【答案】C
【解析】由题意可知,,,
所以回归方程的样本中心点为,因此有,
所以,在收集的5个样本点中,一点在上,故计算残差为0的样本点是.故选C.
4.(2022届湖北省荆州中学等四校高三下学期四模)酒后驾驶是严重危害交通安全的行为,某交通管理部门对辖区内四个地区(甲、乙、丙、丁)的酒驾治理情况进行检查督导,若“连续8天,每天查获的酒驾人数不超过10”,则认为“该地区酒驾治理达标”,根据连续8天检查所得数据的数字特征推断,酒驾治理一定达标的地区是( )
A.甲地:均值为7,方差为2 B.乙地:众数为3,中位数为2
C.丙地,均值为4,中位数为5 D.丁地:极差为,中位数为8
【答案】A
【解析】不妨设8天中,每天查获的酒驾人数从小到大为
且其中
选项A,若不达标,则,由均值为7可知,则其余七个数中至少有一个数不等于7,由方差定义可知,,这与方差为2矛盾,从而甲地一定达标,故A正确
选项B:由众数和中位数的定义可知,当,,,时,乙地不达标,故B错误
选项C:若不达标,则,由均值为7可知,因为中位数是5,所以
又因为均值为4,故,从而,
且,则,,,满足题意,从而丙地有可能不达标,故C错误
选项D:由极差和中位数的定义可知,当,
时,丁地不达标,故D错误故选A
二、多选题
5.(2023届广东省揭阳市高三上学期期末)2022年前三个季度全国居民人均可支配收入27650元,比2021年同期增长了约5.3%,图①为2021年与2022年前三季度全国及分城乡居民人均可支配收入的对比图;图②为2022年前三季度全国居民人均消费支出及构成(其中全国居民人均可支配收入=城镇居民人均可支配收入×城镇人口比重+农村居民人均可支配收入×农村人口比重),则下列说法正确的是( )
A.2022年前三个季度全国居民可支配收人的中位数一定高于2021年同期全国居民可支配收入的中位数
B.2022年城镇居民人数多于农村居民人数
C.2022年前三个季度全国居民在食品烟酒以及居住方面的人均消费超过了总消费的50%
D.2022年前三个季度全国居民在教育文化娱乐方面的人均消费支出超过了3700元
【答案】BC
【解析】对于选项A,图中信息体现的是平均数的差别,没有提供中位数的信息,不能作出判断,故选项A错误;
对于选项B,设2022年城镇居民占全国居民的比重为x,
则有,解得,故选项B正确;
2022年前三个季度全国居民在食品烟酒以及居住方面的人均消费支出占总消费的比例分别为30%,24%,故选项C正确;
2022年前三个季度全国居民在教育文化娱乐方面的人均消费支出为(元),且,故选项D错误.故选BC.
三、填空题
6.(2023届广东省高三上学期第一次联考)一只红铃虫产卵数和温度有关,现测得一组数据,可用模型拟合,设,其变换后的线性回归方程为,若,,为自然常数,则________.
【答案】
【解析】经过变换后,得到,根据题意,故,又,故,,故,于是回归方程为一定经过,故,解得,即,于是.
7.(2022届江苏省南京市玄武区高三下学期适应性考试)已知样本数据的平均数与方差满足如下关系式:,若已知15个数的平均数为6,方差为9;现从原15个数中剔除这5个数,且剔除的这5个数的平均数为8,方差为5,则剩余的10个数的方差为___________.
【答案】
【解析】根据题目所给的条件,
,所以,
所以剩余10个数的平均数为5.
,,
所以,所以这10个数的方差为.
四、解答题
8.(2023届海南华侨中学高三上学期月考)进入高三时需要检测考试,并且命题是以高二每次月考成绩为参照依据,在整个高二期间共有8次月考,某学生在高二前5次月考的数学成绩如下表:
高二月考第x次
1
2
3
4
5
月考考试成绩y分
85
100
100
105
110
(1)已知该学生的月考试成绩 y 与月考的次数 x 满足回归直线方程,若进入高三时检测考试看作高二第9次月考考试,试估计该学生的进入高三时检测考试成绩:
(2)把该学生前5次月考的考试成绩写在纸片上,折成纸团放在不透明的箱中充分混合,从纸箱中随机抽出3个纸团上写的月考成绩进行研究,设抽取的纸团上写的成绩等于平均值的个数为,求出的分布列与数学期望.
参考公式:,,
【解析】(1)由题可得,
,
,
,
∴,
,所以,
当时,,即该学生的进入高三时检测考试成绩为133分;
(2)由题可知可取0,1,2,则
,,,
所以的分布列为:
0
1
2
∴.
9.(2022届重庆市第八中学校高三下学期调研)手机运动计步已经成为一种新时尚.某单位统计职工一天行走步数(单位:百步)得到如下频率分布直方图.由频率分布直方图估计该单位职工一天行走步数的中位数为125(百步),其中同一组中的数据用该组区间的中点值为代表.
(1)试计算图中的a、b值,并以此估计该单位职工一天行走步数的平均值;
(2)为鼓励职工积极参与健康步行,该单位制定甲、乙两套激励方案:记职工个人每日步行数为,其超过平均值的百分数,若,职工获得一次抽奖机会;若,职工获得二次抽奖机会;若,职工获得三次抽奖机会;若,职工获得四次抽奖机会;若超过50,职工获得五次抽奖机会.设职工获得抽奖次数为n.方案甲:从装有1个红球和2个白球的口袋中有放回的逐个抽取n个小球,抽得红球个数即表示该职工中奖几次;方案乙:从装有6个红球和4个白球的口袋中无放回的逐个抽取n个小球,抽得红球个数即表示该职工中奖几次;若某职工日步行数为15700步,以期望为决策依据判断哪个方案更佳?
【解析】(1)由题意得:
解得,,
∴;
(2)某职工日行步数(百步),,
∴职工获得三次抽奖机会,设职工中奖次数为X,在方案甲下,
则分布列为:
X
0
1
2
3
P
;
在方案乙下:的可能取值为0,1,2,3
,,
,,
所以分布列为:
X
0
1
2
3
P
,因为,所以方案乙更佳.
10.(2023届河北省沧州市高三上学期12月教学质量监测)近年来,国家鼓励德智体美劳全面发展,舞蹈课是学生们热爱的课程之一.某高中随机调研了本校2022年参加高考的90位考生是否喜欢跳舞的情况,经统计,跳舞与性别情况如下表:(单位:人)
喜欢跳舞
不喜欢跳舞
女性
25
35
男性
5
25
(1)根据表中数据并依据小概率值的独立性检验,分析喜欢跳舞与性别是否有关联?
(2)用样本估计总体,用本次调研中样本的频率代替概率,从2022年本市考生中随机抽取3人,设被抽取的3人中喜欢跳舞的人数为X,求X的分布列,数学期望和方差.
附:,.
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
【解析】(1)零假设::喜欢跳舞与性别无关联,
由题意,,
依据小概率值的独立性检验,可推断不成立,即认为喜欢跳舞与性别有关联.
(2)由题知,考生喜欢跳舞的概率,不喜欢跳舞的概率为
X的可能取值为0,1,2,3
,,
,
所以X的分布列如下:
0
1
2
3
由,数学期望,方差.
11.(2023届福建省宁德市高级中学高三上学期期末)2022年是中国共产主义青年团成立100周年,某中学为此举办了一次共青团史知识竞赛,并规定成绩在内为成绩优秀.现对参赛的100名学生的竞赛成绩进行统计,得到如下人数分布表.
成绩
人数
20
40
30
10
(1)根据以上数据完成列联表,并判断是否有95%的把握认为此次竞赛成绩与该学生是初中生还是高中生有关;
优秀
非优秀
合计
初中生
20
高中生
45
合计
(2)为鼓励学生积极参加这次知识竞赛,学校后勤部给参与竞赛的学生制定了两种不同的奖励方案:
方案一:参加了竞赛的学生每人都可抽奖1次,且每次抽奖互不影响,每次中奖的概率均为,抽中奖励价值50元的食堂充值卡,未抽中无奖励;方案二:竞赛成绩优秀的抽奖两次,其余学生抽奖一次,抽奖者点击抽奖按钮,即随机产生一个数字(),若产生的数字能被3整除,则可奖励价值40元的食堂充值卡,否则奖励20元的食堂充值卡(充值卡奖励可叠加).若学校后勤部财责人希望让学生得到更多的奖励,则该负责人应该选择哪一种奖励方案,并说明理由.
参考公式:.,.
附表:
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
【解析】(1)优秀的人数为,所以列取表如下:
优秀
非优秀
合计
初中生
20
15
35
高中生
20
45
65
合计
40
60
100
因为,
所以有95%的把握认为此次竞赛成绩与该学生是初中生还是高中生有关;
(2)方案一:一个学生获得食堂充值卡的金额的数学期望为,
方案二:能被3整除的概率为,
设一个优秀学生获得充值卡的金额数为,则,
,,
,
因此,
不优秀学生获得充值卡的金额数为,
所以一个学生获得充值卡的金额数的数学期望为:,
显然,所以按照方案二满足要求.
12.(2023届山东省潍坊市高三上学期期中)2022年2月22日,中央一号文件发布,提出大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台,对本乡村的农产品进行销售,在众多的网红直播中,随机抽取了10名网红直播的观看人次和农产品销售量的数据,如下表所示:
观看人次x(万次)
76
82
72
87
93
78
89
66
81
76
销售量y(百件)
80
87
75
86
100
79
93
68
85
77
参考数据:.
(1)已知观看人次与销售量线性相关,且计算得相关系数,求回归直线方程;
(2)规定:观看人次大于等于80(万次)为金牌主播,在金牌主播中销售量大于等于90(百件)为优秀,小于90(百件)为不优秀,对优秀赋分2,对不优秀赋分1.从金牌主㨨中随机抽取3名,若用表示这3名主播赋分的和,求随机变量的分布列和数学期望.
(附:,相关系数)
【解析】(1)因为,所以
所以,所以,
,,
所以回归直线方程为.
(2)金牌主播有5人,2人赋分为2,3人赋分为1,
则随机变量的可能取值为3,4,5,
,,,
所以的分布列为:
3
4
5
所以.
13.(2023届湖北省新高考协作体高三上学期考试)为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按,,,,分组,绘制频率分布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立.
(1)填写下面的列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
单位:只
抗体
指标值
合计
小于60
不小于60
有抗体
没有抗体
合计
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率;
(ii)以(i)中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记个人注射2次疫苗后产生抗体的数量为随机变量.试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数及.
参考公式: (其中为样本容量)
参考数据:
0.50
0.40
0.25
0.15
0.100
0.050
0.025
0.455
0.708
1.323
2.072
2.706
3.841
5.024
【解析】(1)由频率分布直方图,知200只小白鼠按指标值分布为:
在内有(只);在内有(只);
在内有(只);在内有(只);
在内有(只).
由题意,有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有(只),所以指标值小于60且没有抗体的小白鼠有20只,同理,指标值不小于60且没有抗体的小白鼠有20只,故列联表如下:
单位:只
抗体
指标值
合计
小于60
不小于60
有抗体
50
110
160
没有抗体
20
20
40
合计
70
130
200
零假设为:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.
根据列联表中数据,得.
根据的独立性检验,推断不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,此推断犯错误的概率不大于0.05.
(2)(i)令事件“小白鼠第一次注射疫苗产生抗体”,事件“小白鼠第二次注射疫苗产生抗体”,事件“小白鼠注射2次疫苗后产生抗体”.
记事件A,B,C发生的概率分别为,,,
则,,.
所以一只小白鼠注射2次疫苗后产生抗体的概率.
(ii)由题意,知随机变量,().
因为最大,
所以,
解得,因为是整数,所以或,所以接受接种试验的人数为99或100.
①当接种人数为99时,;
②当接种人数为100时,.
14.(2023届湖南师范大学附属中学高三上学期月考)汽车尾气排放超标是全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大在新能源项目的支持力度,积极推动新能源汽车产业发展,某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
销量万辆
10
12
17
20
26
(1)统计表明销量与年份代码有较强的线性相关关系,求关于的线性回归方程,并预测该地区新能源汽车的销量最早在哪一年能突破50万辆;
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业心随机调查了该地区200位购车车主的购车情况作为样本其中男性车主中购置传统燃油汽车的有名,购置新能源汽车的有45名,女性车主中有20名购置传统燃油汽车.
①若,将样本中购置新能源汽车的性别占比作为概率,以样本估计总体,试用(1)中的线性回归方程预测该地区2023年购置新能源汽车的女性车主的人数(假设每位车主只购买一辆汽车,结果精确到千人);
②设男性车主中购置新能源汽车的概率为,将样本中的频率视为概率,从被调查的所有男性车主中随机抽取5人,记恰有3人购置新能源汽车的概率为,求当为何值时,最大.
附: 为回归方程,,.
【解析】(1)解:由题意得 ,,
,.
所以,.
所以关于的线性回归方程为,令,得,
所以最小的整数为12,,
所以该地区新能源汽车的销量最早在2028年能突破50万辆.
(2)解:①由题意知,该地区200名购车者中女性有名,
故其中购置新能源汽车的女性车主的有名.
所购置新能源汽车的车主中,女性车主所占的比例为.
所以该地区购置新能源汽车的车主中女性车主的概率为.
预测该地区2023年购置新能源汽车的销量为33万辆,
因此预测该地区2020年购置新能源汽车的女性车主的人数为万人
②由题意知,,则
当时,知所以函数单调递增
当时,知所以函数单调递减
所以当取得最大值.
此时,解得,所以当时取得最大值.
五、延伸拓展
(一)统计图的应用
统计图一直是高考热点,且考查的统计图不限于课本介绍的几种统计图
统计图是利用点、线、面、体等绘制成几何图形,以表示各种数量间的关系及其变动情况的工具.其中有条形统计图、扇形统计图、折线统计图、象形图等.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.
一、频率分布直方图
1.某校举办了迎新年知识竞赛,随机选取了100人的成绩整理后画出的频率分布直方图如下,则根据此频率分布直方图,下列结论不正确的是( )
A.该校约有一半学生成绩高于70分 B.该校不及格人数比例估计为25%
C.估计该校学生成绩的中位数为70分 D.估计该校学生的平均成绩超过了70分
【答案】D
【解析】由频率分布直方图知分数在和的频率为,
因此成绩高于70分的频率为,A正确;
不及格人数即分数低于60分的频率为,B正确;
由选项A的计算知C正确;
平均成绩为,D错误,故选D.
2.为了解市民的生活幸福指数,某组织随机选取了部分市民参与问卷调查,将他们的生活幸福指数(满分100分)按照分成5组,制成如图所示的频率分布直方图,根据此频率分布直方图,估计市民生活幸福指数的中位数为( )
A.70 B. C. D.60
【答案】C
【解析】由题意可得,解得.
因为成绩在的频率为,
成绩在的频率为,
故市民生活幸福指数的中位数在内.
设市民生活幸福指数的中位数为,则,解得.故选C
3.某中学为了解高三男生的体能情况,通过随机抽样,获得了200名男生的100米体能测试成绩(单位:秒),将数据按照分成9组,制成了如图所示的频率分布直方图.
由直方图可估计本校高三男生100米体能测试成绩小于13.5秒的人数为( )
A.47 B.54 C.67 D.94
【答案】D
【解析】由题意,则,解得,
由图,则本校高三男生100米体能测试成绩小于13.5秒的频率为,
估计本校高三男生100米体能测试成绩小于13.5秒的人数为.故选D.
二、柱形图与条形图
4.5G时代已经到来,5G的发展将直接带动包括运营、制造、服务在内的通信行业整体的快速发展,进而对GDP增长产生直接贡献,并通过产业间的关联效应和波及效应,间接带动国民经济各行业的发展,创造出更多的经济价值.如图所示的统计图是某单位结合近几年的数据,对今后几年的5G直接经济产出做出的预测.
则以下结论错误的是( )
A.运营商的5G直接经济产出逐年增加
B.设备制造商的5G直接经济产出前期增长较快,后期放缓
C.设备制造商在各年的5G直接经济产出中一直处于领先地位
D.信息服务商与运营商的5G直接经济产出的差距有逐步拉大的趋势
【答案】C
【解析】由图象可得,5G的直接经济产出逐年增加,故A正确;
设备制造商的直接经济产出前期增长较快,后期放缓,故B正确;
设备制造商在各年的直接经济产出中在前期处于领先地位,而后期是信息服务商处于领先地位,故C错误;
2025年开始信息服务商与运营商的直接经济产出的差距有逐步拉大的趋势,故D正确.故选C.
5.甲、乙两位同学本学期前8周的各周课外阅读时长的条形统计图如图所示,
则下列结论正确的是( )
A.甲同学周课外阅读时长的样本众数为8
B.甲同学周课外阅读时长的样本中位数为5.5
C.乙同学周课外阅读时长的样本平均数是7.5
D.乙同学周课外阅读时长大于8的概率的估计值大于0.4
【答案】C
【解析】由图可得甲同学周课外阅读时长:4,5,6,6,8,8,10,11(从小到大排序),
甲同学周课外阅读时长的样本众数是6和8,中位数为,选项A,B不正确:
对于C选项,乙同学课外体育运动时长的样本平均数为:,选项C正确;
对于D选项,乙同学周课外阅读时长大于8的概率的估计值,选项D不正确.故选C.
三、管状图
6. 如图所示,下面是出口,上面是进口,下列选项叙述错误的是( )
A.从2018年开始,2021年进出口总增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始, 2020年的进出口总额增长率最小
【答案】C
【解析】从2018年开始,进出口总额依次是30.5,31.57,32.22,39.10,
进出口总增长率依次是2019年,2020年,2021年,选项ABD正确;
2019年进口总额比2020年进口总额小,选项C错误;故选C
7.2021年,我国全年货物进出口总额391009亿元,比上年增长21.4%.其中,出口217348亿元,增长21.2%;进口173661亿元,增长21.5%.货物进出口顺差43687亿元,比上年增加7344亿元.如图是我国2017—2021年货物进出口总额统计图,则下面结论中不正确的是( )
A.2020年的货物进出口总额322215亿元 B.2020年的货物进出口顺差36343亿元
C.2017—2021年,货物进口总额逐年上升 D.2017—2021年,货物出口总额逐年上升
【答案】C
【解析】对于A,2020年的货物进出口总额为亿元,故A正确;
对于B,2020年的货物进出口顺差为亿元,故B正确;
对于C,2020年的货物进口总额为142936亿元,相对于2019的货物进口总额143254亿元下降了,故C错误;对于D,2017—2021年,货物出口总额逐年上升,故D正确.故选C
四、折线图
8.下图为2012年─2021年我国电子信息制造业企业和工业企业利润总额增速情况折线图,根据该图,下列结论正确的是( )
A.2012年─2021年电子信息制造业企业利润总额逐年递增
B.2012年─2021年工业企业利润总额逐年递增
C.2012年─2017年电子信息制造业企业利润总额均较上一年实现增长,且其增速均快于当年工业企业利润总额增速
D.2012年─2021年工业企业利润总额增速的均值大于电子信息制造业企业利润总额增速的均值
【答案】C
【解析】对于A,2018年电子信息制造业企业利润总额增速为负数,从2017到2018利润总额下降,故A不正确;
对于B,2015年工业企业利润总额增速为负数,从2014到2015利润总额下降,2019年工业企业利润总额增速为负数,从2018到2019利润总额下降,故B不正确;
对于C,2012年─2017年电子信息制造业企业利润总额增速均为正数,所以利润总额均较上一年实现增长,且其增速均大于当年工业企业利润总额增速,故C正确;
对于D,2012年─2021年工业企业利润总额增速的均值为,2012年─2021年电子信息制造业企业利润总额增速的均值为,,故D不正确.
故选C
9. 某地自2018年起实行湖长制,境内湖泊水质不断提升.为了解治理成效,环境监测部门每年在该地所有湖泊中随机选取80个进行水质调查,得到数据如下,并且五年来,该地通过退耕还湖,湖泊总量由160个增加至200个.下列说法不正确的是( )
A.该地水质差湖泊总量逐年递减 B.该地水质好湖泊总量逐年递增
C.该地平均每年新增10个湖泊 D.该地平均每年新增至少45个水质好湖泊
【答案】A
【解析】根据图中湖泊总量折线图可得从2018年到2022年,该地平均每年新增的湖泊个数为,故C正确;
根据图中水质差的湖泊数的折线图可得该地水质差湖泊总量数前3年分别为:
,,,故A错误.
根据图中水质好的湖泊数的折线图可得该地水质好湖泊总量数分别为:
,,,,,
该地水质好湖泊总量数逐年递增,故B正确.
从2018年到2022年,该地平均每年新增水质好湖泊数量为,
故D正确.故选A.
五、扇形图与饼形图
10. 某高中为促进学生的全面发展,秋季学期合唱团、朗诵会、脱口秀、街舞社、音乐社等五个社团面向1200名高一年级同学招新,每名同学依据自己兴趣爱好最多可参加其中一个,各个社团的人数比例的饼状图如图所示,其中参加音乐社社团的同学有15名,参加脱口秀社团的有20名,则( )
A.高一年级同学参加街舞社社团的同学有120名
B.脱口秀社团的人数占这五个社团总人数的
C.高一年级参加这五个社团总人数占全年级人数的
D.高一年级同学参加这五个社团的总人数为200名
【答案】B
【解析】参加音乐社社团或者脱口秀社团的同学共有35名,结合扇形图知:其占这五个社团总人数的,
所以高一加这五个社团总人数为名,故AD均错,
脱口秀社团的人数占这五个社团总比为,故B对,
参加这五个社团总人数占全年级人数的占比为,故C错.故选B
11. 2021年11月10日,中国和美国在联合国气候变化格拉斯哥大会期间发布《中美关于在21世纪20年代强化气候行动的格拉斯哥联合宣言》(以下简称《宣言》).承诺继续共同努力,并与各方一道,加强《巴黎协定》的实施,双方同意建立“21世纪20年代强化气候行动工作组”,推动两国气候变化合作和多边进程.为响应《宣言》要求,某地区统计了2020年该地区一次能源消费结构比例,并规划了2030年一次能源消费结构比例,如图所示:经测算,预估该地区2030年一次能源消费量将增长为2020年的2.5倍,预计该地区( )
A.2030年煤的消费量相对2020年减少了
B.2030年天然气的消费量比2020年的消费量增长了5倍
C.2030年石油的消费量相对2020年不变
D.2030年水、核、风能的消费量是2020年的7.5倍
【答案】D
【解析】设年该地区一次能源消费总量为,
年煤的消费量为,规划年煤的消费量为,故A错误;
年天然气的消费量为,规划年天然气的消费量为,比2020年增长了4倍,故B错误;
年石油的消费量为,规划年石油的消费量为,故C错误;
年水、核、风能的消费量为,规划年水、核、风能的消费量为,故D正确.故选D.
六、雷达图
12. 为比较甲、乙两名学生的数学素养,对课程标准中规定的六大数学核心素养进行指标测验,指标值满分为5分,分值高者为优,根据测验情况绘制了如图所示的六大数学素养指标雷达图,则下面叙述错误的是( )
A.甲的数据分析素养优于乙
B.乙的数学运算素养优于数学抽象素养
C.甲的六大数学素养指标值波动性比乙小
D.甲、乙在数学建模上的差距比在直观想象上的差距大
【答案】D
【解析】根据雷达图进行数据分析:
对于A:甲的数据分析素养指标为5,乙的数据分析素养指标为4.故A正确;
对于B:乙的数学运算素养指标为5,数学抽象素养指标为3.故B正确;
对于C:甲的六大数学素养指标值均为4或5,波动较小. 乙的六大数学素养指标值有3,4,5,故甲波动较小.故C正确;
对于D:甲、乙在数学建模上的指标差距为1,甲、乙在直观想象上的指标差距为2.故D错误.故选D.
13. 某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中点表示十月的平均最高气温约为,点表示四月的平均最低气温约为.下面叙述正确的个数有( )个
①七月的平均温差比一月的平均温差大;②十月的平均温差最大;③三月和十一月的平均最高气温基本相同;④平均最高气温在到之间的月份至少有个
A.1 B.2 C.3 D.4
【答案】B
【解析】对于选项①,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,故①正确;
对于选项②,十月的平均温差明显小于七月,故②不正确;
对于选项③,三月和十一月的平均最高气温均为,故③正确;
对于选项④,平均最高气温在到之间的月份有五月、九月,共2个月份,故④不正确.
故选B.
七、气泡图
14.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )
A.2018年3月的销售任务是400台
B.2018年月销售任务的平均值不超过600台
C.2018年第一季度总销售量为830台
D.2018年月销售量最大的是6月份
【答案】D
【解析】对于选项A,由图可得3月份的销售任务是400台,所以A正确.
对于选项B,由图形得2018年月销售任务的平均值为
,所以B正确.
对于选项C,由图形得第一季度的总销售量为台,所以C正确.
对于选项D,由图形得销售量最大的月份是5月份,为800台,所以D不正确.故选D.
八、其他统计图
15.市场占有率指在一定时期内,企业所生产的产品在其市场的销售量(或销售额)占同类产品销售量(或销售额)的比重.一般来说,市场占有率会随着市场的顾客流动而发生变化,如果市场的顾客流动趋向长期稳定,那么经过一段时期以后的市场占有率将会出现稳定的平衡状态(即顾客的流动,不会影响市场占有率),此时的市场占有率称为“稳定市场占有率”.有A,B,C三个企业都生产某产品,2022年第一季度它们的市场占有率分别为:40%,30%,30%.经调查,2022年第二季度A,B,C三个企业之间的市场占有率转移情况如下图所示:
若该产品以后每个季度的市场占有率转移情况均与2022年第二季度相同,则当市场出现稳定的平衡状态,最终达到“稳定市场占有率”时,A企业该产品的“稳定市场占有率”为( )
A.45% B.48% C.50% D.52%
【答案】C
【解析】最终达到“稳定市场占有率”时,设A企业该产品的“稳定市场占有率”为x,则
,解得.故选C
16.最早发现于2019年7月的某种流行疾病给世界各国人民的生命财产带来了巨大的损失.近期某市由于人员流动出现了这种疾病,市政府积极应对,通过3天的全民核酸检测,有效控制了疫情的发展,决定后面7天只针对41类重点人群进行核酸检测,下面是某部门统计的甲、乙两个检测点7天的检测人数统计图,则下列结论不正确的是( )
A.甲检测点的平均检测人数多于乙检测点的平均检测人数
B.甲检测点的数据极差大于乙检测点的数据极差
C.甲检测点数据的中位数大于乙检测点数据的中位数
D.甲检测点数据的方差大于乙检测点数据的方差
【答案】C
【解析】对于:甲检测点的平均检测人数为
乙检测点的平均检测人数为
故甲检测点的平均检测人数多于乙检测点的平均检测人数,故正确;
对于:甲检测点的数据极差
乙检测点的数据极差,故正确;
对于:甲检测点数据为,中位数为,
乙检测点数据为,中位数为,故错误;
对于:通过观察平均数附近数据个数,极差等或计算甲乙数据的方差,
都可以判断乙检测点数据比甲检测点数据稳定性强,故甲检测点数据的方差大于乙检测点数据的方差,故正确.故选.
17.习近平同志在党的十九大报告中明确指出我国教育的根本任务是立德树人,发展素质教育.为国家培养德智体美劳全面发展的社会主义建设者和接班人,构建德智体美劳全面发展的教育体系是我国教育一直以来努力的方向.某中学积极响应党的号召,开展各项有益于德智体美劳全面发展的活动,如图是该校高三文科实验(1)班,理科实验(1)班,两个班级在某次活动中德智体美劳的综合评价得分对照图(得分越高,说明该项教育越好),下列说法正确的( )
A.高三理科实验(1)班五项评价得分的极差为1.5
B.除体育外,高三文科实验(1)班各项评价得分均高于高三理科实验(1)班对应的得分
C.高三文科实验(1)班五项评价得分的平均分比高三理科实验(1)班五项评价得分的平均分要高
D.各项评价得分中,这两班的体育得分相差最大
【答案】C
【解析】对选项A,高三理科实验(1)班五项评价得分的极差为,故A错误;
对选项B,三文科实验(1)班的德得分为10,
高三理科实验(1)的德得分也为10,故B错误。
对选项C,高三文科实验(1)班德智体美的总分为,
劳得分为到之间,五项评价总分为到之间,
高三理科实验(1)班五项总分为,故C正确。
对选项D,各项评价得分中,这两班的劳动得分相差最大,故D错误。故选C
九、多个统计图的交汇
18.贴近自然,氛围轻松的露营正成为当下大众休闲的新方式,这使得国内露营经济市场规模迅速增长下图是年年国内露营经济市场规模及同比增长率其中年年为预测数据,根据该图,下列结论错误的是( )
A.年年国内露营经济市场规模逐年增长率均超过
B.年年国内露营经济市场规模增加最大的是年
C.根据预测数据年国内露营经济市场规模是年国内露营经济市场规模的倍以上
D.年年国内露营经济市场规模的中位数是亿元
【答案】B
【解析】由图表中的数据可知,A选项正确;
2018年国内露营经济市场规模比上一年增长多亿元,而年国内露营经济市场规模比上一年增长多亿元,B选项错误;
根据预测数据年国内露营经济市场规模是亿元,年国内露营经济市场规模是亿元,C选项正确;
2014年年国内露营经济市场规模的中位数是,D选项正确故选B.
19.2020年全国城镇私营单位就业人员平均工资为57727元,比上年增加4123元,增长率为7.7%,增速比2019年回落0.4个百分点.图1为2011年至2020年城镇私营单位就业人员平均工资及增速图,图2为2020年四大区域(东部、中部、西部、东北四个区域)平均工资的增速图.则下列说法正确的是( )
A.2011年至2020年城镇私营单位就业人员的平均工资逐年递增
B.2011年至2020年城镇私营单位就业人员的平均工资的增长率逐年递减
C.2020年中部地区的平均工资最高
D.2020年东北地区平均工资的增速最高
【答案】A
【解析】由图1可知,柱状图(平均工资)从左到右逐步升高,说明A正确;
红色折线图(增长率)总体趋势下降,但中间也有上升,所以B错误;
由图2可知,中部地区2020年的工资的平均增速最高,
工资不一定最高,所以C错误、D错误.故选A.
相关试卷
这是一份专题12 导数——【高考三轮冲刺】2023年新高考数学考前提分冲刺(原卷版+解析版),文件包含专题12导数解析版docx、专题12导数原卷版docx等2份试卷配套教学资源,其中试卷共49页, 欢迎下载使用。
这是一份专题11 解析几何——【高考三轮冲刺】2023年新高考数学考前提分冲刺(原卷版+解析版),文件包含专题11解析几何解析版docx、专题11解析几何原卷版docx等2份试卷配套教学资源,其中试卷共69页, 欢迎下载使用。
这是一份专题07 数列——【高考三轮冲刺】2023年新高考数学考前提分冲刺(原卷版+解析版),文件包含专题7数列解析版docx、专题7数列原卷版docx等2份试卷配套教学资源,其中试卷共48页, 欢迎下载使用。