(新高考)2021届高考二轮复习专题九 统计概率 教师版
展开
这是一份(新高考)2021届高考二轮复习专题九 统计概率 教师版,共34页。试卷主要包含了概率的考查主要为,分层抽样,频率分布直方图,最小二乘法,相关系数,回归分析,独立性检验,概率的计算等内容,欢迎下载使用。
专题 9
××
统计概率
命题趋势
1.统计部分主要考查抽样方法、样本估计总体、以及回归分析、独立性检验,常与概率结合综合考查,难度中等.
2.概率的考查主要为:一是古典概型、几何概型、相互独立事件、独立重复试验的考查,难度中等偏易,选择题、填空题的考查形式居多,解答题也有考查;二是离散型随机变量分布列、均值、方差的考查,常与概率结合,主要以解答题的形式考查,难度中等.
考点清单
1.简单随机抽样
定义:一般地,设一个总体含有N个个体,从中逐个不放回的抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样.
最常用的简单随机抽样方法有两种——抽签法和随机数法.
适用范围:总体含个体数较少.
2.系统抽样
一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取;
(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
注意:如果遇到不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.
适用范围:总体含个体数较多.
3.分层抽样
定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
适用范围:总体由差异明显的几部分构成.
4.频率分布直方图
极差:一组数据中最大值与最小值的差;
频数:即个数;
频率:频数与样本容量的比值,频率分布直方图中各小长方形的面积表示相应各组的频率;
众数:出现次数最多的数,可以有多个.若无具体样本数据,则频率分布直方图中最高矩形的中点值可视为众数估计值;
中位数:按大小顺序排列的一组数据中居于中间位置的数,若中间位置有两个数,则取它们的平均数,中位数只有一个.若无具体样本数据,则频率分布直方图中将所有矩形面积平分的直线对应的横坐标可视为中位数的估计值;
平均数:所有样本数值之和除以样本个数的值.若无具体样本数据,则频率分布直方图中将每个矩形对应的区间中点值与该矩形面积相乘,然后全部相加得到的数值可视为该样本的平均值的估计值;
标准差:考察样本数据的分散程度的大小,一般用s表示.标准差越大,则数据离散程度越大;标准差越小,则数据离散程度越小.
.
方差:标准差的平方,用s2表示,也是刻画样本数据的分散程度,与标准差一致.
.
5.最小二乘法
回归直线y=bx+a,其中.
6.相关系数
,
当r为正时,表明变量x与y正相关;当r为负时,表明变量x与y负相关.
r∈[-1,1],r的绝对值越大,说明相关性越强;r的绝对值越小,说明相关性越弱.
7.回归分析
(1)样本点的中心(x,y)一定满足回归方程;
(2)点(xi,yi)的残差ei=yi-yi;
(3),R2越大,则模型的拟合效果越好;R2越小,则模型的拟合效果越差.
8.独立性检验
K2的观测值.
9.概率的计算
(1)古典概型
.
(2)几何概型
每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例.
.
(3)互斥事件概率的计算公式
PA∪B=PA+PB
(4)对立事件的计算公式
PA=1-PA
(5)条件概率
10.离散型随机变量
(1)离散型随机变量的分布列的两个性质
①pi≥0i=1,2,3,...,n;②p1+p2++pn=1
(2)均值公式均值性质
EX=x1p1+x2p2++xnpn
①EaX+b=aEX+b;
②若X~Bn,p,则EX=np;
③若X服从两点分布,则EX=p
(3)方差公式与方差性质
DX=X1-EX2p1+X2-EX2p2++Xn-EX2.pn
①DaX+b=a2DX
②若X~Bn,p,则DX=np1-p
(4)两个相互独立事件同时发生的概率
PAB=PAPB
(5)独立重复试验的概率计算公式
PX=k=Cnkpk1-pk,k=0,1,2,,n
精题集训
(70分钟)
经典训练题
一、选择题.
1.(多选)如图所示的统计图记录了2015年到2019年我国发明专利授权数和基础研究经费支出的情况,
下列叙述正确的是( )
A.这五年发明专利授权数的年增长率保持不变
B.这五年基础研究经费支出比发明专利授权数的涨幅更大
C.这五年的发明专利授权数与基础研究经费支出成负相关
D.这五年基础研究经费支出与年份线性相关
【答案】BD
【解析】由条形图可看出发明专利授权数每年的涨幅不一致,故A错误;
2019年的发明专利授权数约450千项,2015年的约为360千项,涨幅约为25%,2019年的基础研究经费支出约为1200亿元,2015年的约为700亿元,涨幅约为71%,故B正确;
这五年的发明专利授权数与基础研究经费支出都是逐年增加,因此两者是正相关,故C错误;
由折线图可以看出基础研究经费支出与年份有较强的线性相关性,故D正确,
故选BD.
【点评】本题主要考查学生的数据处理能力,对图表的分析能力,属于基础题.
2.(多选)因防疫的需要,多数大学开学后启用封闭式管理.某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
满意
不满意
男
20
20
女
40
10
附表:
0100
005
0025
0010
0001
2706
3841
5024
6635
10828
附:
以下说法正确的有( )
A.满意度的调查过程采用了分层抽样的抽样方法
B.该学校学生对学校的管理和服务满意的概率的估计值为06
C.有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
D.没有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
【答案】AC
【解析】因为男女比例为4000︰5000,故A正确;
满意的频率为,
所以该学校学生对学校的管理和服务满意的概率的估计值约为0.667,所以B错误;
由列联表,
故有99%的把握认为学生对学校的管理和服务满意与否与性别有关系,
所以C正确,D错误,
故选AC.
【点评】本题考查了独立性检验的应用问题,也考查了数据分析应用问题,是基础题.
3.为了丰富教职工业余文化生活,某校计划在假期组织全体老师外出旅游,并给出了两个方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,那么该校全体老师中女老师的比例为( )
A. B. C. D.
【答案】B
【解析】设该校男老师的人数为x,女老师的人数为y,则可得如下表格:
方案一
方案二
男老师
05x
05x
女老师
025y
075y
由题意,,可得,所以,故选B.
【点评】本题考查对统计分析及比例的综合运用能力.
4.为了加强全民爱眼意识,提高民族健康素质,1996年,卫生部,教育部,团中央等12个部委联合发出通知,将爱眼日活动列为国家节日之一,并确定每年的6月6日为“全国爱眼日”.某校高二(1)班有40名学生,学号为01到40,现采用随机数表法从该班抽取5名学生参加“全国爱眼日”宣传活动.已知随机数表中第6行至第7行的各数如下:
16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
若从随机数表第6行第9列的数开始向右读,则抽取的第5名学生的学号是( )
A.17 B.23 C.35 D.37
【答案】C
【解析】随机数表第6行第9列,向右读取,抽取到的5个学号为:39,17,37,23,35,
故抽取的第5名同学的学号为35,故选C.
【点评】本小题主要考查随机数表法,属于基础题.
5.甲乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:
甲
0
1
0
2
2
0
3
1
2
4
乙
2
2
1
1
1
2
1
1
0
1
x1,x2分别表示甲乙两组数据的平均数,S1,分别表示甲乙两组数据的方差,则下列选项正确的是( )
A.x1=x2,S1>S2 B.x1>x2,S1>S2
C.,S1>S2 D.x1>x2,S1x2;
,,∴S1>S2,
故选B.
【点评】本题考查平均数和方差的定义和计算,是基础题,解题时要注意平均数和方差的合理运用.
6.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
2
3
4
5
6
销售额y(万元)
19
25
34
38
44
根据上表可得回归直线方程为,下列说法正确的是( )
A.回归直线必经过样本点2,19、6,44
B.这组数据的样本中心点x,y未必在回归直线上
C.回归系数的含义是广告费用每增加1万元,销售额实际增加万元
D.据此模型预报广告费用为7万元时销售额为万元
【答案】D
【解析】回归直线,不一定经过任何一个样本点,故A错;
由最小二乘法可知,这组数据的样本中心点x,y一定在回归直线上,故B错;
回归系数的含义是广告费用每增加1万元,预测销售额增加万元,故C错;
,,
将4,32代入,可得,则回归方程为,
x=7时,,故D正确,
故选D.
【点评】本题主要考查回归方程的含义与性质,考查根据最小二乘法求出回归方程以及利用回归方程估计总体,属于基础题.
7.从集合{1,2,4}中随机抽取一个数a,从集合{2,4,5}中随机抽取一个数b,则向量与向量n=(2,-1)垂直的概率为( )
A. B. C. D.
【答案】B
【解析】从集合{1,2,4}中随机抽取一个数a,从集合{2,4,5}中随机抽取一个数b,
可以组成向量的个数是3×3=9(个);
其中与向量n=(2,-1)垂直的向量是m=(1,2)和m=(2,4),共2个;
故所求的概率为,故选B.
【点评】本题考查了古典概型及概率计算公式,属于基础题.
二、填空题.
8.在(x+2)7的二项展开式中任取一项,则该项系数为有理数的概率为_________.(用数字作答)
【答案】
【解析】(x+2)7展开式的通项为,
0≤r≤7,r∈N,
当且仅当r为偶数时,该项系数为有理数,故有r=0,2,4,6满足题意,
故所求概率.
【点评】(1)二项式定理的核心是通项公式,求解此类问题可以分两步完成:第一步根据所给出的条件(特定项)和通项公式,建立方程来确定指数(求解时要注意二项式系数中n和r的隐含条件,即n,r均为非负整数,且,如常数项指数为零、有理项指数为整数等);第二步是根据所求的指数,再求所求解的项.
(2)求两个多项式的积的特定项,可先化简或利用分类加法计数原理讨论求解.
9.某“2020年宝鸡市防震减灾科普示范学校”组织4名男生6名女生志愿者到社区进行防震减灾图片宣讲,若这些选派学生只考虑性别,则派往甲社区宣讲的3人中至少有2个男生概率为__________.
【答案】
【解析】派往甲社区宣讲的3人中至少有2个男生概率为,
故答案为.
【点评】组合问题常有以下两类题型变化:
(1)“含有”或“不含有”某些元素的组合题型:“含”,则先将这些元素取出,再由另外元素补足;“不含”,
则先将这些元素剔除,再从剩下的元素中去选取;
(2)“至少”或“最多”含有几个元素的组合题型:解这类题必须十分重视“至少”与“最多”这两个关键词的含义,谨防重复与漏解.用直接法和间接法都可以求解,通常用直接法,分类复杂时,考虑逆向思维,用间接法处理.
三、解答题.
10.2020年国庆节期间,我国高速公路继续执行“节假日高速公路免费政策”.某路桥公司为掌握国庆节期间车辆出行的高峰情况,在某高速公路收费站点记录了3日上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费站点,它们通过该收费站点的时刻的频率分布直方图如下图所示,其中时间段9:20~9:40记作[20,40)、9:40~10:00记作[40,60),10:00~10:20记作[60,80),10:20~10:40记作[80,100),例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间内通过该收费站点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车随机抽取4辆,设抽到的4辆车中,在9:20~10:00之间通过的车辆数为X,求X的分布列;
(3)根据大数据分析,车辆在每天通过该收费站点的时刻T服从正态分布N~μ,σ2,其中μ可用3日数据中的600辆车在9:20~10:40之间通过该收费站点的时刻的平均值近似代替,σ2用样本的方差近似代替(同一组中的数据用该组区间的中点值代表).假如4日全天共有1000辆车通过该收费站点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).
附:若随机变量T服从正态分布Nμ,σ2,则,,.
【答案】(1)64;(2)分布列见解析;(3)819.
【解析】(1)这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值为:
,即10∶04.
(2)由频率分布直方图和分层抽样的方法可知,抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在这一区间内的车辆数,
即,
所以X的可能的取值为0,1,2,3,4.
所以,,,
,.
所以X的分布列为:
X
0
1
2
3
4
P
(3)由(1)得μ=64,
,
所以σ=18,
估计在9:46~10:40之间通过的车辆数也就是在通过的车辆数,
由T~N64,182,得
,
所以估计在在9:46~10:40之间通过的车辆数为.
【点评】(1)求解离散型随机变量X的分布列的步骤:①理解X的意义,写出X可能取的全部值;②求X取每个值的概率;③写出X的分布列.(2)求离散型随机变量的分布列的关键是求随机变量所取值对应的概率,在求解时,要注意应用计数原理、古典概型等知识.
11.某地区2014年至2020年农村居民家庭人均纯收入y(单位:万元)的数据如下表:
年份
2014
2015
2016
2017
2018
2019
2020
年份代号t
1
2
3
4
5
6
7
人均纯收入y
(1)求y关于t的线性回方程;
(2)利用(1)中的回归方程,分析2014年至2020年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2021年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘法估计公式分别为,.
【答案】(1);(2)预测该地区2021年农村居民家庭人均纯收入为万元.
【解析】(1)由所给数据计算得,
.
ti-t2=9+4+1+0+1+4+9=28,
.
,,
所求回归方程为.
(2)由(1)知,,故2014年至2020年该地区农村居民家庭人均纯收入逐年增加,平均每年增加万元.
将2021年的年份代号t=8代入(1)中的回归方程得.
故预测该地区2021年农村居民家庭人均纯收入为万元.
【点评】利用最小二乘法求回归直线方程时,一般先根据题中条件,计算两变量的均值,再根据最小二乘法对应的公式,求出b和a,即可得解.
12.2020年1月24日,中国疾控中心成功分离中国首株新型冠状病毒毒种.6月19日,中国首个新冠mRNA疫苗获批启动临床试验,截至2020年10月20日,中国共计接种了约6万名受试者,为了研究年龄与疫苗的不良反应的统计关系,现从受试者中采取分层抽样抽取100名,其中大龄受试者有30人,舒张压偏高或偏低的有10人,年轻受试者有70人,舒张压正常的有60人.
(1)根据已知条件完成下面的2×2列联表,并据此资料你是否能够以99%的把握认为受试者的年龄与舒张压偏高或偏低有关?
大龄受试者
年轻受试者
合计
舒张压偏高或偏低
舒张压正常
合计
(2)在上述100人中,从舒张压偏高或偏低的所有受试者中采用分层抽样抽取6人,从抽出的6人中任取3人,设取出的大龄受试者人数为X,求X的分布列和数学期望.
运算公式:,
对照表:
P (K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
【答案】(1)没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关;(2)分布列见解析,.
【解析】(1)2×2列联表如下:
大龄受试者
年轻受试者
合计
舒张压偏高或偏低
10
10
20
舒张压正常
20
60
80
合计
30
70
100
,
所以,没有99%的把握认为受试者的年龄与舒张压偏高或偏低有关.
(2)由题意得,采用分层抽样抽取的6人中,大龄受试者有3人,年轻受试者有3人,
所以大龄受试者人数为X的可能取值为0,1,2,3,
所以,,,
,
所以X的分布列为:
0
1
2
3
所以.
【点评】本题第二问解题的关键在于根据题意得抽取的6人中,大龄受试者有3人,年轻受试者有3人,进而根据超几何分布求概率分布列与数学期望,考查运算求解能力,是中档题.
13.为了响应政府“节能减排”的号召,某知名品牌汽车厂家决定生产一款纯电动汽车.生产前,厂家进行了人们对纯电动汽车接受程度的调查.在20~60岁的人群中随机抽取了100人,调查数据的频率分布直方图和接受纯电动汽车的人数与年龄的统计结果如图所示:
年龄
接受的人数
14
6
15
28
17
(1)求频率分布直方图第二组中x的值,并根据频率分布直方图,求这100位被调查者年龄的中位数m;
(2)由以上统计数据填2×2列联表,并判断能否在犯错误的概率不超过的前提下,认为以m岁为分界点的不同年龄人群对纯电动汽车的接受程度有差异?
m岁以下
m岁及m岁以上
总计
接受
不接受
总计
附:
P(K2≥k0)
0100
0050
0010
0001
2706
3841
6635
10828
【答案】(1),中位数m=44;(2)列联表见解析,能在犯错误的概率不超过的前提下,认为以44岁为分界点的不同人群对“纯电动汽车”的接受程度有差异.
【解析】(1)由,得.
∵前三个矩形的面积和为,
∴100位被调查者年龄的中位数m=44.
(2)由题可得2×2列联表如下:
m岁以下
m岁及m岁以上
总计
接受
35
45
80
不接受
15
5
20
总计
50
50
100
∵.
∴能在犯错误的概率不超过的前提下,认为以44岁为分界点的不同人群对“纯电动汽车”的接受程度有差异.
【点评】本题主要考了独立性检验的思想以及频率分布直方图的分析,属于中档题.
14.一台设备由三个部件构成,假设在一天的运转中,部件1,2,3需要调整的概率分别为0.1,0.2,0.3,各部件的状态相互独立.
(1)求设备在一天的运转中,部件1,2中至少有1个需要调整的概率;
(2)记设备在一天的运转中需要调整的部件个数为X,求X的分布列及数学期望.
【答案】(1);(2)分布列见解析,.
【解析】(1)设部件1需要调整为事件A,部件2需要调整为事件B,部件3需要调整为事件C,
由题意可知:,,.
部件1,2中至少有1个需要调整的概率为:.
(2)由题意可知X的取值为0,1,2,3.
且:PX=0=1-PA1-PB1-PC,
,
PX=2=PAPB1-PC+PA1-PBPC+1-PAPCPB
.
,
故X的分布列为:
X
0
1
2
3
PX
0504
0398
0092
0006
其数学期望:EX=0504×0+0398×1+0092×2+0006×3=06.
【点评】求离散型随机变量X的数学期望的一般步骤:
(1)先分析X的可取值,根据可取值求解出对应的概率;
(2)根据(1)中概率值,得到X的分布列;
(3)结合(2)中分布列,根据期望的计算公式求解出X的数学期望.
15.学校趣味运动会上增加了一项射击比赛,比赛规则如下:向A、B两个靶子进行射击,先向A靶射击一次,命中得1分,没有命中得0分;再向B靶连续射击两次,如果只命中一次得2分,一次也没有命中得0分,如果连续命中两次则得5分.甲同学准备参赛,经过一定的训练,甲同学的射击水平显著提高,目前的水平是:向A靶射击,命中的概率是;向B靶射击,命中的概率为.假设甲同学每次射击结果相互独立.
(1)求甲同学恰好命中一次的概率;
(2)求甲同学获得的总分X的分布列及数学期望.
【答案】(1);(2)分布列见解析,期望为.
【解析】(1)记“甲同学恰好命中一次”为事件C,“甲射击命中A靶”为事件D,
“甲第一次射击B靶命中”为事件E,“甲第二次射击B靶命中”为事件F,
由题意可知,.
由于C=DEF+DEF+DEF,
.
(2)随机变量X的可能取值为:0,1,2,3,5,6.
,,
,,
,,
X
0
1
2
3
5
6
P
.
【点评】古典概型及其概率计算公式的应用,求离散型随机变量的分布列及其期望的求法,解题的关键为正确求出0,1,2,3,5,6,所对应的概率.
16.时值金秋十月,秋高气爽,我校一年一度的运动会拉开了序幕.为了增加运动会的趣味性,大会组委会决定增加一项射击比赛,比赛规则如下:向甲、乙两个靶进行射击,先向甲靶射击一次,命中得2分,没有命中得0分;再向乙靶射击两次,如果连续命中两次得3分,只命中一次得1分,一次也没有命中得0分.小华同学准备参赛,目前的水平是:向甲靶射击,命中的概率是;向乙靶射击,命中的概率为.假设小华同学每次射击的结果相互独立.
(1)求小华同学恰好命中两次的概率;
(2)求小华同学获得总分X的分布列及数学期望.
【答案】(1);(2)分布列见解析,数学期望为.
【解析】(1)记:“小华恰好命中两次”为事件A,“小华射击甲靶命中”为事件B,
“小华第一次射击乙靶命中”为事件C,“小华第二次射击乙靶命中”为事件D,
由题意可知,,
由于A=BCD+BCD+BCD,
∴,
故甲同学恰好命中一次的概率为.
(2)0,1,2,3,5.
,,
,,
,
X
0
1
2
3
5
P
.
【点评】本题考查互斥事件与相互独立事件的概率公式,考查随机变量的概率分布列和数学期望,解题关键是把事件“小华恰好命中两次”拆成一些互斥事件的和,确定随机变量的可能值并计算出概率.
17.为监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取10件零件,度量其内径尺寸(单位:μm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的内径尺寸服从正态分布Nμ,σ2.
(1)假设生产状态正常,记X表示某一天内抽取的10个零件中其尺寸在μ-3σ,μ+3σ之外的零件数,
求PX≥2及X的数学期望;
(2)某天正常工作的一条生产线数据记录的茎叶图如下图所示:
①计算这一天平均值μ与标准差σ;
②一家公司引进了一条这种生产线,为了检查这条生产线是否正常,用这条生产线试生产了5个零件,度量其内径分别为(单位:μm):85,95,103,109,119,试问此条生产线是否需要进一步调试,为什么?
参考数据:,,,,,,,.
【答案】(1),;(2)①μ=104μm,σ=6μm;②生产线异常,需要进一步调试,理由见解析.
【解析】(1)由题意知:
,
,
∵,∴.
(2)①,
,所以σ=6μm.
②结论:需要进一步调试.
理由如下:如果生产线正常工作,则X服从正态分布N104,62,
,
零件内径在86,122之外的概率只有,而85∉86,122,
根据3σ原则,知生产线异常,需要进一步调试.
【点评】(1)解题关键利用3σ原则和正态分布的期望公式求解;(2)根据茎叶图,列出数据求得标准差σ,
再由正态分布的3σ原则,进而求解;难度属于中档题.
高频易错题
一、选择题.
1.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,
则下列说法错误的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈负相关关系 B.m=4
C.可以预测,当x=20时, D.该回归直线必过点9,4
【答案】B
【解析】A.由回归方程,知,所以变量x,y之间呈负相关关系,故正确;
B.因为,则,
所以,解得m=5,故错误;
C.当x=20时,,故正确;
D.由B知:x=9,y=4,所以回归直线必过点9,4,故正确,
故选B.
【点评】本题考查了线性回归方程夫人应用问题,也考查了数据分析与运算求解能力,是基础题.
精准预测题
一、选择题.
1.(多选)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:其中根据茎叶图能得到的统计结论为( )
A.甲地该月14时的平均气温低于乙地该月14时的平均气温
B.甲地该月14时的平均气温高于乙地该月14时的平均气温
C.甲地该月14时的平均气温的标准差小于乙地该月14时的气温的标准差
D.甲地该月14时的平均气温的标准差大于乙地该月14时的气温的标准差
【答案】AD
【解析】由茎叶图中的数据,我们可得甲、乙甲,乙两地某月14时的气温抽取的样本温度分别为:
甲:26,28,29,31,31;
乙:28,29,30,31,32.
可得:甲地该月14时的平均气温:,
乙地该月14时的平均气温:,
故甲地该月14时的平均气温低于乙地该月14时的平均气温;
由方差公式可得:甲地该月14时温度的方差为:
,
乙地该月14时温度的方差为:
,
所以甲地该月14时的气温的标准差大于乙地该月14时的气温标准差,
故选AD.
【点评】本题考查数据的离散程度与茎叶图形状的关系,考查学生的计算能力,属于基础题.
2.已知一组数据x1,x2,x3的平均数是5,方差是4则由,,2x3+1,11这4个数据组成的新的一组数据的方差是( )
A.16 B.14 C.12 D.8
【答案】C
【解析】由已知得x1+x2+x3=15,x1-52+x2-52+x3-52=12,
则新数据的平均数为,
所以方差为
,
故选C.
【点评】本题考查了方差性质的应用,考查了基本运算的核心素养,属于基础题.
3.蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:)存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的线性回归方程.
x(次数/分数)
20
30
40
50
60
y()
25
29
36
则当蟋蟀每分钟鸣叫52次时,该地当时的气温预报值为( )
A. B. C. D.
【答案】A
【解析】,,
因为样本中心点x,y在回归直线上,
所以将40,30代入,得,解得k=20,
所以,
当x=52时,,故选A.
【点评】本题的关键是利用回归直线过样本中心点求出k的值,易犯错误是随意选择一个数据点代入解析式求k.
二、填空题.
4.对一个物理量做n次测量,并以测量结果的平均值作为该物理量的最后结果.已知最后结果的误差,为使误差εn在的概率不小于,至少要测量_____次(若X~Nμ,σ2,
则).
【答案】32
【解析】根据正态曲线的对称性知:要使误差εn在的概率不小于,
则且μ=0,,
所以,故答案为32.
【点评】本题是对正态分布的考查,关键点在于能从读出所需信息.
三、解答题.
5.某大学为调研学生在A、B两家餐厅用餐的满意度,从在A、B两家都用过餐的学生中随机抽取了100人,每人分别对这两家餐厅进行评分,满分均为60分.整理评分数据,将分数以10为组距分为6组:[0,10)、[10,20)、[20,30)、[30,40)、[40,50)、[50,60],得到A餐厅分数的频率分布直方图和B餐厅分数的频数分布表:
B餐厅分数的频数分布表
分数区间
频数
[0,10)
2
[10,20)
3
[20,30)
5
[30,40)
15
[40,50)
40
[50,60]
35
(1)在抽样的100人中,求对A餐厅评分低于30的人数;
(2)从对B餐厅评分在[0,20)范围内的人中随机选出2人,求2人中恰有1人评分在[0,10)范围内的概率;
(3)如果从A、B两家餐厅中选择一家用餐,你会选择哪一家?说明理由.
【答案】(1)20人;(2);(3)B餐厅用餐,理由见解析.
【解析】(1)由A餐厅分数的频率分布直方图,得对A餐厅评分低于30分的频率为:
,
∴对A餐厅评分低于30的人数为人.
(2)对B餐厅评分在[0,10)范围内的有2人,设为m、n,
对B餐厅评分在[10,20)范围内的有3人,设为a、b、c,
从这5人中随机选出2人的选法为:mn、ma、mb、mc、na、nb、nc、ab、、bc,共10种,
其中恰有1人评分在[0,10)范围内的选法包括:ma、mb、mc、na、nb、nc,共6种,
故2人中恰有1人评分在[0,10)范围内的概率为.
(3)从两个餐厅得分低于30分的人数所占的比例来看,
由(1)得,抽样的100人中,A餐厅评分低于30的人数为20,
∴A餐厅评分低于30分的人数所占的比例为20%,
B餐厅评分低于30分的人数为2+3+5=10,
∴B餐厅得分低于30分的人数所占的比例为10%,
∴会选择B餐厅用餐.
【点评】本题考查了频率分布直方表与直方图的应用问题,也考查了用列举法求古典概型的概率问题,是综合题.
6.在网络空前发展的今天,电子图书发展迅猛,大有替代纸质图书之势.但电子阅读的快餐文化本质,决定了它只能承担快捷传递信息性很强的资料,缺乏思想深度和回味,电子阅读只能是传统纸质阅读的一种补充.看传统的书不仅是学习,更是种文化盛宴的享受,读书感受的不仅是跃然于纸上的文字,更注重的是蕴藏于纸质书中的中国传统文化.某地为了提高居民的读书兴趣,准备在各社区兴建一批自助图书站(电子纸质均可凭电子借书卡借书)由于不同年龄段需看不同类型的书籍,为了合理配备资源,现从一社区内随机抽取了一天中的80名读书者进行调查,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),后得到如图所示的频率分布直方图.
(1)以每组数据所在区间中点的值作代表,求80名读书者年龄的平均数;
(2)若将该80人分成两个年龄层次,年龄在[20,50)定义为中青年,在[50,80]定义为老年.为进一步调查阅读习惯(电子阅读和传统阅读)与年龄层次是否有关,得到如下2×2列联表完善该表数据,并判断:
是否有95%的把握认为“阅读习惯”与“年龄层次”有关.
中青年
老年
合计
电子阅读
13
传统阅读
13
合计
80
附:,.
临界值表供参考:
005
0010
0005
0001
k0
3841
6635
7879
10828
【答案】(1)54;(2)列联表见解析,有95%的把握认为.
【解析】(1)80名读书者年龄的平均数为
25×005+35×01+45×02+55×03+65×025+75×01=54.
(2)由频率分布直方图可得中青年人数为(0005+001+002)×10×80=28,
老年人数为(003+0025+001)×10×80=52,
由此可得2×2列联表如图,
中青年
老年
合计
电子阅读
15
13
28
传统阅读
13
39
52
合计
28
52
80
由题意,
因为6531>3841,所以有95%的把握认为“阅读习惯”与“年龄层次”有关.
【点评】本题考查平均数的求法,考查独立检验的应用,考查频率分布直方图等基础知识,考查运算求解能力,是基础题.
7.甲、乙两人进行投篮比赛,要求他们站在球场上的A,B两点处投篮,已知甲在A,B两点的命中率均为,乙在A点的命中率为,在B点的命中率为1-2p2,且他们每次投篮互不影响.
(1)若甲投篮4次,求他至多命中3次的概率;
(2)若甲和乙每人在A,B两点各投篮一次,且在A点命中计2分,在B点命中计1分,未命中则计0分,
设甲的得分为X,乙的得分为Y,写出X和Y的分布列,若EX=EY,求的值.
【答案】(1);(2)分布列见解析,.
【解析】(1)“甲至多命中3次”的对立事件为“甲4次全部命中”,
所以甲至多命中3次的概率为.
(2)X,Y的可能取值均为0,1,2,3.
X的分布列为
0
1
2
3
所以.
Y的分布列为
Y
0
1
2
3
P
2p2(1-p)
1-2p2(1-p)
2p3
p1-2p2
EY=(1-p)1-2p2+4p3+3p1-2p2=1+2p-2p2.
由,解得.
【点评】离散型随机变量的均值与方差的常见类型及解题策略:
(1)求离散型随机变量的均值与方差.可依题设条件求出离散型随机变量的分布列,然后利用均值、方差公式直接求解;
(2)由已知均值或方差求参数值.可依据条件利用均值、方差公式得出含有参数的方程(组),解方程(组)即可求出参数值;
(3)由已知条件,作出对两种方案的判断.可依据均值、方差的意义,对实际问题作出判断.
8.教育是阻断贫困代际传递的根本之策.补齐贫困地区义务教育发展的短板,让贫困家庭子女都能接受公平而有质量的教育,是夯实脱贫攻坚根基之所在.治贫先治愚﹐扶贫先扶智.为了解决某贫困地区教师资源匮乏的问题,郑州市教育局拟从5名优秀教师中抽选人员分批次参与支教活动.支教活动共3分批次进行,每次支教需要同时派送2名教师,且每次派送人员均从5人中随机抽选.已知这5名优秀教师中,2人有支教经验,3人没有支教经验.
(1)求5名优秀教师中的“甲”,在这3批次活动中有且只有一次被抽选到的概率﹔
(2)求第二次抽选时,选到没有支教经验的教师的人数最有可能是几人﹖请说明理由;
(3)现在需要2名支教教师完成某项特殊教学任务,每次只能派一个人,且每个人只派一次,如果前一位教师一定时间内不能完成教学任务,则再派另一位教师.若有A、B两个教师可派,他们各自完成任务的概率分别为p1、p2,假设1>p1>p2,且假定各人能否完成任务的事件相互独立.若按某种指定顺序派人,这两个人各自能完成任务的概率依次为q1,q2,其中q1,q2是p1、p2的一个排列,试分析以怎样的顺序派出教师,可使所需派出教师的人员数目的数学期望达到最小.
【答案】(1);(2)第二次抽取到的无支教经验的教师人数最有可能是1人,理由见解析;(3)按照先A后B的顺序所需人数期望最小.
【解析】(1)5名优秀教师中的“甲”在每轮抽取中,被抽取到概率为,
则三次抽取中,“甲”恰有一次被抽取到的概率为.
(2)第二次抽取到的没有支教经验的教师人数最有可能是1人.
设ξ表示第二次抽取到的无支教经验的教师人数,可能的取值有0,1,2,
则有:,
,
,
因为Pξ=1>Pξ=0>Pξ=2,
故第二次抽取到的无支教经验的教师人数最有可能是1人.
(3)按照先A后B的顺序所需人数期望最小.
设X表示先A后B完成任务所需人员数目,则
X
1
2
P
p1
;
设Y表示B先后A完成任务所需人员数目,则
X
1
2
P
p2
,.
故按照先A后B的顺序所需人数期望最小.
【点评】本题考查求概率和求离散型随机变量的数学期望,解答本题的关键是设X表示先A后B完成任务所需人员数目,得出,
设Y表示B先后A完成任务所需人员数目,则,相减得出大小,属于中档题.
相关试卷
这是一份专题九 计数原理与概率统计——2024届高考数学二轮复习模块精练【新教材新高考】(含答案),共11页。试卷主要包含了选择题,多项选择题,填空题,解答题等内容,欢迎下载使用。
这是一份高中数学高考 2021届高考二轮精品专题九 统计概率(理) 教师版(1),共27页。试卷主要包含了概率的考查主要为,分层抽样,频率分布直方图,最小二乘法,相关系数,回归分析,独立性检验,概率的计算等内容,欢迎下载使用。
这是一份高考数学二轮精品专题九 统计概率(理) (2份打包,教师版+原卷版),文件包含高考数学二轮精品专题九统计概率理原卷版doc、高考数学二轮精品专题九统计概率理教师版doc等2份试卷配套教学资源,其中试卷共64页, 欢迎下载使用。