新高考数学二轮复习培优讲义26 概率和统计(含解析)
展开解密26 概率和统计
【考点解密】
1.离散型随机变量的分布列
(1)随着试验结果变化而变化的变量称为随机变量.所有取值可以一一列出的随机变量称为离散型随机变量.
(2)一般地,若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,则称表
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
为离散型随机变量X的概率分布列,简称为X的分布列,具有如下性质:
①pi≥0,i=1,2,…,n;
②i=1.
离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.
2.两点分布
如果随机变量X的分布列为
X
0
1
P
1-p
p
其中0 其中p=P(X=1)称为成功概率.
3.离散型随机变量的均值与方差
一般地,若离散型随机变量X的分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
(1)均值
称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望.它反映了离散型随机变量取值的平均水平.
(2)方差
称D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,并称其算术平方根为随机变量X的标准差.
4.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X).(a,b为常数)
5.超几何分布
一般地,在含有M件次品的N件产品中,任取n件,其中恰有x件次品,
则P(X=k)= (k=0,1,2,…,m),即
X
0
1
…
m
P
…
其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.
如果一个随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布.
6.条件概率及其性质
(1)对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做条件概率,用符号P(B|A)来表示,其公式为P(B|A)=(P(A)>0).
在古典概型中,若用n(A)表示事件A中基本事件的个数,则P(B|A)=.
(2)条件概率具有的性质
①0≤P(B|A)≤1;
②如果B和C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A).
7.相互独立事件
(1)对于事件A,B,若事件A的发生与事件B的发生互不影响,则称事件A,B是相互独立事件.
(2)若A与B相互独立,则P(B|A)=P(B).
(3)若A与B相互独立,则A与,与B,与也都相互独立.
(4)P(AB)=P(A)P(B)⇔A与B相互独立.
8.独立重复试验与二项分布
(1)独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.
(2)在n次独立重复试验中,用X表示事件A发生的次数,设每次试验中事件A发生的概率为p,
则P(X=k)=Cpk(1-p)n-k(k=0,1,2,…,n),此时称随机变量X服从二项分布,记为X~B(n,p),并称p为成功概率.
9.两点分布与二项分布的均值、方差
(1)若随机变量X服从两点分布,则E(X)=p,D(X)=p(1-p).
(2)若X~B(n,p),则E(X)=np,D(X)=np(1-p).
10.正态分布
(1)正态曲线:函数φμ,σ(x)=,x∈(-∞,+∞),其中实数μ和σ为参数(σ>0,μ∈R).我们称函数φμ,σ(x)的图象为正态分布密度曲线,简称正态曲线.
(2)正态曲线的特点
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移,如图甲所示;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.
(3)正态总体在三个特殊区间内取值的概率值
①P(μ-σ
【方法技巧】
【核心题型】
题型一:频率分布直方图的中位数等求法
1.(2023·山东泰安·统考一模)青少年是国家的未来和民族的希望,青少年身体素质事关个人成长、家庭幸福,民族未来,促进青少年健康是建设体育强国、健康中国的重要内容.党中央历来高度重视青少年体质与健康管理工作,亲切关怀青少年和儿童的健康成长,不断出台相关政策法规,引导广大青少年积极参与体育健身,强健体魄、砥砺意志,凝聚和焕发青春力量.近年来,随着政策措施牵引带动,学生体质与健康水平不断迈上新台阶.某学校共有2000名男生,为了了解这部分学生的身体发育情况,学校抽查了100名男生体重情况.根据所得数据绘制样本的频率分布直方图如图所示,则下列结论错误的是( )
A.样本的众数为67.5 B.样本的80%分位数为72.5
C.样本的平均值为66 D.该校男生中低于60公斤的学生大约为300人
【答案】C
【分析】由频率分布直方图的众数、百分位数、平均数以及频数的计算公式对选项一一判断即可得出答案.
【详解】对于A,样本的众数为67.5,故A正确;
对于B,设样本的80%分位数为,
因为
则,解得:,故B正确;
对于C,设样本的平均值为,
,
故C不正确;
对于D,该校男生中低于60公斤的学生所占的频率为:,
该校男生中低于60公斤的学生大约为人,故D正确.
故选:C.
2.(2023·广东梅州·统考一模)为了了解小学生的体能情况,抽取了某小学四年级100名学生进行一分钟跳绳次数测试,将所得数据整理后,绘制如下频率分布直方图.根据此图,下列结论中错误的是( )
A.
B.估计该小学四年级学生的一分钟跳绳的平均次数超过125
C.估计该小学四年级学生的一分钟跳绳次数的中位数约为119
D.四年级学生一分钟跳绳超过125次以上优秀,则估计该小学四年级优秀率为35%
【答案】B
【分析】根据频率分布直方图矩形面积和等于1可得,经计算可得平均数为,中位数约为119,优秀率为35%即可得出正确选项.
【详解】根据题意可得,可得,故A正确;
根据频率分布直方图可得其平均数为
,所以B错误;
由频率分布直方图可知,,而,
所以中位数落在区间内,设中位数为,则,可得,所以C正确;
由图可知,超过125次以上的频率为,所以优秀率为35%,即D正确.
故选:B
3.(2023·全国·高三专题练习)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中正确的是( )
A.估计该地农户家庭年收入的平均值超过7.5万元
B.估计该地有一半以上的农户,其家庭年收入不低于8.5万元
C.该地农户家庭年收入低于4.5万元的农户比率估计为4%
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至7.5万元之间
【答案】A
【分析】根据频率分布直方图,即可结合选项逐一计算平均值以及所占的比重.
【详解】对于A,估计该地农户家庭年收入的平均值为
,故A正确,
对于B,家庭年收入不低于8.5万元所占的比例为,故B错误,
对于C,该地农户家庭年收入低于4.5万元的农户比率估计为,故C错误,
家庭年收入介于4.5万元至7.5万元之间的频率为,故D错误.
故选:A
题型二:互斥事件概率的求法
4.(2023·四川成都·统考二模)甲和乙两位同学准备在体育课上进行一场乒乓球比赛,假设甲对乙每局获胜的概率都为,比赛采取三局两胜制(当一方获得两局胜利时,该方获胜,比赛结束),则甲获胜的概率为( )
A. B. C. D.
【答案】B
【分析】按照相互独立事件的概率乘法法则,分类计算求和即可.
【详解】分三类:
①甲直接获得前两局胜利,不进行第三局,此时甲获胜的概率为:;
②甲输第一局,赢后两局,此时甲获胜的概率为:;
③甲赢第一局和第三局,输第二局,此时甲获胜的概率为:.
故甲获胜的概率为:.
故选:B.
5.(2023·陕西咸阳·武功县普集高级中学统考二模)2022年卡塔尔世界杯足球赛落幕,这是历史上首次在卡塔尔和中东国家境内举行,也是第二次在亚洲举行的世界杯足球赛.有甲,乙,丙三个人相互之间进行传球,从甲开始传球,甲等可能地把球传给乙,丙中的任何一个人,以此类推,则经过两次传球后又传到甲的概率为( )
A. B. C. D.
【答案】C
【分析】一共有两种情况,根据概率的加法即可.
【详解】经过两次传球后又传到甲的情况有甲乙甲和甲丙甲两种,所以概率为:
故选:C
6.(2023·陕西西安·统考一模)某校高二年级学生举行中国象棋比赛,经过初赛,最后确定甲、乙、丙三位同学进入决赛.决赛规则如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,最后的胜者获得冠军,比赛结束.若经抽签,已知第一场甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为,则( )
A.甲获得冠军的概率最大 B.甲比乙获得冠军的概率大
C.丙获得冠军的概率最大 D.甲、乙、丙3人获得冠军的概率相等
【答案】C
【分析】根据比赛进行的场次进行分类讨论,结合相互独立事件概率计算公式,求得甲、乙、丙三人获得冠军的概率,从而确定正确答案.
【详解】根据决赛规则,至少需要进行四场比赛,至多需要进行五场比赛,
(1)甲获得冠军有两种情况:
①共比赛四场结束,甲四连胜夺冠,概率为
②共比赛五场结束,并且甲获得冠军.则甲的胜、负、轮空结果共有四种情况∶胜胜胜负胜,
胜胜负空胜,胜负空胜胜,负空胜胜胜,概率分别为,即,
因此,甲最终获得冠军的概率为;
(2)乙获得冠军,与(1)同理,概率也为;
(3)丙获得冠军,概率为,
由此可知丙获得冠军的概率最大,即A,B,D错误,C正确,
故选∶C.
题型三:古典概型问题
7.(2023·四川巴中·统考一模)随机郑两枚质地均匀的骰子,它们向上的点数之和除以4,余数分别为,所对应的概率分别为,则( )
A. B.
C. D.
【答案】A
【分析】用表格列举出所有可能的余数情况,并确定余数为对应概率,即可得结果.
【详解】由题设,两枚骰子所得点数和除以4的余数情况如下:
除以4的余数
1
2
3
4
5
6
1
2
3
0
1
2
3
2
3
0
1
2
3
0
3
0
1
2
3
0
1
4
1
2
3
0
1
2
5
2
3
0
1
2
3
6
3
0
1
2
3
0
由上表知:共36种情况,其中余数为分别有9种、8种、9种、10种,
所以.
故选:A
8.(2023·陕西榆林·统考二模)目前,全国所有省份已经开始了新高考改革.改革后,考生的高考总成绩由语文、数学、外语3门全国统一考试科目成绩和3门选择性科目成绩组成.已知某班甲、乙同学都选了物理和地理科目,且甲同学的另一科目会从化学、生物、政治这3科中选1科,乙同学的另一科目会从化学、生物这2科中选1科,则甲、乙所选科目相同的概率是( )
A. B. C. D.
【答案】B
【分析】依题意先列出所有的基本事件,再列出甲、乙所选科目相同的基本事件,求其比值即可.
【详解】甲、乙同学所选的科目情况有:(化学,化学),(化学,生物),(生物,化学),(生物,生物),(政治,化学),(政治,生物),共6种,其中甲、乙同学所选的科目相同的情况有(化学,化学),(生物,生物),共2种,
故所求概率.
故选:B.
9.(2023·福建福州·统考二模)为培养学生“爱读书、读好书、普读书”的良好习惯,某校创建了人文社科类、文学类、自然科学类三个读书社团.甲、乙两位同学各自参加其中一个社团,每位同学参加各个社团的可能性相同,则这两位同学恰好参加同一个社团的概率为( )
A. B. C. D.
【答案】A
【分析】根据古典概型公式即可求解.
【详解】记人文社科类、文学类、自然科学类三个读书社团分别为,
则甲、乙两位同学各自参加其中一个社团的基本事件有共9种,
而这两位同学恰好参加同一个社团包含的基本事件有共3种,
故这两位同学恰好参加同一个社团的概率.
故选:A
题型四:几何概型问题
10.(2023·贵州毕节·统考二模)有诗云:“芍药承春宠,何曾羡牡丹”,芍药不仅观赏性强,且具有药用价值,某地以芍药为主打造了一个如图的花海大世界,其中大圆半径为8,大圆内部的同心小圆半径为3,两圆之间的图案是对称的.若在其中阴影部分种植红芍.倘若你置身此花海大世界之中,则恰好处在红芍中的概率是( )
A. B. C. D.
【答案】C
【分析】由圆的面积公式结合几何概型的概率公式求解.
【详解】由已知得:大圆的面积为,小圆的面积为.
所以阴影部分的面积为.
设“恰好处在红芍中”为事件,则
故选:C
11.(2023·河南·校联考模拟预测)如图,已知线段AD的长为3,B,C是线段AD上的两点,则线段AB,BC,CD能构成三角形的概率为( )
A. B. C. D.
【答案】B
【分析】设,,根据题意转化为几何概型,利用面积关系求概率.
【详解】设,,则,且,即.
作出不等式组表示的平面区域,如图中(不含边界),其面积为.
若线段AB,BC,CD能构成三角形,则还要满足,即.
作出不等式组表示的平面区域,如图中(不含边界),其面积为.
由几何概型概率计算公式得,线段AB,BC,CD能构成三角形的概率.
故选:B.
12.(2023·江西赣州·统考一模)已知棱长为3的正四面体的内切球球心为,现从该正四面体内随机取一点,则点落在球内的概率为( )
A. B. C. D.
【答案】C
【分析】根据正四面体的结构特征及性质求其内切球的半径,求出内切球体积和四面体体积,利用几何概型—体积比求概率即可.
【详解】由正四面体各侧面为等边三角形,若为△的中心,
连接,则内切球球心在线段上,如下图示:,
所以内切圆半径,而面,面,面,面,
故,注意在面上,又,
所以为等腰三角形的垂心,故,
又,令,则,
所以,可得,故,
而正四面体的体积,
其内切球体积为,
落在球内的概率为.
故选:C
题型五:利用均值和方差性质求解
13.(2023春·四川成都·高三成都实外校联考阶段练习)若数据,,…,的平均数为2,方差为3,则下列说法错误的是( )
A.数据,,…,的平均数为9 B.
C.数据,,…,的方差为 D.
【答案】C
【分析】根据期望、方差的性质判断A、C的正误;利用期望、方差公式分析B、D的正误.
【详解】A:由原数据期望,则新数据期望,正确;
B:,正确;
C:由原数据方差,则新数据期望,错误;
D:由,
所以,正确.
故选:C
14.(2022秋·河南·高三期末)为了评估某种工艺制作零件的效果,随机选出件产品,这件产品的尺寸(单位:)分别为,求得方差为,如果再生产件产品,尺寸都相应扩大为原来的两倍,则这批新产品的方差为( )
A. B. C. D.
【答案】B
【分析】结合方差的倍数关系可直接求解.
【详解】因为原产品尺寸为:,新产品尺寸为:,原方差为,故新方差为.
故选:B
15.(2023秋·陕西西安·高三统考期末)有一组样本数据,,,由这组数据得到新样本数据,,,,其中(,2,,n),则( )
A.两组样本数据的样本平均数相同 B.两组样本数据的样本中位数相同
C.两组样本数据的样本众数相同 D.两组样本数据的样本方差相同
【答案】D
【分析】根据平均数,中位数,众数,方差的定义,利用公式即可判断正误.
【详解】对于A,设,则,所以,A选项错误;
对于B,因为(,2,,n),所以,,,的中位数是,,,的中位数加1,B选项错误;
对于C,若,,,的众数为,因为(,2,,n),所以,,,的众数为,C选项错误;
对于D,设,,则,D选项正确;
故选:D.
题型六;条件概率问题
16.(2023·河南南阳·统考二模)英国数学家贝叶斯在概率论研究方面成就显著,根据贝叶斯统计理论,随机事件存在如下关系:,贺岁档电影精彩纷呈,有几部影片是小明期待想去影院看的.小明同学家附近有甲、乙两家影院,小明第一天去甲、乙两家影院观影的概率分别为0.4和0.6.如果他第一天去甲影院,那么第二天去甲影院的概率为0.6;如果第一天去乙影院,那么第二天去甲影院的概率为0.5,则小明同学( )
A.第二天去甲影院的概率为0.44
B.第二天去乙影院的概率为0.44
C.第二天去了甲影院,则第一天去乙影院的概率为
D.第二天去了乙影院,则第一天去甲影院的概率为
【答案】D
【分析】先表示基本事件,根据题中概率及贝叶斯概率公式进行逐一判断即可.
【详解】设:第一天去甲影院,:第二天去甲影院,
:第一天去乙影院,:第二天去乙影院,
所以,,,
因为,
所以,
所以有,
因此选项A不正确;
,因此选项B不正确;
,所以选项C不正确;
,
所以选项D正确,
故选:D
17.(2023·云南玉溪·统考一模)若,则在“函数的定义域为”的条件下,“函数为奇函数”的概率为( )
A. B. C. D.
【答案】C
【分析】先列出所有的结果数,由于函数的定义域为,则,恒成立,可得,在所有结果数中选出满足的情况,求出概率,根据为奇函数可得或,在所有结果数中选出同时满足两个事件情况,求出其概率,再根据条件概率的计算公式即可计算出结果.
【详解】解:用所有的有序数对表示满足的结果,
则所有的情况为:,共9种,
记“函数的定义域为”为事件A,
因为函数的定义域为,
所以,恒成立,
即,即,
其中满足的基本事件有:
共6种,故.
记“函数为奇函数”为事件B.
已知是奇函数,且定义域为,则,
即,即,
解得或.
满足或的情况有共3种,
所以,即同时满足事件A和事件B的情况有共3种,
故,所以.
故选:C
18.(2023秋·辽宁·高三校联考期末)已知小郭、小张和小陆三名同学同时独立地解答一道概率试题,每人均有的概率解答正确,且三个人解答正确与否相互独立,在三人中至少有两人解答正确的条件下,小陆同学解答不正确的概率是( )
A. B. C. D.
【答案】C
【分析】记“三人中至少有两人解答正确”为事件A,“小陆同学解答不正确”为事件B,
则在三人中至少有两人解答正确的条件下,小陆同学解答不正确的概率为,由条件概率计算公式可得答案.
【详解】记“三人中至少有两人解答正确”为事件A,“小陆同学解答不正确”为事件B,
则,
,则.
故选:C
题型七:正态分布问题
19.(2023·全国·高三专题练习)我们将服从二项分布的随机变量称为二项随机变量,服从正态分布的随机变量称为正态随机变量.概率论中有一个重要的结论是棣莫弗一拉普拉斯极限定理,它表明,若随机变量,当n充分大时,二项随机变量Y可以由正态随机变量X来近似,且正态随机变量X的期望和方差与二项随机变量Y的期望和方差相同.棣莫弗在1733年证明了的特殊情形,1812年,拉普拉斯对一般的p进行了证明.现抛掷一枚质地均匀的硬币100次,则利用正态分布近似估算硬币正面向上次数超过60次的概率为( )(附:若,则,,)
A.0.1587 B.0.0228 C.0.0027 D.0.0014
【答案】B
【分析】由题意,根据二项分布的期望与方差公式分别求出和,然后再利用正态分布的对称性即可求解.
【详解】解:抛掷一枚质地均匀的硬币100次,设硬币正面向上次数为,则,
所以,,
由题意,,且,,
因为,
所以利用正态分布近似估算硬币正面向上次数超过60次的概率为,
故选:B.
20.(2023·内蒙古包头·统考一模)为了解全市高三学生身体素质状况,对某校高三学生进行了体能抽样测试,得到学生的体育成绩,其中60分及以上为及格,90分及以上为优秀,则下列说法正确的是( )
附:若,则,.
A.该校学生体育成绩的方差为10
B.该校学生体育成绩的期望为85
C.该校学生体育成绩的及格率小于85%
D.该校学生体育成绩的优秀率大于3%
【答案】C
【分析】根据正态分布的特征可求A,B选项的正误,根据优秀和及格的标准可得C,D选项的正误.
【详解】因为,所以该校学生体育成绩的期望为70,方差为100,所以A,B均不正确;
因为60分及以上为及格,
所以,C正确;
因为90分及以上为优秀,所以,D不正确.
故选:C.
21.(2023·吉林长春·校联考一模)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布,其中μ近似为样本的平均数(每组数据取区间的中间值),且,若全校有3000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
并依据小概率值的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:;;.
α
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)476人
(2)答案见解析
【分析】(1)利用频数分布表,求得样本的平均数,从而写出X近似服从正态分布,利用参考数据求得参加“每天锻炼1小时”活动超过21天的人数;
(2)根据频数分布表和已知条件,完善列联表,根据独立性检验的公式,求出学生性别与获得“运动达人”称号是否有关联和它们之间如何相互影响.
【详解】(1)由频数分布表知
,则,,
,
,
参加“每天锻炼1小时”活动超过21天的人数约为476人.
(2)由频数分布表知,锻炼活动的天数在的人数为:,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有20名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
由频数分布表知,锻炼活动的天数在的人数为,
参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,
参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:
列联表如下:
性别
活动天数
合计
男生
20
30
50
女生
32
18
50
合计
52
48
100
零假设为:学生性别与获得“运动达人”称号无关
依据的独立性检验,我们推断不成立,即:可以认为学生性别与获得“运动达人”称号有关;
而且此推断犯错误的概率不大于,根据列联表中的数据得到,男生、女生中活动天数超过15天的频率分别为:和,可见男生中获得“运动达人”称号的频率是女生中获得“运动达人”的称号频率的倍,于是依据频率稳定与概率的原理,我们可以认为男生获得“运动达人”的概率大于女生,即男生更容易获得运动达人称号.
题型八:统计和概率的综合
22.(2023·吉林通化·梅河口市第五中学校考二模)某国家网球队为了预选2024年奥运会的参赛选手,预计在国家队选拔一批队员做特训.选拔过程中,记录了某队员的40局接球成绩,每局发100个球,该队员每接球成功得1分,否则得0分,且每局结果相互独立,得到如图所示的频率分布直方图.
(1)结合直方图,估算该队员40局接球成绩的平均分(同一组数据用该组区间的中点值作代表);
(2)若该队员的接球训练成绩X近似服从正态分布,其中近似为样本平均数,求的值;
(3)为了营造竞技氛围,队员间相互比赛.一局比赛中发球方连续发100个球,若接球方得分达到80分,则接球方获胜,否则发球方获胜.若有人获胜达3局,则比赛结束,记比赛的局数为Y.以频率分布直方图中该队员获胜的频率作为概率,求均值.
参考数据:若随机变量,则,,.
【答案】(1)
(2)
(3)
【分析】(1)将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全部相加可得样本平均数;
(2)由题意可知,,则,,利用参考数据即可求解;
(3)由题意可知,随机变量的可能取值有3,4,5,计算出随机变量在不同取值下的概率,进而可求得的值.
【详解】(1)由频率分布直方图可得队员甲的平均分
.
(2)由题意可知,,则,,
所以
.
(3)由频率分布直方图可知,在一局中,某队员得分达到80分的概率为,
由题意可知,随机变量Y的所有可能取值为3,4,5,
,
,
,
所以随机变量Y的分布列为
Y
3
4
5
P
因此,.
23.(2023·安徽安庆·统考二模)为了“锤炼党性修养,筑牢党性根基”,党员教师小A每天自觉登录“学习强国APP”,参加各种学习活动,同时热衷于参与四人赛.每局四人赛是由网络随机匹配四人进行比赛,每题回答正确得20分,第1个达到100分的比赛者获得第1名,赢得该局比赛,该局比赛结束.每天的四人赛共有30局,前2局是有效局,根据得分情况获得相应名次,从而得到相应的学习积分,第1局获得第1名的得3分,获得第2、3名的得2分,获得第4名的得1分;第2局获得第1名的得2分,获得第2、3、4名的得1分;后28局是无效局,无论获得什么名次,均不能获得学习积分.经统计,小A每天在第1局四人赛中获得3分、2分、1分的概率分别为,,,在第2局四人赛中获得2分、1分的概率分别为,.
(1)设小A每天获得的得分为,求的分布列、数学期望和方差;
(2)若小A每天赛完30局,设小A在每局四人赛中获得第1名从而赢得该局比赛的概率为,每局是否赢得比赛相互独立,请问在每天的30局四人赛中,小A贏得多少局的比赛概率最大?
【答案】(1)分布列见解析,数学期望为,方差为
(2)小A赢得10局的比赛概率最大
【分析】(1)记事件表示第一局获得分,事件表示第二局获得分,的可能值为5,4,3,2,根据事件相互独立求出的分布列、数学期望和方差;
(2)设小A每天赢得的局数为,则,求最大时的取值即可.
【详解】(1)记事件表示第一局获得分,事件表示第二局获得分,这些事件相互独立,由条件知的可能值为5,4,3,2.
其分布列为
5
4
3
2
,
.
(2)设小A每天赢得的局数为,则,
于是.
根据条件得,
由①得,得,
同理由②得,所以,
又因为,所以,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大.
24.(2023·全国·模拟预测)冰雪运动是深受学生喜爱的一项户外运动,为了研究性别与学生是否喜爱冰雪运动之间的关系,从某高校男、女生中各随机抽取100名进行问卷调查,得到如下列联表.
喜爱
不喜爱
男生
女生
(1)当时,从样本中不喜爱冰雪运动的学生中,按性别采用分层抽样的方法抽取6人,再从这6人中随机抽取3人调研不喜爱的原因,记这3人中女生的人数为,求的分布列与数学期望.
(2)定义,其中为列联表中第行第列的实际数据,为列联表中第行与第列的总频率之积再乘以列联表的总额数得到的理论频数,如,.基于小概率值的检验规则:首先提出零假设(变量X,Y相互独立),然后计算的值,当时,我们推断不成立,即认为X和Y不独立,该推断犯错误的概率不超过;否则,我们没有充分证据推断不成立,可以认为X和Y独立.根据的计算公式,求解下面问题:
①当时,依据小概率值的独立性检验,分析性别与是否喜爱冰雪运动有关?
②当时,依据小概率值的独立性检验,若认为性别与是否喜爱冰雪运动有关,则至少有多少名男生喜爱冰雪运动?
附:
0.1
0.025
0.005
2.706
5.024
7.879
【答案】(1)分布列见解析;期望为2
(2)①答案见解析 ;②76名
【分析】(1)用分层抽样的方法抽取的不喜爱冰雪运动的6人中,男生有2人,女生有4人,由题意可知的可能取值为1,2,3,求出对应的概率,得到的分布列,进而求出;
(2)①根据题中数据及所给公式计算,与参考数据比较即可得出结论;②根据基于小概率值的检验规则及的计算公式得到关于m的不等式,再根据m的取值范围以及实际意义即可得解.
【详解】(1)当时,用分层抽样的方法抽取的不喜爱冰雪运动的6人中,男生有2人,女生有4人,
由题意可知,的可能取值为1,2,3.
,,,
的分布列为
1
2
3
P
.
(2)①零假设为:性别与是否喜爱冰雪运动独立,即性别与是否喜爱冰雪运动无关联.
当时,,,,,
,,,,
.
∵,
∴根据小概率值的独立性检验,我们推断不成立,即认为性别与是否喜爱冰雪运动有关联,此推断犯错误的概率不超过0.005.
②,
由题意可知,,整理得.
又,,∴,的最大值为4.
又,∴至少有76名男生喜爱冰雪运动.
【高考必刷】
一、单选题
25.(2023·四川绵阳·盐亭中学校考模拟预测)已知、的对应值如下表所示:
x
y
与具有较好的线性相关关系,可用回归直线方程近似刻画,则在的取值中任取两个数均不大于的概率为( )A. B. C. D.
【答案】B
【分析】求出样本中心点的坐标,将其代入回归直线方程,求出的值,可得出的所有取值,然后利用组合计数原理结合古典概型的概率公式可求得所求事件的概率.
【详解】由表格中的数据可得,
,
所以这组数据的样本点的中心的坐标为,
又因为点在回归直线上,所以,解得,
所以的取值分别为、、、、,
在这个数中,任取两个,取到的两个数都不大于的概率为.
故选:B.
26.(2023·河南·统考模拟预测)某省普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为五个等级.某高中2022年参加“选择考”总人数是2020年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平,统计了该校2020年和2022年“选择考”成绩等级结果,得到如下统计图.针对该校“选择考”情况,2022年与2020年比较,下列说法正确的是( )
A.获得A等级的人数减少了 B.获得B等级的人数增加了1.5倍
C.获得D等级的人数减少了一半 D.获得E等级的人数相同
【答案】B
【分析】设2020年参加选择考的总人数为a,根据统计图计算出这两年的每个等级的人数,进行比较,可得答案.
【详解】由题可知:设2020年参加选择考的总人数为a,则2022年参加选择考的总人数为2a人;
2020年评定为五个等级的人数为:;
2022年评定为五个等级的人数为∶;
由此可知获得A等级的人数增加了,A错误;
由于,即获得B等级的人数增加了1.5倍,B正确;
获得D等级的人数增加了,C错误;
获得E等级的人数增加了1倍,D错误;
故选∶B.
27.(2023·海南海口·校考模拟预测)某地摊集中点在销售旺季的某天接纳顾客量超过1万人次的概率是,连续两天顾客量超过1万人次的概率是,在该地摊集中点在销售旺季的某天接纳顾客量超过1万人次的条件下,随后一天的接纳顾客量超过1万人次概率是( ).
A. B. C. D.
【答案】D
【分析】利用条件概率的定义及其概率计算公式求解即可.
【详解】设“某天接纳顾客量超过1万人次”为事件A,“随后一天的接纳顾客量超过1万人次” 为事件B,
则,,
所以,
故选:D.
28.(2023·广西南宁·统考一模)电动工具已成为人们生产和生活中常备的作业工具、数据显示,全球电动工具零部件市场规模由2016年的58亿美元增长至2020年的72亿美元,复合年均增长率达5.55%,2022年全球电动工具零部件市场规模达到80亿美元.根据此图,下列说法中正确的是( )
A.2016-2022年全球电动工具零部件市场规模逐步减少
B.2016-2022年全球电动工具零部件市场规模增长速度逐年增长
C.2021年全球电动工具零部件市场规模大于2020年全球电动工具零部件市场规模
D.2018-2019年全球电动工具零部件市场规模增速的差值最大
【答案】C
【分析】根据条形图和折线图可得出结果
【详解】由条形图可以看出全球电动工具零部件市场规模逐步增加,所以选项A错误;
由折线图可以看出2016-2022年全球电动工具零部件市场规模增长速度有增有减,所以选项B错误;
由条形图可以看出选项正确;
由折线图可以看出2017-2018年全球电动工具零部件市场规模增速的差值最大,所以选项D错误;
故选:C
29.(2023·辽宁·新民市第一高级中学校联考一模)某舞台灯光设备有一种25头LED矩阵灯(如图所示),其中有2头LED灯出现故障,假设每头LED灯出现故障都是等可能的,则这2头故障LED灯相邻(横向相邻或纵向相邻)的概率为( )
A. B. C. D.
【答案】A
【分析】首先求出横向、纵向相邻的LED灯总对数,再应用古典概型的概率求法求概率.
【详解】每列相邻的LED灯共4对,共有5列,故横向相邻有种;同理纵向相邻也有种,
所以这2头故障LED灯相邻的概率为.
故选:A
30.(2023·内蒙古赤峰·校联考一模)构建德、智、体、美、劳全面培养的教育体系是我国教育一直以来努力的方向.某中学为了落实五育并举,全面发展学生的素质,积极响应党的号召,开展各项有益于德、智、体、美、劳全面发展的活动.如图所示的是该校高三(1)、高三(2)班两个班级在某次活动中的德、智、体、美、劳的评价得分对照图(得分越高,说明该项教育越好).下列说法正确的是( )
实线:高三(1)班的数据
虚线:高三(2)班的数据
A.高三(2)班五项评价得分的极差为
B.除体育外,高三(1)班的各项评价得分均高于高三(2)班对应的得分
C.各项评价得分中,这两个班的体育得分相差最大
D.高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高
【答案】D
【分析】根据题意可得各班的各项得分,根据分值逐项分析判断.
【详解】由题意可得:高三(1)班德、智、体、美、劳各项得分依次为,高三(2)班德、智、体、美、劳各项得分依次为.
对于A: 高三(2)班五项评价得分的极差为,A错误;
对于B:两班的德育得分均为,两者相等,B错误;
对于C:两班的德育得分相差;
两班的智育、体育和美育得分相差均为;
两班的劳育得分相差;
故两个班的劳育得分相差最大,C错误;
对于D:高三(1)班得分的平均数为,
高三(2)班得分的平均数为,
∵,故高三(1)班五项评价得分的平均数比高三(2)班五项评价得分的平均数要高,D正确.
故选:D.
二、多选题
31.(2023·吉林通化·梅河口市第五中学校考二模)已知两组数据:第一组数据;第二组数据.其中,,,,第一组数据不全相同.将这两组数据相比,则下列说法中正确的是( )
A.平均数一定相等 B.中位数一定相等
C.极差一定相等 D.第一组数据的方差大于第二组数据的方差
【答案】ABC
【分析】根据已知关系式可推导得到,由此可知两组数据完全相同,进而得到结论.
【详解】对于A,,又,,
,A正确;
对于BCD,由A知:,又,则两组数据完全相同,
两组数据的中位数、极差和方差都一定相等,BC正确,D错误.
故选:ABC.
32.(2023·辽宁葫芦岛·统考一模)有3台车床加工同一型号的零件.第1台加工的次品率为6%,第2,3台加工的次品率均为5%,加工出来的零件混放在一起,已知第1,2,3台车床的零件数分别占总数的25%,30%,45%,则下列选项正确的有( )
A.任取一个零件是第1台生产出来的次品概率为0.015
B.任取一个零件是次品的概率为0.0525
C.如果取到的零件是次品,则是第2台车床加工的概率为
D.如果取到的零件是次品,则是第3台车床加工的概率为
【答案】ABC
【分析】利用乘法公式、互斥事件加法求概率判断A、B正误;应用条件概率公式求C、D描述中对应的概率,判断正误.
【详解】A:由题意任取一个零件是第1台生产出来的次品概率为,正确;
B:由题设,任取一个零件是次品的概率为,正确;
C:由条件概率,取到的零件是次品,则是第2台车床加工的概率为,正确;
D:由条件概率,取到的零件是次品,则是第3台车床加工的概率为,错误.
故选:ABC
33.(2023·安徽滁州·校考一模)某省年美术联考约有名学生参加,现从考试的科目素描满分分中随机抽取了名考生的考试成绩,记录他们的分数后,将数据分成组:,,,并整理得到如图所示的频率分布直方图.则下列说法不正确的是( )
A.由频率分布直方图可知,全省考生的该项科目分数均不高于分
B.用样本估计总体,全省该项科目分数小于分的考生约为人
C.若样本中分数小于的考生有人,则可估计总体中分数在区间内约人
D.用样本估计总体,全省考生该项科目分数的中位数为分
【答案】AD
【分析】由样本和总体的关系判断选项A;利用样本频率计算总体中的频数判断选项BC;利用频率分布直方图中位数的算法计算中位数判断选项D.
【详解】由题意可知,在个样本中,该项科目分数是均不高于分,样本可以用来估计总体,但不能代替总体,在其余名考生中,该项科目分数中可能有高于分的,故选项A不正确;
在样本中,分数不低于分的频率为,
则样本中分数小于分的频率为,
若用样本估计总体,则全省该项科目分数小于分的考生约为人,故选项B正确;
在样本中,成绩低于分的频率为,
当分数小于的考生有人时,其频率为,则分数在区间内的频率为,
用样本估计总体,则全省考生中分数在区间内约人,故选项C正确;
用样本估计总体,通过频率分布直方图可知中位数即为将左右两边矩形面积等分所在位置,则该位置在区间内,且等于分,故选项D不正确.
故选:AD.
34.(2023·江苏·统考一模)新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于世纪初,近年来发展迅速,连续8年产销量位居世界第一.下面两图分别是年至年我国新能源汽车年产量和占比(占我国汽车年总产盘的比例)情况,则( )
A.年我国新能源汽车年产量逐年增加
B.年我国新能源汽车年产量的极差为万辆
C.年我国汽车年总产量超过万辆
D.年我国汽车年总产量低于年我国汽车年总产量
【答案】BCD
【分析】根据我国新能源汽车年产量图可判断AB选项;计算出、、这三年我国汽车年总产量,可判断CD选项.
【详解】对于A选项,由图可知,从年到年,我国新能源汽车年产量在下降,A错;
对于B选项,年我国新能源汽车年产量的极差为万辆,B对;
对于C选项,年我国汽车年总产量约为万辆,C对;
对于D选项,年我国汽车年总产量为万辆,
年我国汽车年总产量为万辆,
所以,年我国汽车年总产量低于年我国汽车年总产量,D对.
故选:BCD.
三、解答题
35.(2023·山东·河北衡水中学统考一模)黄河鲤是我国华北地区的主要淡水养殖品种之一,其鳞片金黄、体形梭长,尤以色泽鲜丽、肉质细嫩、气味清香而著称.为研究黄河鲤早期生长发育的规律,丰富黄河鲤早期养殖经验,某院校研究小组以当地某水产养殖基地的黄河鲤仔鱼为研究对象,从出卵开始持续观察20天,试验期间,每天固定时段从试验水体中随机取出同批次9尾黄河鲤仔鱼测量体长,取其均值作为第天的观测值(单位:),其中,.根据以往的统计资料,该组数据可以用Logistic曲线拟合模型或Logistic非线性回归模型进行统计分析,其中a,b,u为参数.基于这两个模型,绘制得到如下的散点图和残差图:
(1)你认为哪个模型的拟合效果更好?分别结合散点图和残差图进行说明:
(2)假定,且黄河鲤仔鱼的体长与天数具有很强的相关关系.现对数据进行初步处理,得到如下统计量的值:,,,,,,其中,,根据(1)的判断结果及给定数据,求关于的经验回归方程,并预测第22天时仔鱼的体长(结果精确到小数点后2位).
附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘估计分别为,;参考数据:.
【答案】(1)拟合效果更好,答案见解析
(2),
【分析】(1)根据散点图,结合两个模型的特征进行判断即可;
(2)根据对数的运算性质,结合题中所给的公式和数据进行求解即可.
【详解】(1)Logistic非线性回归模型拟合效果更好.
从散点图看,散点更均匀地分布在该模型拟合曲线附近;
从残差图看,该模型下的残差更均匀地集中在以残差为0的直线为对称轴的水平带状区域内.
(2)将转化为,
则,所以,
所以.
所以关于的经验回归方程为.
当时,体长.
36.(2023·河南开封·统考二模)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.某研究小组为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,计算得,,,.作散点图发现,除了明显偏离比较大的两个样本点,外,其它样本点大致分布在一条直线附近,为了减少误差,该研究小组剔除了这两个样本点,重新抽样补充了两个偏离比较小的样本点,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)建立地块的植物覆盖面积x(单位:公顷)和这种野生动物的数量y的线性回归方程;
(3)经过进一步治理,如果每个地块的植物覆盖面积增加1公顷,预测该地区这种野生动物增加的数量.
参考公式:线性回归方程,其中,.
【答案】(1)13000
(2)
(3)2000
【分析】(1)由样本数据估计总体野生动物数量即可.
(2)根据线性回归方程的公式求回归方程即可.
(3)根据(2)的回归方程计算即可.
【详解】(1)样区野生动物平均数为,
而地块数为200,该地区这种野生动物的估计值为.
(2)将样本点,替换为,,构成一组新的样本数据,
计算得,,
,,
所以,,
所求回归方程为.
(3)由(2)回归方程可知:每个地块的植物覆盖面积增加1公顷,则野生动物数量增加10,
故该地区这种野生动物增加数量的估计值为:.
37.(2023·江苏·统考一模)人工智能是研究用于模拟和延伸人类智能的技术科学,被认为是21世纪最重要的尖端科技之一,其理论和技术正在日益成熟,应用领域也在不断扩大.人工智能背后的一个基本原理:首先确定先验概率,然后通过计算得到后验概率,使先验概率得到修正和校对,再根据后验概率做出推理和决策.基于这一基本原理,我们可以设计如下试验模型;有完全相同的甲、乙两个袋子,袋子有形状和大小完全相同的小球,其中甲袋中有9个红球和1个白球乙袋中有2个红球和8个白球.从这两个袋子中选择一个袋子,再从该袋子中等可能摸出一个球,称为一次试验.若多次试验直到摸出红球,则试验结束.假设首次试验选到甲袋或乙袋的概率均为(先验概率).
(1)求首次试验结束的概率;
(2)在首次试验摸出白球的条件下,我们对选到甲袋或乙袋的概率(先验概率)进行调整.
①求选到的袋子为甲袋的概率,
②将首次试验摸出的白球放回原来袋子,继续进行第二次试验时有如下两种方案;方案一,从原来袋子中摸球;方案二,从另外一个袋子中摸球.请通过计算,说明选择哪个方案第二次试验结束的概率更大.
【答案】(1)
(2)①;②方案二中取到红球的概率更大.
【分析】(1)根据全概率公式,解决抽签问题;
(2)利用条件概率公式计算,根据数据下结论.
【详解】(1)设试验一次,“取到甲袋”为事件,“取到乙袋”为事件,“试验结果为红球”为事件,“试验结果为白球”为事件,
(1).
所以试验一次结果为红球的概率为.
(2)①因为,是对立事件,,
所以,
所以选到的袋子为甲袋的概率为.
②由①得,
所以方案一中取到红球的概率为:
,
方案二中取到红球的概率为:
,
因为,所以方案二中取到红球的概率更大.
四、填空题
38.(2023·河南开封·开封高中校考模拟预测)2023年春节到来之前,某市物价部门对本市5家商场的某种商品一天的销售量及其价格进行调查,5家商场这种商品的售价x(单位:元)与销售量y(单位:件)之间的一组数据如下表所示:
价格
8
9.5
10.5
12
销售量
16
8
6
5
经分析知,销售量件与价格元之间有较强的线性关系,其线性回归直线方程为,且,则__________.
【答案】
【分析】由表中数据计算、,根据线性回归直线方程过点代入化简求解即可.
【详解】由表中数据,计算 ,
,
因为线性回归直线方程过点,
即,即, 所以,
又因为,所以,
故答案为:.
39.(2023·山东·河北衡水中学统考一模)某企业的一批产品由一等品零件、二等品零件混装而成,每包产品均含有10个零件.小张到该企业采购,利用如下方法进行抽检:从该企业产品中随机抽取1包产品,再从该包产品中随机抽取4个零件,若抽取的零件都是一等品,则决定采购该企业产品;否则,拒绝采购.假设该企业这批产品中,每包产品均含1个或2个二等品零件,其中含2个二等品零件的包数占,则小张决定采购该企业产品的概率为______.
【答案】
【分析】根据题意,分析可得含1个二等品零件的包数占,进而由对立事件和互斥事件的概率公式计算可得答案.
【详解】解:根据题意,该企业这批产品中,含2个二等品零件的包数占,则含1个二等品零件的包数占,
在含1个二等品零件产品中,随机抽取4个零件,若抽取的4个零件都是一等品,其概率,
在含2个二等品零件产品中,随机抽取4个零件,若抽取的4个零件都是一等品,其概率,
则小张决定采购该企业产品的概率;
故答案为:.
40.(2023·全国·模拟预测)2022年11月30日,神舟十五号与神舟十四号航天员乘组在太空“胜利会师”,一起在中国人自己的“太空家园”留下了一张足以载入史册的太空合影.为了帮助同学们了解这六名航天员的奋斗历程,某班进行了相关专题讲座,并要求每人写一篇感想,班主任从中选取两篇优秀感想A,B向甲、乙报社投稿,先把A投向甲报社,B投向乙报社,两篇感想被采用的概率均为,若两篇感想至少有一篇被采用,则没被采用的将不再继续投稿;若两篇感想都没有被采用,则把A投向乙报社,B投向甲报社,此时A,B被采用的概率均为.若A,B是否被采用互不影响,则两篇感想至少有一篇被采用的概率为______.
【答案】
【分析】先求出第一次投稿至少有一篇感想被采用的概率,再求出第一次投稿两篇感想都没有被采用,第二次投稿至少有一篇感想被采用的概率,最后求概率之和即可.
【详解】由题意得,第一次投稿两篇感想都没被采用的概率为,
所以第一次投稿至少有一篇感想被采用的概率,
第一次投稿两篇感想都没被采用,第二次投稿至少有一篇感想被采用的概率
,
故两篇感想至少有一篇被采用的概率.
故答案为:.
41.(2023·辽宁朝阳·校联考一模)2022年卡塔尔世界杯是第二十二届世界杯足球赛,是历史上首次在卡塔尔和中东国家境内举行.某支深受大家喜爱的足球队在对球员的使用上总是进行数据分析,根据以往的数据统计,A运动员能够胜任中锋、边锋及前腰三个位置,且出场率分别为0.2,0.5,0.3,当该运动员担当中锋、边锋及前腰时,球队输球的概率依次为0.4,0.2,0.2.当A球员参加比赛时,该球队某场比赛不输球的概率为__________.
【答案】
【分析】根据事件的独立性以及概率乘法公式求解.
【详解】该运动员担当中锋,不输球的概率为,
该运动员担当边锋,不输球的概率为,
该运动员担当前腰,不输球的概率为,
所以该球队某场比赛不输球的概率为,
故答案为:.
新高考数学二轮复习分层练习专题26 概率和统计(含解析): 这是一份新高考数学二轮复习分层练习专题26 概率和统计(含解析),共30页。
新高考数学二轮复习培优讲义19 直线和圆(含解析): 这是一份新高考数学二轮复习培优讲义19 直线和圆(含解析),共37页。
高考数学二轮复习核心专题讲练:统计与概率第4讲 统计与概率综合解答题(含解析): 这是一份高考数学二轮复习核心专题讲练:统计与概率第4讲 统计与概率综合解答题(含解析),共52页。试卷主要包含了,且规定计分规则如表,关于月份x的数据如表等内容,欢迎下载使用。