第二篇专题四第1课时概率与统计的综合应用 2022版高考数学复习讲义
展开统计与概率解答题第1课时 概率与统计的综合应用统计与简单的概率问题 【典例1】(2020·全国Ⅰ卷)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表等级ABCD频数40202020乙分厂产品等级的频数分布表等级ABCD频数28173421(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?【思维点拨】(1)根据表格数据得到甲、乙A级品的频数分别为40,28,即可求得相应频率(2)根据所给数据分别求出甲、乙的平均利润【规范解答】(1)由表格可得,甲分厂加工出来的一件产品为A级品的频数为40,故频率为=0.4,乙分厂加工出来的一件产品为A级品的频数为28,故频率为=0.28,故甲、乙两分厂加工出来的一件产品为A级品的概率估计值分别是0.4,0.28;4分(2)由表格可知甲分厂加工四个等级的频率分别为0.4,0.2,0.2,0.2,故其平均利润为(90-25)×0.4+(50-25)×0.2+(20-25)×0.2+(-50-25)×0.2=15(元);7分同理乙分厂加工四个等级的频率分别为0.28,0.17,0.34,0.21,故其平均利润为(90-20)×0.28+(50-20)×0.17+(20-20)×0.34+(-50-20)×0.21=10(元);10分因为15>10,所以选择甲分厂承接更好.12分易错点求平均利润时忽视各个等级的频率,没有求加权平均数.障碍点用频率估计概率学科素养数据分析、数学运算、数学建模评分细则(1)中求对甲、乙两厂加工出来的一件产品为A级品的概率之一得2分.求解统计与简单的概率问题的关注点(1)依据题目中的所给信息,提炼出需要的信息.(2)频率=,用频率估计概率.(3)此类问题中统计模型多是分层随机抽样、统计图表,概率模型多是古典概型、互斥事件的概率. 一汽车厂生产A,B,C三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如表(单位:辆): 轿车A轿车B轿车C舒适型100150z标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A类轿车10辆.(1)求z的值;(2)用分层抽样的方法在C类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率.(3)用随机抽样的方法从B类舒适型轿车中抽取8辆,经检测它们的得分x的值如下:9.4,8.6,9.2,9.6,8.7,9.3,9.0,8.2,把这8辆轿车的得分看成一个总体,从中任取一个数xi(1≤i≤8,i∈N),设样本平均数为,求|xi-|≤0.5的概率.【解析】(1)设该厂这个月共生产轿车n辆,由题意得=,所以n=2 000,所以z=2 000-(100+300)-150-450-600=400;(2)设所抽样本中有a辆舒适型轿车,由题意,得a=2,因此抽取的容量为5的样本中,有2辆舒适型轿车,3辆标准型轿车,用A1,A2表示2辆舒适型轿车,用B1,B2,B3表示3辆标准型轿车,用E表示事件“在该样本中任取2辆,其中至少有1辆舒适型轿车”,则基本事件空间包含的基本事件有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),共10个.事件E包含的基本事件有:(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),共7个,故P(E)=,即所求概率为.(3)样本平均数=×(9.4+8.6+9.2+9.6+8.7+9.3+9.0+8.2)≈9,设D表示事件“从样本中任取一数,该数与样本平均数之差的绝对值不超过0.5”,则基本事件空间中有8个基本事件,事件D包括的基本事件有:9.4,8.6,9.2,8.7,9.3,9.0,共6个,所以P(D)==,即所求概率为.统计与随机变量分布列的综合问题【典例2】(2021·泰安一模)某市为了了解本市初中生周末运动时间,随机调查了3 000名学生,统计了他们的周末运动时间,制成如图所示的频率分布直方图.(1)按照分层抽样,从[40,50)和[80,90)中随机抽取了9名学生.现从已抽取的9名学生中随机推荐3名学生参加体能测试.记推荐的3名学生来自[40,50)的人数为X,求X的分布列和数学期望;(2)由频率分布直方图可认为:周末运动时间t服从正态分布N(μ,σ2),其中,μ为周末运动时间的平均数,σ近似为样本的标准差s,并已求得s≈14.6.可以用该样本的频率估计总体的概率,现从本市所有初中生中随机抽取12名学生,记周末运动时间在(43.9,87.7]之外的人数为Y,求P(Y=3)(精确到0.001).参考数据1:当t~N(μ,σ2)时,P(μ-σ<t≤μ+σ)≈0.682 7,P(μ-2σ<t≤μ+2σ)≈0.954 5,P(μ-3σ<t≤μ+3σ)≈0.997 3;参考数据2:0.818 69≈0.165 1;0.181 43≈0.006 0.【思维点拨】(1)由分层抽样得从中抽6人,[80,90)中抽3人,故随机变量X可取0,1,2,3.(2)求解P(t≤μ-σ或t>μ+2σ),说明Y~B(12,0.181 4)【规范解答】(1)根据分层抽样,从[40,50)中抽取6人,在[80,90)中抽取3人,(1分)随机变量X的可能取值为0,1,2,3,P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==,则X的分布列为:X0123P(5分)E(X)=0×+1×+2×+3×=2.(6分)易错点弄错分层比,导致随机变量X取值错误.障碍点未读懂频率分布直方图中信息.学科素养数据分析、数学运算、数学建模评分细则每求对1个概率值给1分,不列分布列扣1分.(2)μ==35×0.01×10+45×0.02×10+55×0.03×10+65×0.015×10+75×0.015×10+85×0.01×10=58.5,又因为43.9=58.5-14.6=μ-σ,87.7=58.5+2×14.6=μ+2σ,所以P(43.9<t≤87.7)=P(μ-σ<t≤μ+2σ)==0.818 6,所以P(t≤43.9或t>87.7)=1-0.818 6=0.181 4,(9分)则Y~B(12,0.181 4),所以P(Y=3)=C×0.181 43×0.818 69=220×0.006 0×0.165 1≈0.218.12分易错点求错概率值.障碍点①利用正态分布知识求周末运动时间在(43.9,87.7]之外的概率;②所求概率服从二项分布. 学科素养数据分析、数学运算、数学建模评分细则求对μ值给1分;用正态分布求概率正确,又判断出随机变量Y服从二项分布给1分. 统计与随机变量分布列的综合问题的解题思路(1)寻找问题中随机变量的统计意义.(2)综合统计中相关图、表、数据,明确相关联的随机变量的分布特征.(3)根据随机变量的分布特征进一步解决相关问题. (2021·石家庄一模)“T2钻石联赛”是世界乒联推出的一种新型乒乓球赛事,其赛制如下:采用七局四胜制,比赛过程中可能出现两种模式:“常规模式”和“FAST5模式”.在前24分钟内进行的常规模式中,每小局比赛均为11分制,率先拿满11分的选手赢得该局;如果两名球员在24分钟内都没有人赢得4局比赛,那么将进入“FAST5”模式,“FAST5”模式为5分制的小局比赛,率先拿满5分的选手赢得该局.24分钟计时后开始的所有小局均采用“FAST5”模式.某位选手率先在7局比赛中拿下4局,比赛结束.现有甲、乙两位选手进行比赛,经统计分析甲、乙之间以往比赛数据发现,24分钟内甲、乙可以完整打满2局或3局,且在11分制比赛中,每局甲获胜的概率为,乙获胜的概率为;在“FAST5”模式,每局比赛双方获胜的概率都为,每局比赛结果相互独立.(1)求4局比赛决出胜负的概率;(2)设在24分钟内,甲、乙比赛了3局,比赛结束时,甲乙总共进行的局数记为X,求X的分布列及数学期望.【解析】(1)若24分钟内打满2局,最后可能甲/乙获胜,则P1=×+×=;若24分钟内打满3局,最后可能甲/乙获胜,则P2=×+×=,因此4局比赛决出胜负的概率为+=;(2)由题意可知,X的可能取值为4,5,6,7,所以P(X=4)=×+×=,P(X=5)=C·×××+××+C·×××+××=,P(X=6)=C·××+C·×·C·+××+C×××+C·×·C·+·×=,P(X=7)=×+C·×·C·×+C·×·C··+·+×+C·××C·×+C·×·C·×+×=,所以X的分布列为:X4567P所以X的数学期望为E(X)=4×+5×+6×+7×=.期望、方差的实际应用问题【典例3】(2021·临沂一模)疫情工作领导小组会议作出部署,要求尽力扩大核酸检测范围,着力提升检测能力.根据统计发现,疑似病例核酸检测呈阳性的概率为p(0<p<1).现有4例疑似病例,分别对其取样、检测,既可以逐个化验,也可以将若干个样本混合在一起化验,混合样本中只要有病毒,则化验结果呈阳性.若混合样本呈阳性,则需将该组中备用的样本再逐个化验;若混合样本呈阴性,则判定该组各个样本均为阴性,无需再化验.现有以下三种方案:方案一:4个样本逐个化验;方案二:4个样本混合在一起化验;方案三:4个样本均分为两组,分别混合在一起化验.疫情初期,由于检测能力不足,化验次数的期望值越小,则方案越“优”.(1)若p=,按方案一,求4例疑似病例中恰有2例呈阳性的概率;(2)若p=,现将该4例疑似病例样本进行化验,试比较以上三个方案中哪个最“优”,并说明理由.【思维点拨】(1)服从二项分布(2)分别求方案一、二、三的期望,比较大小.【解析】(1)p=,按方案一,4例疑似病例中恰有2例呈阳性的概率P=C()2()2=.(2)方案一:逐个化验,化验次数为:4×1=4,方案二:化验次数为X,X的可能取值为1,5,P(X=1)=(1-)4=,P(X=5)=1-=,所以X的分布列如下:X15P方案二的数学期望为:E(X)=1×+5×=2.375 6.方案三:由(1)知,每组两个样本化验时,若呈阴性,则化验次数为1,概率为,若呈阳性则化验次数为3,概率为1-=,方案三的化验次数记为Y,Y的可能取值为2,4,6,P(Y=2)=()2=,P(Y=4)=2××=,P(Y=6)=()2=,所以Y的分布列为:Y246P方案三的期望为E(Y)=2×+4×+6×=2.76,因为E(X)<E(Y)<4,所以方案二最“优”. 利用期望与方差进行决策的思想方法(1)利用随机变量的期望与方差可以帮助我们作出科学的决策;(2)随机变量的期望的意义在于描述随机变量的平均程度;(3)方差则描述了随机变量稳定与波动或者集中与分散的状况.品种的优劣、仪器的好坏、预报的准确与否、机器的性能好坏等很多指标都与这两个特征量有关. (2021·湖北十一校联考)高尔顿板是英国生物统计学家高尔顿设计用来研究随机现象的模型,在一块木板上钉着若干排相互平行但相互错开的圆柱形小木块,小木块之间留有适当的空隙作为通道,前面挡有一块玻璃,让一个小球从高尔顿板上方的通道口落下,小球在下落的过程中与层层小木块碰撞,且等可能向左或向右滚下,最后掉入高尔顿板下方的某一球槽内.如图1所示的高尔顿板有7层小木块,小球从通道口落下,第一次与第2层中间的小木块碰撞,以的概率向左或向右滚下,依次经过6次与小木块碰撞,最后掉入编号为1,2,…,7的球槽内.例如小球要掉入3号球槽,则在6次碰撞中有2次向右4次向左滚下.(1)如图1,进行一次高尔顿板试验,求小球掉入5号球槽的概率;(2)小红、小明同学在研究了高尔顿板后,利用高尔顿板来到社团文化节上进行盈利性“抽奖”活动.小红使用图1所示的高尔顿板,付费6元可以玩一次游戏,小球掉入m号球槽得到的奖金为ξ元,其中ξ=|16-4m|.小明改进了高尔顿板(如图2),首先将小木块减少成5层,然后使小球在下落的过程中与小木块碰撞时,有的概率向左,的概率向右滚下,最后掉入编号为1,2,…,5的球槽内,改进高尔顿板后只需付费4元就可以玩一次游戏,小球掉入n号球槽得到的奖金为η元,其中η=(n-4)2.两位同学的高尔顿板游戏火爆进行,很多同学参加了游戏,你觉得小红和小明同学谁的盈利多?请说明理由.【解析】(1)设这个小球掉入5号球槽为事件A.掉入5号球槽,需要向右4次向左2次,所以P(A)=C=.所以这个小球掉入5号球槽的概率为.(2)小明的盈利多.理由如下:小红的收益计算如下:每一次游戏中,ξ的可能取值为0,4,8,12.P(ξ=0)=P(m=4)=C=,P(ξ=4)=P(m=3)+P(m=5)=C+C=,P(ξ=8)=P(m=2)+P(m=6)=C+C=,P(ξ=12)=P(m=1)+P(m=7)=C+C=.ξ04812P一次游戏付出的奖金E(ξ)=0×+4×+8×+12×=,则小红的收益为6-=.小明的收益计算如下:每一次游戏中,η的可能取值为0,1,4,9.P(η=0)=P(n=4)=C=,P(η=1)=P(n=3)+P(n=5)=C+C=,P(η=4)=P(n=2)=C=,P(η=9)=P(n=1)==.所以η的分布列为:η0149P一次游戏付出的奖金E(η)=0×+1×+4×+9×=1,则小明的收益为4-1=3.因为3>,所以小明的盈利多.