高考数学统考一轮复习第10章计数原理概率随机变量及其分布第7节离散型随机变量的均值与方差正态分布学案
展开离散型随机变量的均值与方差、正态分布
[考试要求] 1.理解取有限个值的离散型随机变量的均值、方差的概念.
2.会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、方差概念解决一些简单实际问题.
3.借助频率直方图认识正态分布曲线的特点及曲线所表示的意义.
1.离散型随机变量的分布列、均值与方差
一般地,若离散型随机变量X的分布列为
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)方差:称D(X)=[xi-E(X)]2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
| 均值 | 方差 |
变量X服从两点分布 | E(X)=p | D(X)=p(1-p) |
X~B(n,p) | E(X)=np | D(X)=np(1-p) |
4.正态分布
(1)正态曲线的特点:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
(2)正态分布的三个常用数据
①P(μ-σ<X≤μ+σ)=0.682 7;
②P(μ-2σ<X≤μ+2σ)=0.954 5;
③P(μ-3σ<X≤μ+3σ)=0.997 3.
1.均值与方差的关系:D(X)=E(X2)-E2(X).
2.超几何分布的均值:若X服从参数为N,M,n的超几何分布,则E(X)=.
一、易错易误辨析(正确的打“√”,错误的打“×”)
(1)离散型随机变量的各个可能值表示的事件是彼此互斥的. ( )
(2)若X~N(μ,σ2),则μ,σ2分别表示正态分布的均值和方差. ( )
(3)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
[答案] (1)√ (2)√ (3)√
二、教材习题衍生
1.已知X的分布列为
X | -1 | 0 | 1 |
P | a |
设Y=2X+3,则E(Y)的值为( )
A. B.4 C.-1 D.1
A [由概率分布列的性质可知:++a=1,
∴a=.
∴E(X)=(-1)×+0×+1×=-.
∴E(Y)=3+2E(X)=3-=.]
2.若离散型随机变量X的分布列为
X | 0 | 1 |
P |
则X的方差D(X)= .
[由+=1得a=1或-2(舍去).
∴X的分布列为
X | 0 | 1 |
P |
∴D(X)==.]
3.已知随机变量X服从正态分布N(3,1),且P(X>2c-1)=P(X<c+3),则c= .
[∵X~N(3,1),∴正态曲线关于直线x=3对称,
且P(X>2c-1)=P(X<c+3),
∴2c-1+c+3=3×2,∴c=.]
4.甲、乙两工人在一天生产中出现的废品数分别是两个随机变量X,Y,其分布列分别为:
X | 0 | 1 | 2 | 3 |
P | 0.4 | 0.3 | 0.2 | 0.1 |
Y | 0 | 1 | 2 |
P | 0.3 | 0.5 | 0.2 |
若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是 .
乙 [E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.E(Y)=0×0.3+1×0.5+2×0.2=0.9,因为E(Y)<E(X),所以乙技术好.]
考点一 求离散型随机变量的均值、方差
求离散型随机变量X的均值与方差的步骤
(1)理解X的意义,写出X可能取的全部值.
(2)求X取每个值时的概率.
(3)写出X的分布列.
(4)由均值的定义求E(X).
(5)由方差的定义求D(X).
[典例1] 为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E(ξ),方差D(ξ).
[解] (1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为p1=×=,
两人都付40元的概率为p2=×=,
两人都付80元的概率为
p3=×=×=,
则两人所付费用相同的概率为p=p1+p2+p3=++=.
(2)由题设甲、乙所付费用之和为ξ,ξ可能取值为0,40,80,120,160,则:
P(ξ=0)=×=;
P(ξ=40)=×+×=;
P(ξ=80)=×+×+×=;
P(ξ=120)=×+×=;
P(ξ=160)=×=.
ξ的分布列为
ξ | 0 | 40 | 80 | 120 | 160 |
P |
E(ξ)=0×+40×+80×+120×+160×=80.
D(ξ)=(0-80)2×+(40-80)2×+(80-80)2×+(120-80)2×+(160-80)2×=.
点评:(1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
(2)注意E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)的应用.
1.某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=( )
A.0.7 B.0.6 C.0.4 D.0.3
B [由题意知,该群体的10位成员使用移动支付的概率分布符合二项分布,所以D(X)=10p(1-p)=2.4,所以p=0.6或p=0.4.由P(X=4)<P(X=6),得Cp4(1-p)6<Cp6(1-p)4,即(1-p)2<p2,所以p>0.5,所以p=0.6.]
2.随机抽取某厂的某种产品200件,经质检,其中一等品126件,二等品50件,三等品20件,次品4件.已知生产1件一、二、三等品获得的利润分别为6万元、2万元、1万元,而1件次品亏损2万元,设1件产品的利润(单位:元)为X.
(1)求X的分布列;
(2)求1件产品的平均利润(即X的数学期望);
(3)经技术革新后,仍有四个等级的产品,但次品率降为1%,一等品率提高为70%,如果此时要求1件产品的平均利润不小于4.73万元,则三等品率最多是多少?
[解] (1)X的所有可能取值有6,2,1,-2.
P(X=6)==0.63,
P(X=2)==0.25,P(X=1)==0.1,
P(X=-2)==0.02.
故X的分布列为:
X | 6 | 2 | 1 | -2 |
P | 0.63 | 0.25 | 0.1 | 0.02 |
(2)E(X)=6×0.63+2×0.25+1×0.1+(-2)×0.02=4.34.
(3)设技术革新后的三等品率为x,则此时1件产品的平均利润为
E(X)=6×0.7+2×(1-0.7-0.01-x)+1×x+(-2)×0.01
=4.76-x(0≤x≤0.29).
依题意,E(X)≥4.73,
即4.76-x≥4.73,
解得x≤0.03,所以三等品率最多为3%.
考点二 均值与方差在决策中的应用
利用均值、方差进行决策的两个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大.则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
[典例2](2020·郑州市第一次质量预测)水污染现状与工业废水排放密切相关,某工厂深入贯彻科学发展观,努力提高污水收集处理水平,其污水处理程序如下:原始污水必先经过A系统处理,处理后的污水(A级水)达到环保标准(简称达标)的概率为p(0<p<1).经化验检测,若确认达标便可直接排放;若不达标则必须经过B系统处理后直接排放.
该工厂现有4个标准水量的A级水池,分别取样、检测.多个污水样本检测时,既可以逐个化验,也可以将若干个样本混合在一起化验.混合样本中只要有样本不达标,则混合样本的化验结果必不达标.若混合样本不达标,则该组中各个样本必须再逐个化验;若混合样本达标,则原水池的污水直接排放.
现有以下四种方案:
方案一:逐个化验;
方案二:平均分成两组化验,且每组两个样本混在一起化验;
方案三:三个样本混在一起化验,剩下的一个单独化验;
方案四:四个样本混在一起化验.
化验次数的期望值越小,则方案越“优”.
(1)若p=,求2个A级水样本混合化验结果不达标的概率.
(2)①若p=,现有4个A级水样本需要化验,请问:方案一、二、四中哪个最“优”?
②若方案三比方案四更“优”,求p的取值范围.
[解] (1)该混合样本达标的概率是=,
根据对立事件知,不达标的概率为1-=.
(2)①方案一:逐个化验,化验次数为4.
方案二:由(1)知,每组两个样本化验时,若均达标则化验次数为2,概率为 =;若一组达标,另一组不达标则化验次数为4,概率为C××=;若两组均不达标则化验次数为6,概率为=.记方案二的化验次数为ξ2,则ξ2的可能取值为2,4,6,
其分布列如下,
ξ2 | 2 | 4 | 6 |
P |
可求得方案二的期望为E(ξ2)=2×+4×+6×==.
方案四:混在一起化验,记化验次数为ξ4,则ξ4可取1,5,
其分布列如下,
ξ4 | 1 | 5 |
P |
可求得方案四的期望为E(ξ4)=1×+5×=.
比较可得E(ξ4)<E(ξ2)<4,故方案四最“优”.
②方案三:设化验次数为η3,则η3可取2,5,
η3 | 2 | 5 |
P | p3 | 1-p3 |
E(η3)=2p3+5(1-p3)=5-3p3;
方案四:设化验次数为η4,则η4可取1,5,
η4 | 1 | 5 |
P | p4 | 1-p4 |
E(η4)=p4+5(1-p4)=5-4p4.
由题意得E(η3)<E(η4)⇔5-3p3<5-4p4⇔p<.
故当0<p<时,方案三比方案四更“优”.
点评:随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
某种大型医疗检查机器生产商,对一次性购买2台机器的客户,推出两种超过质保期后两年内的延保维修优惠方案:
方案一:交纳延保金7 000元,在延保的两年内可免费维修2次,超过2次每次收取维修费2 000元;
方案二:交纳延保金10 000元,在延保的两年内可免费维修4次,超过4次每次收取维修费1 000元.
某医院准备一次性购买2台这种机器.现需决策在购买机器时应购买哪种延保方案,为此搜集并整理了50台这种机器超过质保期后延保两年内维修的次数,得下表:
维修次数 | 0 | 1 | 2 | 3 |
台数 | 5 | 10 | 20 | 15 |
以这50台机器维修次数的频率代替1台机器维修次数发生的概率.记X表示这2台机器超过质保期后延保的两年内共需维修的次数.
(1)求X的分布列;
(2)以所需延保金及维修费用的期望值为决策依据,医院选择哪种延保方案更合算?
[解] (1)X所有可能的取值为0,1,2,3,4,5,6.
P(X=0)=×=,
P(X=1)=××2=,
P(X=2)=×+××2=,
P(X=3)=××2+××2=,
P(X=4)=×+××2=,
P(X=5)=××2=,
P(X=6)=×=,
∴X的分布列为
X | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
P |
(2)选择延保方案一,所需费用Y1元的分布列为:
Y1 | 7 000 | 9 000 | 11 000 | 13 000 | 15 000 |
P |
E(Y1)=×7 000+×9 000+×11 000+×13 000+×15 000=10 720(元).
选择延保方案二,所需费用Y2元的分布列为:
Y2 | 10 000 | 11 000 | 12 000 |
P |
E(Y2)=×10 000+×11 000+×12 000
=10 420(元).
∵E(Y1)>E(Y2),∴该医院选择延保方案二较合算.
考点三 正态分布
关于正态总体在某个区间内取值的概率求法
(1)熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值.
(2)充分利用正态曲线的对称性和曲线与x轴之间面积为1.①正态曲线关于直线x=μ对称,从而在关于x=μ对称的区间上概率相等;②P(X<a)=1-P(X≥a),P(X<μ-a)=P(X≥μ+a).
[典例3] 为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得=xi=9.97,s==)≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ<Z<μ+3σ)=0.997 4,0.997 416≈0.959 2,≈0.09.
[解] (1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
点评:本题考查正态分布、概率统计问题的综合,是在知识网络的交汇处命制的一道较为新颖的试题.正态分布与统计案例有些知识点是所谓的高考“冷点”,由于考生对这些“冷点”的内容重视不够,复习不全面,一旦这些“冷点”知识出了考题,虽然简单但也做错,甚至根本不会做,因而错误率相当高.本题求解的关键是借助题设提供的数据对问题做出合理的分析,其中方差公式的等价变形是数据处理的关键点.
1.在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(-1,1)的密度曲线)的点的个数的估计值为( )
附:若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 7,P(μ-2σ<X<μ+2σ)=0.954 5.
A.1 193 B.1 359
C.2 718 D.3 413
B [对于正态分布N(-1,1),μ=-1,σ=1,正态曲线关于x=-1对称,故题图中阴影部分的面积为×[P(-3<X<1)-P(-2<X<0)]=×[P(μ-2σ<X<μ+2σ)-P(μ-σ<X<μ+σ)]=×(0.954 5-0.682 7)=0.135 9,所以点落入题图中阴影部分的概率P==0.135 9,投入10 000个点,落入阴影部分的个数约为10 000×0.135 9=1 359.]
2.为评估设备M生产某种零件的性能,从设备M生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表:
直径/mm | 58 | 59 | 61 | 62 | 63 | 64 | 65 | 66 |
个数 | 1 | 1 | 3 | 5 | 6 | 19 | 33 | 18 |
直径/mm | 67 | 68 | 69 | 70 | 71 | 73 | 合计 | |
个数 | 4 | 4 | 2 | 1 | 2 | 1 | 100 |
经计算,样本直径的平均值μ=65,标准差σ=2.2,以频率值作为概率的估计值.
(1)为评判一台设备的性能,从该设备加工的零件中任意抽取一件,记其直径为X,并根据以下不等式进行评判(P表示相应事件的概率):①P(μ-σ<X≤μ+σ)≥0.682 7;②P(μ-2σ<X≤μ+2σ)≥0.954 5;③P(μ-3σ<X≤μ+3σ)≥0.997 3.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁,试判断设备M的性能等级.
(2)将直径小于等于μ-2σ或直径大于μ+2σ的零件认为是次品.
①从设备M的生产流水线上随机抽取2件零件,计算其中次品件数Y的数学期望E(Y);
②从样本中随机抽取2件零件,计算其中次品件数Z的数学期望E(Z).
[解] (1)P(μ-σ<X≤μ+σ)=P(62.8<X≤67.2)=0.8>0.682 7,P(μ-2σ<X≤μ+2σ)=P(60.6<X≤69.4)=0.94<0.954 5,
P(μ-3σ<X≤μ+3σ)=P(58.4<X≤71.6)=0.98<0.997 3,
因为设备M的数据仅满足一个不等式,故其性能等级为丙.
(2)易知样本中次品共6件,可估计设备M生产零件的次品率为0.06.
①由题意可知Y~B,于是E(Y)=2×0.06=0.12.
②由题意可知Z的分布列为
Z | 0 | 1 | 2 |
P |
故E(Z)=0×+1×+2×=.
(新高考)高考数学一轮复习学案10.7《离散型随机变量的均值与方差、正态分布》(含详解): 这是一份(新高考)高考数学一轮复习学案10.7《离散型随机变量的均值与方差、正态分布》(含详解),共17页。学案主要包含了知识梳理,教材衍化等内容,欢迎下载使用。
高考数学一轮复习第9章计数原理概率随机变量及其分布第7讲离散型随机变量的分布列期望与方差学案: 这是一份高考数学一轮复习第9章计数原理概率随机变量及其分布第7讲离散型随机变量的分布列期望与方差学案,共13页。
高考数学统考一轮复习第10章计数原理概率随机变量及其分布第5节离散型随机变量及其分布列学案: 这是一份高考数学统考一轮复习第10章计数原理概率随机变量及其分布第5节离散型随机变量及其分布列学案,共8页。