2021版高考数学苏教版一轮教师用书:10.7离散型随机变量的均值与方差、正态分布
展开第七节 离散型随机变量的均值与方差、正态分布
[最新考纲] 1.理解取有限个值的离散型随机变量的均值、方差的概念.2.会求简单离散型随机变量的均值、方差,并能利用离散型随机变量的均值、方差概念解决一些简单实际问题.3.借助直观直方图认识正态分布曲线的特点及曲线所表示的意义.
1.离散型随机变量的分布列、均值与方差
一般地,若离散型随机变量X的分布列为
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
(1)均值:称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)方差:称D(X)=[xi-E(X)]2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b.
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两点分布与二项分布的均值、方差
| 均值 | 方差 |
变量X服从两点分布 | E(X)=p | D(X)=p(1-p) |
X~B(n,p) | E(X)=np | D(X)=np(1-p) |
4.正态分布
(1)正态曲线的特点:
①曲线位于x轴上方,与x轴不相交;
②曲线是单峰的,它关于直线x=μ对称;
③曲线在x=μ处达到峰值;
④曲线与x轴之间的面积为1;
⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿x轴平移;
⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
(2)正态分布的三个常用数据
①P(μ-σ<X≤μ+σ)=0.682 6;
②P(μ-2σ<X≤μ+2σ)=0.954 4;
③P(μ-3σ<X≤μ+3σ)=0.997 4.
1.均值与方差的关系:D(X)=E(X2)-E2(X).
2.超几何分布的均值:若X服从参数为N,M,n的超几何分布,则E(X)=.
一、思考辨析(正确的打“√”,错误的打“×”)
(1)离散型随机变量的各个可能值表示的事件是彼此互斥的.
( )
(2)若X~N(μ,σ2),则μ,σ2分别表示正态分布的均值和方差.
( )
(3)随机变量的均值是常数,样本的平均值是随机变量.( )
(4)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小. ( )
[答案](1)√ (2)√ (3)× (4)√
二、教材改编
1.已知X的分布列为
X | -1 | 0 | 1 |
P | a |
设Y=2X+3,则E(Y)的值为( )
A. B.4 C.-1 D.1
A [由概率分布列的性质可知:++a=1,
∴a=.
∴E(X)=(-1)×+0×+1×=-.
∴E(Y)=3+2E(X)=3-=.]
2.若随机变量X满足P(X=c)=1,其中c为常数,则D(X)的值为 .
0 [∵P(X=c)=1,∴E(X)=c×1=c,
∴D(X)=(c-c)2×1=0.]
3.已知随机变量X服从正态分布N(3,1),且P(X>2c-1)=P(X<c+3),则c= .
[∵X~N(3,1),∴正态曲线关于x=3对称,
且P(X>2c-1)=P(X<c+3),
∴2c-1+c+3=3×2,∴c=.]
4.甲、乙两工人在一天生产中出现的废品数分别是两个随机变量X,Y,其分布列分别为:
X | 0 | 1 | 2 | 3 |
P | 0.4 | 0.3 | 0.2 | 0.1 |
Y | 0 | 1 | 2 |
P | 0.3 | 0.5 | 0.2 |
若甲、乙两人的日产量相等,则甲、乙两人中技术较好的是 .
乙 [E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.E(Y)=0×0.3+1×0.5+2×0.2=0.9,因为E(Y)<E(X),所以乙技术好.]
考点1 求离散型随机变量的均值、方差
求离散型随机变量X的均值与方差的步骤
(1)理解X的意义,写出X可能取的全部值.
(2)求X取每个值时的概率.
(3)写出X的分布列.
(4)由均值的定义求E(X).
(5)由方差的定义求D(X).
为迎接2022年北京冬奥会,推广滑雪运动,某滑雪场开展滑雪促销活动.该滑雪场的收费标准是:滑雪时间不超过1小时免费,超过1小时的部分每小时收费标准为40元(不足1小时的部分按1小时计算).有甲、乙两人相互独立地来该滑雪场运动,设甲、乙不超过1小时离开的概率分别为,;1小时以上且不超过2小时离开的概率分别为,;两人滑雪时间都不会超过3小时.
(1)求甲、乙两人所付滑雪费用相同的概率;
(2)设甲、乙两人所付的滑雪费用之和为随机变量ξ(单位:元),求ξ的分布列与数学期望E(ξ),方差D(ξ).
[解](1)两人所付费用相同,相同的费用可能为0,40,80元,两人都付0元的概率为p1=×=,
两人都付40元的概率为p2=×=,
两人都付80元的概率为
p3=×=×=,
则两人所付费用相同的概率为p=p1+p2+p3=++=.
(2)由题设甲、乙所付费用之和为ξ,ξ可能取值为0,40,80,120,160,则:
P(ξ=0)=×=;
P(ξ=40)=×+×=;
P(ξ=80)=×+×+×=;
P(ξ=120)=×+×=;
P(ξ=160)=×=.
ξ的分布列为
ξ | 0 | 40 | 80 | 120 | 160 |
P |
E(ξ)=0×+40×+80×+120×+160×=80.
D(ξ)=(0-80)2×+(40-80)2×+(80-80)2×+(120-80)2×+(160-80)2×=.
(1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
(2)注意E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)的应用.
[教师备选例题]
1.(2019·杭州模拟)已知0<a<,随机变量ξ的分布列如下:
ξ | -1 | 0 | 1 |
P | a | -a |
当a增大时,( )
A.E(ξ)增大,D(ξ)增大
B.E(ξ)减小,D(ξ)增大
C.E(ξ)增大,D(ξ)减小
D.E(ξ)减小,D(ξ)减小
B [由题意得,E(ξ)=-a+,D(ξ)=2×a++2×=-a2+2a+,
又∵0<a<,∴当a增大时,E(ξ)减小,D(ξ)增大.]
2.设袋子中装有a个红球,b个黄球,c个蓝球,且规定:取出一个红球得1分,取出一个黄球得2分,取出一个蓝球得3分.
(1)当a=3,b=2,c=1时,从该袋子中任取(有放回,且每球取到的机会均等)2个球,记随机变量ξ为取出此2球所得分数之和,求ξ的分布列;
(2)从该袋子中任取(每球取到的机会均等)1个球,记随机变量η为取出此球所得分数.若E(η)=,D(η)=,求a∶b∶c.
[解](1)由题意得ξ=2,3,4,5,6,
故P(ξ=2)==,
P(ξ=3)==,
P(ξ=4)==,
P(ξ=5)==,
P(ξ=6)==.
所以ξ的分布列为
ξ | 2 | 3 | 4 | 5 | 6 |
P |
(2)由题意知η的分布列为
η | 1 | 2 | 3 |
P |
所以E(η)=++=,
D(η)=2·+2·+2·=,
化简得
解得a=3c,b=2c,故a∶b∶c=3∶2∶1.
1.(2018·全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=( )
A.0.7 B.0.6 C.0.4 D.0.3
B [由题意知,该群体的10位成员使用移动支付的概率分布符合二项分布,所以D(X)=10p(1-p)=2.4,所以p=0.6或p=0.4.由P(X=4)<P(X=6),得Cp4(1-p)6<Cp6(1-p)4,即(1-p)2<p2,所以p>0.5,所以p=0.6.]
2.大豆是我国主要的农作物之一,因此,大豆在农业发展中占有重要的地位,随着农业技术的不断发展,为了使大豆得到更好的种植,就要进行超级种培育研究.某种植基地培育的“超级豆”种子进行种植测试:选择一块营养均衡的可种植4株的实验田地,每株放入三粒“超级豆”种子,且至少要有一粒种子发芽这株豆苗就能有效成活,每株豆成活苗可以收成大豆2.205 kg.已知每粒豆苗种子成活的概率为(假设种子之间及外部条件一致,发芽相互没有影响).
(1)求恰好有3株成活的概率;
(2)记成活的豆苗株数为ξ,收成为η(kg),求随机变量ξ分布列及η的数学期望Eη.
[解](1)设每株豆子成活的概率为P0,则P0=1-=.所以4株中恰好有3株成活的概率P=C=.
(2)记成活的豆苗株数为ξ,收成为η=2.205ξ,
则ξ的可能取值为0,1,2,3,4,且ξ~B,所以ξ的分布列如下表:
∴Eξ=4×=3.5,
Eη=E(2.205ξ)=2.205·Eξ=7.717 5(kg).
考点2 均值与方差在决策中的应用
利用均值、方差进行决策的2个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大.则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
某投资公司在2019年年初准备将1 000万元投资到“低碳”项目上,现有两个项目供选择:
项目一:新能源汽车.据市场调研,投资到该项目上,到年底可能获利30%,也可能亏损15%,且这两种情况发生的概率分别为和;
项目二:通信设备.据市场调研,投资到该项目上,到年底可能获利50%,可能损失30%,也可能不赔不赚,且这三种情况发生的概率分别为,和.
针对以上两个投资项目,请你为投资公司选择一个合理的项目,并说明理由.
[解] 若按“项目一”投资,设获利为X1万元,则X1的分布列为
X1 | 300 | -150 |
P |
∴E(X1)=300×+(-150)×=200.
若按“项目二”投资,设获利为X2万元,则X2的分布列为
X2 | 500 | -300 | 0 |
P |
∴E(X2)=500×+(-300)×+0×=200.
D(X1)=(300-200)2×+(-150-200)2×=35 000,
D(X2)=(500-200)2×+(-300-200)2×+(0-200)2×=140 000.
∴E(X1)=E(X2),D(X1)<D(X2),
这说明虽然项目一、项目二获利相等,但项目一更稳妥.
综上所述,建议该投资公司选择项目一投资.
随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
[教师备选例题]
某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
[解](1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.从而
P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.
所以X的分布列为
X | 16 | 17 | 18 | 19 | 20 | 21 | 22 |
P | 0.04 | 0.16 | 0.24 | 0.24 | 0.2 | 0.08 | 0.04 |
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040.
当n=20时,E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19.
(2019·合肥二模)某种大型医疗检查机器生产商,对一次性购买2台机器的客户,推出两种超过质保期后两年内的延保维修优惠方案:
方案一:交纳延保金7 000元,在延保的两年内可免费维修2次,超过2次每次收取维修费2 000元;
方案二:交纳延保金10 000元,在延保的两年内可免费维修4次,超过4次每次收取维修费1 000元.
某医院准备一次性购买2台这种机器.现需决策在购买机器时应购买哪种延保方案,为此搜集并整理了50台这种机器超过质保期后延保两年内维修的次数,得下表:
维修次数 | 0 | 1 | 2 | 3 |
台数 | 5 | 10 | 20 | 15 |
以这50台机器维修次数的频率代替1台机器维修次数发生的概率.记X表示这2台机器超过质保期后延保的两年内共需维修的次数.
(1)求X的分布列;
(2)以所需延保金及维修费用的期望值为决策依据,医院选择哪种延保方案更合算?
[解](1)X所有可能的取值为0,1,2,3,4,5,6.
P(X=0)=×=,
P(X=1)=××2=,
P(X=2)=×+××2=,
P(X=3)=××2+××2=,
P(X=4)=×+××2=,
P(X=5)=××2=,
P(X=6)=×=,
∴X的分布列为
X | 0 | 1 | 2 | 3 | 4 | 5 | 6 |
P |
(2)选择延保方案一,所需费用Y1元的分布列为:
Y1 | 7 000 | 9 000 | 11 000 | 13 000 | 15 000 |
P |
EY1=×7 000+×9 000+×11 000+×13 000+×15 000=10 720(元).
选择延保方案二,所需费用Y2元的分布列为:
Y2 | 10 000 | 11 000 | 12 000 |
P |
EY2=×10 000+×11 000+×12 000
=10 420(元).
∵EY1>EY2,∴该医院选择延保方案二较合算.
考点3 正态分布
关于正态总体在某个区间内取值的概率求法
(1)熟记P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值.
(2)充分利用正态曲线的对称性和曲线与x轴之间面积为1.①正态曲线关于直线x=μ对称,从而在关于x=μ对称的区间上概率相等;②P(X<a)=1-P(X≥a),P(X<μ-a)=P(X≥μ+a).
(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 | 10.12 | 9.96 | 9.96 | 10.01 | 9.92 | 9.98 | 10.04 |
10.26 | 9.91 | 10.13 | 10.02 | 9.22 | 10.04 | 10.05 | 9.95 |
经计算得==9.97,s==)≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ<Z<μ+3σ)=0.997 4,0.997 416≈0.959 2,≈0.09.
[解](1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
本题考查正态分布、概率统计问题的综合,是在知识网络的交汇处命制的一道较为新颖的试题.正态分布与统计案例有些知识点是所谓的高考“冷点”,由于考生对这些“冷点”的内容重视不够,复习不全面,一旦这些“冷点”知识出了考题,虽然简单但也做错,甚至根本不会做,因而错误率相当高.本题求解的关键是借助题设提供的数据对问题做出合理的分析,其中方差公式的等价变形是数据处理的关键点.
1.在如图所示的正方形中随机投掷10 000个点,则落入阴影部分(曲线C为正态分布N(-1,1)的密度曲线)的点的个数的估计值为( )
附:若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 6,P(μ-2σ<X<μ+2σ)=0.954 4.
A.1 193 B.1 359
C.2 718 D.3 413
B [对于正态分布N(-1,1),μ=-1,σ=1,正态曲线关于x=-1对称,故题图中阴影部分的面积为×[P(-3<X<1)-P(-2<X<0)]=×[P(μ-2σ<X<μ+2σ)-P(μ-σ<X<μ+σ)]=×(0.954 4-0.682 6)=0.135 9,所以点落入题图中阴影部分的概率P==0.135 9,投入10 000个点,落入阴影部分的个数约为10 000×0.135 9=1 359.]
2.为评估设备M生产某种零件的性能,从设备M生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表:
直径/mm | 58 | 59 | 61 | 62 | 63 | 64 | 65 | 66 |
个数 | 1 | 1 | 3 | 5 | 6 | 19 | 33 | 18 |
直径/mm | 67 | 68 | 69 | 70 | 71 | 73 | 合计 | |
个数 | 4 | 4 | 2 | 1 | 2 | 1 | 100 |
经计算,样本直径的平均值μ=65,标准差σ=2.2,以频率值作为概率的估计值.
(1)为评判一台设备的性能,从该设备加工的零件中任意抽取一件,记其直径为X,并根据以下不等式进行评判(P表示相应事件的概率):①P(μ-σ<X≤μ+σ)≥0.6826;②P(μ-2σ<X≤μ+2σ)≥0.9544;③P(μ-3σ<X≤μ+3σ)≥0.9974.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁,试判断设备M的性能等级.
(2)将直径小于等于μ-2σ或直径大于μ+2σ的零件认为是次品.
①从设备M的生产流水线上随机抽取2件零件,计算其中次品件数Y的数学期望E(Y);
②从样本中随机抽取2件零件,计算其中次品件数Z的数学期望E(Z).
[解](1)P(μ-σ<X≤μ+σ)=P(62.8<X≤67.2)=0.8>0.6826,P(μ-2σ<X≤μ+2σ)=P(60.6<X≤69.4)=0.94<0.9544,
P(μ-3σ<X≤μ+3σ)=P(58.4<X≤71.6)=0.98<0.9974,
因为设备M的数据仅满足一个不等式,故其性能等级为丙.
(2)易知样本中次品共6件,可估计设备M生产零件的次品率为0.06.
①由题意可知Y~B,于是E(Y)=2×=.
②由题意可知Z的分布列为
Z | 0 | 1 | 2 |
P |
故E(Z)=0×+1×+2×=.