还剩12页未读,
继续阅读
所属成套资源:2019高考人教版数学(理科)一轮复习全套学案
成套系列资料,整套一键下载
2019版高考数学(理)一轮精选教师用书人教通用:第10章8第8讲 离散型随机变量的均值与方差、正态分布
展开
第8讲 离散型随机变量的均值与方差、正态分布
1.离散型随机变量X的均值与方差
已知离散型随机变量X的分布列为P(X=xi)=pi(i=1,2,3,…,n).
均值(数学期望)
方差
计算
公式
E(X)=x1p1+x2p2+…+xipi+…+xnpn
D(X)=(xi-E(X))2pi
作用
反映了离散型随机变量取值的平均水平
刻画了随机变量X与其均值E(X)的平均偏离程度
标准差
方差的算术平方根为随机变量X的标准差
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b(a,b为常数).
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两个特殊分布的期望与方差
分布
期望
方差
两点分布
E(X)=p
D(X)=p(1-p)
二项分布
E(X)=np
D(X)=np(1-p)
4.正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
判断正误(正确的打“√”,错误的打“×”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
(5)均值是算术平均数概念的推广,与概率无关.( )
答案:(1)√ (2)√ (3)√ (4)√ (5)×
已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则E(Y)的值为( )
A. B.4
C.-1 D.1
解析:选A.E(X)=-+=-,
E(Y)=E(2X+3)=2E(X)+3=-+3=.
已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=( )
A.0.6 B.0.4
C.0.3 D.0.2
解析:选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
(2017·高考全国卷Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则DX=________.
解析:依题意,X~B(100,0.02),
所以DX=100×0.02×(1-0.02)=1.96.
答案:1.96
一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子,每个盒子放一个小球,球的编号与盒子的编号相同时就放对了,否则就放错了.设放对个数记为ξ,则ξ的期望的值为________.
解析:将四个不同小球放入四个不同盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4,其中P(ξ=0)==,
P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,E(ξ)=0×+1×+2×+4×=1.
答案:1
离散型随机变量的均值与方差
(高频考点)
离散型随机变量的均值与方差是高考命题的热点,多以解答题的形式呈现,多为中档题.高考对离散型随机变量的均值与方差的考查主要有以下两个命题角度:
(1)古典概型背景下的离散型随机变量的均值与方差;
(2)与二项分布有关的均值与方差.
[典例引领]
角度一 古典概型背景下的离散型随机变量的
均值与方差
某小组共10人,利用假期参加义工活动.已知参加义工活动次数为1,2,3的人数分别为3,3,4.现从这10人中随机选出2人作为该组代表参加座谈会.
(1)设A为事件“选出的2人参加义工活动次数之和为4”,求事件A发生的概率;
(2)设X为选出的2人参加义工活动次数之差的绝对值,求随机变量X的分布列和数学期望与方差.
【解】 (1)由已知,有P(A)==.
所以事件A发生的概率为.
(2)随机变量X的所有可能取值为0,1,2.
P(X=0)==,
P(X=1)==,
P(X=2)==.
所以随机变量X的分布列为
X
0
1
2
P
随机变量X的数学期望E(X)=0×+1×+2×=1.
方差D(X)=(0-1)2+(1-1)2+(2-1)2=.
角度二 与二项分布有关的均值与方差
(2018·洛阳市第一次统一考试)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
【解】 (1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,
故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:“一个城市需复检”,则P(A)=1-=,X的所有可能取值为0,1,2,3,
P(X=0)=C·=,P(X=1)=C··=,P(X=2)=C··=,P(X=3)=C·=.
所以X的分布列为
X
0
1
2
3
P
X~B,E(X)=3×=.
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值.
②求ξ取每个值的概率.
③写出ξ的分布列.
④由均值的定义求E(ξ).
⑤由方差的定义求D(ξ).
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.
[提醒] 均值E(X)由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X取值的平均水平.
[通关练习]
1.体育课的投篮测试规则是:一位同学投篮一次,若投中则合格,停止投篮,若投不中,则重新投篮一次,若三次投篮均不中,则不合格,停止投篮.某位同学每次投篮命中的概率为,则该同学投篮次数X的数学期望E(X)=________.
解析:投篮次数X的可能取值为1,2,3,
且P(X=1)=,P(X=2)=×=,
P(X=3)=××=.
随机变量X的分布列为
X
1
2
3
P
所以E(X)=1×+2×+3×=.
答案:
2.(2018·湖北黄冈三月调研)已知6只小白鼠中有1只感染了病毒,需要对6只小白鼠进行病毒DNA化验来确定哪一只受到了感染.下面是两种化验方案:方案甲:逐个化验,直到能确定感染病毒的小白鼠为止.方案乙:将6只小白鼠分为两组,每组三只,将其中一组的三只小白鼠的待化验物质混合在一起化验,若化验结果显示含有病毒DNA,则表明感染病毒的小白鼠在这三只当中,然后逐个化验,直到确定感染病毒的小白鼠为止;若化验结果显示不含病毒DNA,则在另外一组中逐个进行化验.
(1)求执行方案乙化验次数恰好为2次的概率;
(2)若首次化验的化验费为10元,第二次化验的化验费为8元,第三次及以后每次化验的化验费都是6元,求方案甲所需化验费的分布列和期望.
解:(1)执行方案乙化验次数恰好为2次的情况分两种:第一种,先化验一组,结果显示不含病毒DNA,再从另一组中任取一只进行化验,其恰含有病毒DNA,此种情况的概率为×=,第二种,先化验一组,结果显示含病毒DNA,再从中逐个化验,恰好第一只含有病毒,此种情况的概率为×=.
所以执行方案乙化验次数恰好为2次的概率为+=.
(2)设用方案甲化验需要的化验费为η(单位:元),则η的可能取值为10,18,24,30,36.
P(η=10)=,
P(η=18)=×=,
P(η=24)=××=,
P(η=30)=×××=,
P(η=36)=×××=,
则化验费η的分布列为
η
10
18
24
30
36
P
所以E(η)=10×+18×+24×+30×+36×=(元).
均值与方差的实际应用
[典例引领]
(2018·广西三市第一次联考)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每道题正确完成的概率都是,且每道题正确完成与否互不影响.
(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;
(2)请分析比较甲、乙两人谁面试通过的可能性大?
【解】 (1)设甲正确完成面试的题数为ξ,则ξ的可能取值为1,2,3.
P(ξ=1)==;P(ξ=2)==;P(ξ=3)==.
应聘者甲正确完成题数ξ的分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=2.
设乙正确完成面试的题数为η,则η的可能取值为0,1,2,3.
P(η=0)=C=;P(η=1)=C=;
P(η=2)=C=;P(η=3)=C=.
应聘者乙正确完成题数η的分布列为
η
0
1
2
3
P
E(η)=0×+1×+2×+3×=2.(或因为η~B(3,),
所以E(η)=3×=2)
(2)因为D(ξ)=(1-2)2×+(2-2)2×+(3-2)2×=,
D(η)=3××=.
所以D(ξ)<D(η).
综上所述,从做对题数的数学期望考查,两人水平相当;
从做对题数的方差考查,甲较稳定;
从至少完成2道题的概率考查,甲面试通过的可能性大.
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
(2018·长沙市统一模拟考试)张老师开车上班,有路线①与路线②两条路线可供选择.
路线①:沿途有A,B两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若A处遇红灯或黄灯,则导致延误时间2分钟;若B处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟.
路线②:沿途有a,b两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若a处遇红灯或黄灯,则导致延误时间8分钟;若b处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟.
(1)若张老师选择路线①,求他20分钟能到校的概率;
(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由.
解:(1)走路线①,20分钟能到校意味着张老师在A,B两处均遇到绿灯,记该事件发生的概率为P,则P=×=.
(2)设选择路线①的延误时间为随机变量ξ,则ξ的所有可能取值为0,2,3,5.
则P(ξ=0)=×=,P(ξ=2)=×=,
P(ξ=3)=×=,P(ξ=5)=×=.
ξ的数学期望E(ξ)=0×+2×+3×+5×=2.
设选择路线②的延误时间为随机变量η,则η的所有可能取值为0,8,5,13.
则P(η=0)=×=,P(η=8)=×=,
P(η=5)=×=,P(η=13)=×=.
η的数学期望E(η)=0×+8×+5×+13×=5.
因此选择路线①平均所花时间为20+2=22分钟,选择路线②平均所花时间为15+5=20分钟.
所以为使张老师日常上班途中所花时间较少,建议张老师选择路线②.
正态分布
[典例引领]
(1)(2018·长春质检)已知随机变量X服从正态分布N(1,σ2),若P(X>2)=0.15,则P(0≤X≤1)=( )
A.0.85 B.0.70
C.0.35 D.0.15
(2)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)≈68.27%,P(μ-2σ<ξ<μ+2σ)≈95.45%)
A.4.56% B.13.59%
C.27.18% D.31.74%
【解析】 (1)P(0≤X≤1)=P(1≤X≤2)=0.5-P(X>2)=0.35.
(2)由正态分布的概率公式知P(-3<ξ<3)≈0.682 7,P(-6<ξ<6)≈0.954 5,故P(3<ξ<6)===0.135 9=13.59%,故选B.
【答案】 (1)C (2)B
正态分布下的概率计算常见的两类问题
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[通关练习]
1.若X~N(5,1),则P(3<X<4)=( )
A.0.954 5 B.0.477 3
C.0.341 4 D.0.135 9
解析:选D.依题意得
P(3<X<4)=P(3<X<7)-P(4<X<6)=×0.954 5-×0.682 7=0.135 9.
2.(2018·福建省毕业班质量检测)若随机变量X~N(μ,σ2),且P(X>5)=P(X<-1)=0.2,则P(2
解析:因为随机变量X~N(μ,σ2),所以正态曲线关于直线x=μ对称.又P(X>5)=P(X<-1)=0.2,所以μ==2,所以P(22)-P(X>5)=0.5-0.2=0.3.
答案:0.3
随机变量的均值、方差与样本的平均值、方差的关系
随机变量的均值、方差是常数,它们不依赖于样本的抽取,而样本的平均值、方差是随机变量,它们随着样本的不同而变化.
期望与方差的一般计算步骤
(1)理解X的意义,写出X的所有可能取的值;
(2)求X取各个值的概率,写出分布列;
(3)根据分布列,正确运用期望与方差的定义或公式进行计算.
若X服从正态分布,即X~N(μ,σ2),要充分利用正态
曲线的关于直线X=μ对称和曲线与x轴之间的面积为1的性质.
易错防范
(1)E(X)是一个实数,由X的分布列唯一确定.随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X取值的平均状态.
(2)变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位.
(3)方差也是一个常数,它不具有随机性,方差的值一定是非负的.
1.罐中有6个红球,4个白球,从中任取1球,记住颜色后再放回,连续摸取4次,设X为取得红球的次数,则X的方差D(X)的值为( )
A. B.
C. D.
解析:选B.因为是有放回地摸球,所以每次摸球(试验)摸得红球(成功)的概率均为,连续摸4次(做4次试验),X为取得红球(成功)的次数,则X~B,所以D(X)=4××=.
2.某校在高三第一次模拟考试中约有1 000人参加考试,其数学考试成绩近似服从正态分布,即X~N(100,a2)(a>0),试卷满分为150分,统计结果显示数学考试成绩不及格(低于90分)的人数占总人数的,则此次数学考试成绩在100分到110分(包含100分和110分)之间的人数约为( )
A.400 B.500
C.600 D.800
解析:选A.P(X<90)=P(X>110)=,P(90≤X≤110)=1-×2=,P(100≤X≤110)=,1 000×=400.故选A.
3.(2017·高考浙江卷)已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2<,则( )
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2)
B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2)
D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
解析:选A.根据题意得,E(ξi)=pi,D(ξi)=pi(1-pi),i=1,2,因为0
4.已知随机变量ξ的分布列为
ξ
-1
0
1
P
那么ξ的数学期望E(ξ)=________,设η=2ξ+1,则η的数学期望E(η)=________.
解析:由离散型随机变量的期望公式及性质可得,
E(ξ)=-1×+0×+1×=-,
E(η)=E(2ξ+1)=2E(ξ)+1=2×+1=.
答案:-
5.有10张火车票,其中3张是卧铺,其他是硬座,从这10张火车票中任取两张,用ξ表示取到卧铺的张数,则E(ξ)等于________.
解析:ξ服从超几何分布P(ξ=x)=(x=0,1,2).
所以P(ξ=0)===,P(ξ=1)===,P(ξ=2)===.
所以E(ξ)=0×+1×+2×==.
答案:
6.袋中有20个大小相同的球,其中标上0号的有10个,标上n号的有n个(n=1,2,3,4).现从袋中任取一球,X表示所取球的标号.
(1)求X的分布列、期望和方差;
(2)若Y=aX+b,E(Y)=1,D(Y)=11,试求a,b的值.
解:(1)X的分布列为
X
0
1
2
3
4
P
E(X)=0×+1×+2×+3×+4×=1.5.
D(X)=(0-1.5)2×+(1-1.5)2×+(2-1.5)2×+(3-1.5)2×+(4-1.5)2×=2.75.
(2)由D(Y)=a2D(X),得a2×2.75=11,即a=±2.
又E(Y)=aE(X)+b,
所以当a=2时,
由1=2×1.5+b,得b=-2.
当a=-2时,
由1=-2×1.5+b,得b=4.
所以
或
7.(2018·合肥市第一次教学质量检测)某公司在迎新年晚会上举行抽奖活动,有甲、乙两个抽奖方案供员工选择.
方案甲:员工最多有两次抽奖机会,每次抽奖的中奖率均为.第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:若抛出硬币,反面朝上,员工则获得500元奖金,不进行第二次抽奖;若正面朝上,员工则须进行第二次抽奖,且在第二次抽奖中,若中奖,则获得奖金1 000元;若未中奖,则所获得的奖金为0元.
方案乙:员工连续三次抽奖,每次中奖率均为,每次中奖均可获得奖金400元.
(1)求某员工选择方案甲进行抽奖所获奖金X(元)的分布列;
(2)试比较某员工选择方案乙与选择方案甲进行抽奖,哪个方案更划算?
解:(1)X的可能取值为0,500,1 000.
P(X=0)=+××=,
P(X=500)=×=,
P(X=1 000)=××=,
所以某员工选择方案甲进行抽奖所获奖金X(元)的分布列为
X
0
500
1 000
P
(2)由(1)可知,选择方案甲进行抽奖所获奖金X的期望E(X)=500×+1 000×=520,
若选择方案乙进行抽奖,中奖次数ξ~B(3,),
则E(ξ)=3×=,
抽奖所获奖金X的期望E(X)=E(400ξ)=400E(ξ)=480,
故选择方案甲较划算.
1.为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:
①顾客所获的奖励额为60元的概率;
②顾客所获的奖励额的分布列及数学期望.
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
解:(1)设顾客所获的奖励额为X.
①依题意,得P(X=60)==,
即顾客所获的奖励额为60元的概率为.
②依题意,得X的所有可能取值为20,60.
P(X=20)==,P(X=60)=,
即X的分布列为
X
20
60
P
所以顾客所获的奖励额的数学期望为E(X)=20×+60×=40(元).
(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.
对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.
以下是对两个方案的分析:
对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为
X1
20
60
100
P
X1的期望为E(X1)=20×+60×+100×=60,
X1的方差为D(X1)=(20-60)2×+(60-60)2×+(100-60)2×=.
对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为
X2
40
60
80
P
X2的期望为E(X2)=40×+60×+80×=60,
X2的方差为D(X2)=(40-60)2×+(60-60)2×+(80-60)2×=.
由于两种方案的奖励额的期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.
2.(2017·高考全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)试说明上述监控生产过程方法的合理性;
(ii)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,
其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程
进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
解:(1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,
故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为EX=16×0.002 6=0.041 6.
(2)(i)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.
因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ii)由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
1.离散型随机变量X的均值与方差
已知离散型随机变量X的分布列为P(X=xi)=pi(i=1,2,3,…,n).
均值(数学期望)
方差
计算
公式
E(X)=x1p1+x2p2+…+xipi+…+xnpn
D(X)=(xi-E(X))2pi
作用
反映了离散型随机变量取值的平均水平
刻画了随机变量X与其均值E(X)的平均偏离程度
标准差
方差的算术平方根为随机变量X的标准差
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b(a,b为常数).
(2)D(aX+b)=a2D(X)(a,b为常数).
3.两个特殊分布的期望与方差
分布
期望
方差
两点分布
E(X)=p
D(X)=p(1-p)
二项分布
E(X)=np
D(X)=np(1-p)
4.正态曲线的特点
(1)曲线位于x轴上方,与x轴不相交;
(2)曲线是单峰的,它关于直线x=μ对称;
(3)曲线在x=μ处达到峰值;
(4)曲线与x轴之间的面积为1;
(5)当σ一定时,曲线随着μ的变化而沿x轴平移;
(6)当μ一定时,曲线的形状由σ确定.σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.
判断正误(正确的打“√”,错误的打“×”)
(1)随机变量的均值是常数,样本的平均数是随机变量,它不确定.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离变量的平均程度越小.( )
(3)正态分布中的参数μ和σ完全确定了正态分布,参数μ是正态分布的均值,σ是正态分布的标准差.( )
(4)一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.( )
(5)均值是算术平均数概念的推广,与概率无关.( )
答案:(1)√ (2)√ (3)√ (4)√ (5)×
已知X的分布列为
X
-1
0
1
P
设Y=2X+3,则E(Y)的值为( )
A. B.4
C.-1 D.1
解析:选A.E(X)=-+=-,
E(Y)=E(2X+3)=2E(X)+3=-+3=.
已知随机变量ξ服从正态分布N(2,σ2),且P(ξ<4)=0.8,则P(0<ξ<4)=( )
A.0.6 B.0.4
C.0.3 D.0.2
解析:选A.由P(ξ<4)=0.8,得P(ξ≥4)=0.2.
又正态曲线关于x=2对称,则P(ξ≤0)=P(ξ≥4)=0.2,所以P(0<ξ<4)=1-P(ξ≤0)-P(ξ≥4)=0.6.
(2017·高考全国卷Ⅱ)一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则DX=________.
解析:依题意,X~B(100,0.02),
所以DX=100×0.02×(1-0.02)=1.96.
答案:1.96
一个人将编号为1,2,3,4的四个小球随机放入编号为1,2,3,4的四个盒子,每个盒子放一个小球,球的编号与盒子的编号相同时就放对了,否则就放错了.设放对个数记为ξ,则ξ的期望的值为________.
解析:将四个不同小球放入四个不同盒子,每个盒子放一个小球,共有A种不同放法,放对的个数ξ可取的值有0,1,2,4,其中P(ξ=0)==,
P(ξ=1)==,P(ξ=2)==,P(ξ=4)==,E(ξ)=0×+1×+2×+4×=1.
答案:1
离散型随机变量的均值与方差
(高频考点)
离散型随机变量的均值与方差是高考命题的热点,多以解答题的形式呈现,多为中档题.高考对离散型随机变量的均值与方差的考查主要有以下两个命题角度:
(1)古典概型背景下的离散型随机变量的均值与方差;
(2)与二项分布有关的均值与方差.
[典例引领]
角度一 古典概型背景下的离散型随机变量的
均值与方差
某小组共10人,利用假期参加义工活动.已知参加义工活动次数为1,2,3的人数分别为3,3,4.现从这10人中随机选出2人作为该组代表参加座谈会.
(1)设A为事件“选出的2人参加义工活动次数之和为4”,求事件A发生的概率;
(2)设X为选出的2人参加义工活动次数之差的绝对值,求随机变量X的分布列和数学期望与方差.
【解】 (1)由已知,有P(A)==.
所以事件A发生的概率为.
(2)随机变量X的所有可能取值为0,1,2.
P(X=0)==,
P(X=1)==,
P(X=2)==.
所以随机变量X的分布列为
X
0
1
2
P
随机变量X的数学期望E(X)=0×+1×+2×=1.
方差D(X)=(0-1)2+(1-1)2+(2-1)2=.
角度二 与二项分布有关的均值与方差
(2018·洛阳市第一次统一考试)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
【解】 (1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,
故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:“一个城市需复检”,则P(A)=1-=,X的所有可能取值为0,1,2,3,
P(X=0)=C·=,P(X=1)=C··=,P(X=2)=C··=,P(X=3)=C·=.
所以X的分布列为
X
0
1
2
3
P
X~B,E(X)=3×=.
(1)求离散型随机变量ξ的均值与方差的步骤
①理解ξ的意义,写出ξ可能的全部取值.
②求ξ取每个值的概率.
③写出ξ的分布列.
④由均值的定义求E(ξ).
⑤由方差的定义求D(ξ).
(2)二项分布的期望与方差
如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.
[提醒] 均值E(X)由X的分布列唯一确定,即X作为随机变量是可变的,而E(X)是不变的,它描述X取值的平均水平.
[通关练习]
1.体育课的投篮测试规则是:一位同学投篮一次,若投中则合格,停止投篮,若投不中,则重新投篮一次,若三次投篮均不中,则不合格,停止投篮.某位同学每次投篮命中的概率为,则该同学投篮次数X的数学期望E(X)=________.
解析:投篮次数X的可能取值为1,2,3,
且P(X=1)=,P(X=2)=×=,
P(X=3)=××=.
随机变量X的分布列为
X
1
2
3
P
所以E(X)=1×+2×+3×=.
答案:
2.(2018·湖北黄冈三月调研)已知6只小白鼠中有1只感染了病毒,需要对6只小白鼠进行病毒DNA化验来确定哪一只受到了感染.下面是两种化验方案:方案甲:逐个化验,直到能确定感染病毒的小白鼠为止.方案乙:将6只小白鼠分为两组,每组三只,将其中一组的三只小白鼠的待化验物质混合在一起化验,若化验结果显示含有病毒DNA,则表明感染病毒的小白鼠在这三只当中,然后逐个化验,直到确定感染病毒的小白鼠为止;若化验结果显示不含病毒DNA,则在另外一组中逐个进行化验.
(1)求执行方案乙化验次数恰好为2次的概率;
(2)若首次化验的化验费为10元,第二次化验的化验费为8元,第三次及以后每次化验的化验费都是6元,求方案甲所需化验费的分布列和期望.
解:(1)执行方案乙化验次数恰好为2次的情况分两种:第一种,先化验一组,结果显示不含病毒DNA,再从另一组中任取一只进行化验,其恰含有病毒DNA,此种情况的概率为×=,第二种,先化验一组,结果显示含病毒DNA,再从中逐个化验,恰好第一只含有病毒,此种情况的概率为×=.
所以执行方案乙化验次数恰好为2次的概率为+=.
(2)设用方案甲化验需要的化验费为η(单位:元),则η的可能取值为10,18,24,30,36.
P(η=10)=,
P(η=18)=×=,
P(η=24)=××=,
P(η=30)=×××=,
P(η=36)=×××=,
则化验费η的分布列为
η
10
18
24
30
36
P
所以E(η)=10×+18×+24×+30×+36×=(元).
均值与方差的实际应用
[典例引领]
(2018·广西三市第一次联考)某公司为招聘新员工设计了一个面试方案:应聘者从6道备选题中一次性随机抽取3道题,按照题目要求独立完成.规定:至少正确完成其中2道题的便可通过.已知6道备选题中应聘者甲有4道题能正确完成,2道题不能完成;应聘者乙每道题正确完成的概率都是,且每道题正确完成与否互不影响.
(1)分别求甲、乙两人正确完成面试题数的分布列及数学期望;
(2)请分析比较甲、乙两人谁面试通过的可能性大?
【解】 (1)设甲正确完成面试的题数为ξ,则ξ的可能取值为1,2,3.
P(ξ=1)==;P(ξ=2)==;P(ξ=3)==.
应聘者甲正确完成题数ξ的分布列为
ξ
1
2
3
P
E(ξ)=1×+2×+3×=2.
设乙正确完成面试的题数为η,则η的可能取值为0,1,2,3.
P(η=0)=C=;P(η=1)=C=;
P(η=2)=C=;P(η=3)=C=.
应聘者乙正确完成题数η的分布列为
η
0
1
2
3
P
E(η)=0×+1×+2×+3×=2.(或因为η~B(3,),
所以E(η)=3×=2)
(2)因为D(ξ)=(1-2)2×+(2-2)2×+(3-2)2×=,
D(η)=3××=.
所以D(ξ)<D(η).
综上所述,从做对题数的数学期望考查,两人水平相当;
从做对题数的方差考查,甲较稳定;
从至少完成2道题的概率考查,甲面试通过的可能性大.
均值与方差的实际应用
(1)D(X)表示随机变量X对E(X)的平均偏离程度,D(X)越大表明平均偏离程度越大,说明X的取值越分散;反之,D(X)越小,X的取值越集中在E(X)附近,统计中常用来描述X的分散程度.
(2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量取值偏离于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要的理论依据,一般先比较均值,若均值相同,再用方差来决定.
(2018·长沙市统一模拟考试)张老师开车上班,有路线①与路线②两条路线可供选择.
路线①:沿途有A,B两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若A处遇红灯或黄灯,则导致延误时间2分钟;若B处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟.
路线②:沿途有a,b两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若a处遇红灯或黄灯,则导致延误时间8分钟;若b处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟.
(1)若张老师选择路线①,求他20分钟能到校的概率;
(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由.
解:(1)走路线①,20分钟能到校意味着张老师在A,B两处均遇到绿灯,记该事件发生的概率为P,则P=×=.
(2)设选择路线①的延误时间为随机变量ξ,则ξ的所有可能取值为0,2,3,5.
则P(ξ=0)=×=,P(ξ=2)=×=,
P(ξ=3)=×=,P(ξ=5)=×=.
ξ的数学期望E(ξ)=0×+2×+3×+5×=2.
设选择路线②的延误时间为随机变量η,则η的所有可能取值为0,8,5,13.
则P(η=0)=×=,P(η=8)=×=,
P(η=5)=×=,P(η=13)=×=.
η的数学期望E(η)=0×+8×+5×+13×=5.
因此选择路线①平均所花时间为20+2=22分钟,选择路线②平均所花时间为15+5=20分钟.
所以为使张老师日常上班途中所花时间较少,建议张老师选择路线②.
正态分布
[典例引领]
(1)(2018·长春质检)已知随机变量X服从正态分布N(1,σ2),若P(X>2)=0.15,则P(0≤X≤1)=( )
A.0.85 B.0.70
C.0.35 D.0.15
(2)已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为( )
(附:若随机变量ξ服从正态分布N(μ,σ2),则P(μ-σ<ξ<μ+σ)≈68.27%,P(μ-2σ<ξ<μ+2σ)≈95.45%)
A.4.56% B.13.59%
C.27.18% D.31.74%
【解析】 (1)P(0≤X≤1)=P(1≤X≤2)=0.5-P(X>2)=0.35.
(2)由正态分布的概率公式知P(-3<ξ<3)≈0.682 7,P(-6<ξ<6)≈0.954 5,故P(3<ξ<6)===0.135 9=13.59%,故选B.
【答案】 (1)C (2)B
正态分布下的概率计算常见的两类问题
(1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x=μ对称,及曲线与x轴之间的面积为1.
(2)利用3σ原则求概率问题时,要注意把给出的区间或范围与正态变量的μ,σ进行对比联系,确定它们属于(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)中的哪一个.
[通关练习]
1.若X~N(5,1),则P(3<X<4)=( )
A.0.954 5 B.0.477 3
C.0.341 4 D.0.135 9
解析:选D.依题意得
P(3<X<4)=P(3<X<7)-P(4<X<6)=×0.954 5-×0.682 7=0.135 9.
2.(2018·福建省毕业班质量检测)若随机变量X~N(μ,σ2),且P(X>5)=P(X<-1)=0.2,则P(2
答案:0.3
随机变量的均值、方差与样本的平均值、方差的关系
随机变量的均值、方差是常数,它们不依赖于样本的抽取,而样本的平均值、方差是随机变量,它们随着样本的不同而变化.
期望与方差的一般计算步骤
(1)理解X的意义,写出X的所有可能取的值;
(2)求X取各个值的概率,写出分布列;
(3)根据分布列,正确运用期望与方差的定义或公式进行计算.
若X服从正态分布,即X~N(μ,σ2),要充分利用正态
曲线的关于直线X=μ对称和曲线与x轴之间的面积为1的性质.
易错防范
(1)E(X)是一个实数,由X的分布列唯一确定.随机变量X是可变的,可取不同的值,而E(X)是不变的,它描述X取值的平均状态.
(2)变量的方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,其中标准差与随机变量本身具有相同的单位.
(3)方差也是一个常数,它不具有随机性,方差的值一定是非负的.
1.罐中有6个红球,4个白球,从中任取1球,记住颜色后再放回,连续摸取4次,设X为取得红球的次数,则X的方差D(X)的值为( )
A. B.
C. D.
解析:选B.因为是有放回地摸球,所以每次摸球(试验)摸得红球(成功)的概率均为,连续摸4次(做4次试验),X为取得红球(成功)的次数,则X~B,所以D(X)=4××=.
2.某校在高三第一次模拟考试中约有1 000人参加考试,其数学考试成绩近似服从正态分布,即X~N(100,a2)(a>0),试卷满分为150分,统计结果显示数学考试成绩不及格(低于90分)的人数占总人数的,则此次数学考试成绩在100分到110分(包含100分和110分)之间的人数约为( )
A.400 B.500
C.600 D.800
解析:选A.P(X<90)=P(X>110)=,P(90≤X≤110)=1-×2=,P(100≤X≤110)=,1 000×=400.故选A.
3.(2017·高考浙江卷)已知随机变量ξi满足P(ξi=1)=pi,P(ξi=0)=1-pi,i=1,2.若0<p1<p2<,则( )
A.E(ξ1)<E(ξ2),D(ξ1)<D(ξ2)
B.E(ξ1)<E(ξ2),D(ξ1)>D(ξ2)
C.E(ξ1)>E(ξ2),D(ξ1)<D(ξ2)
D.E(ξ1)>E(ξ2),D(ξ1)>D(ξ2)
解析:选A.根据题意得,E(ξi)=pi,D(ξi)=pi(1-pi),i=1,2,因为0
ξ
-1
0
1
P
那么ξ的数学期望E(ξ)=________,设η=2ξ+1,则η的数学期望E(η)=________.
解析:由离散型随机变量的期望公式及性质可得,
E(ξ)=-1×+0×+1×=-,
E(η)=E(2ξ+1)=2E(ξ)+1=2×+1=.
答案:-
5.有10张火车票,其中3张是卧铺,其他是硬座,从这10张火车票中任取两张,用ξ表示取到卧铺的张数,则E(ξ)等于________.
解析:ξ服从超几何分布P(ξ=x)=(x=0,1,2).
所以P(ξ=0)===,P(ξ=1)===,P(ξ=2)===.
所以E(ξ)=0×+1×+2×==.
答案:
6.袋中有20个大小相同的球,其中标上0号的有10个,标上n号的有n个(n=1,2,3,4).现从袋中任取一球,X表示所取球的标号.
(1)求X的分布列、期望和方差;
(2)若Y=aX+b,E(Y)=1,D(Y)=11,试求a,b的值.
解:(1)X的分布列为
X
0
1
2
3
4
P
E(X)=0×+1×+2×+3×+4×=1.5.
D(X)=(0-1.5)2×+(1-1.5)2×+(2-1.5)2×+(3-1.5)2×+(4-1.5)2×=2.75.
(2)由D(Y)=a2D(X),得a2×2.75=11,即a=±2.
又E(Y)=aE(X)+b,
所以当a=2时,
由1=2×1.5+b,得b=-2.
当a=-2时,
由1=-2×1.5+b,得b=4.
所以
或
7.(2018·合肥市第一次教学质量检测)某公司在迎新年晚会上举行抽奖活动,有甲、乙两个抽奖方案供员工选择.
方案甲:员工最多有两次抽奖机会,每次抽奖的中奖率均为.第一次抽奖,若未中奖,则抽奖结束.若中奖,则通过抛一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:若抛出硬币,反面朝上,员工则获得500元奖金,不进行第二次抽奖;若正面朝上,员工则须进行第二次抽奖,且在第二次抽奖中,若中奖,则获得奖金1 000元;若未中奖,则所获得的奖金为0元.
方案乙:员工连续三次抽奖,每次中奖率均为,每次中奖均可获得奖金400元.
(1)求某员工选择方案甲进行抽奖所获奖金X(元)的分布列;
(2)试比较某员工选择方案乙与选择方案甲进行抽奖,哪个方案更划算?
解:(1)X的可能取值为0,500,1 000.
P(X=0)=+××=,
P(X=500)=×=,
P(X=1 000)=××=,
所以某员工选择方案甲进行抽奖所获奖金X(元)的分布列为
X
0
500
1 000
P
(2)由(1)可知,选择方案甲进行抽奖所获奖金X的期望E(X)=500×+1 000×=520,
若选择方案乙进行抽奖,中奖次数ξ~B(3,),
则E(ξ)=3×=,
抽奖所获奖金X的期望E(X)=E(400ξ)=400E(ξ)=480,
故选择方案甲较划算.
1.为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:
①顾客所获的奖励额为60元的概率;
②顾客所获的奖励额的分布列及数学期望.
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
解:(1)设顾客所获的奖励额为X.
①依题意,得P(X=60)==,
即顾客所获的奖励额为60元的概率为.
②依题意,得X的所有可能取值为20,60.
P(X=20)==,P(X=60)=,
即X的分布列为
X
20
60
P
所以顾客所获的奖励额的数学期望为E(X)=20×+60×=40(元).
(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.
对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.
以下是对两个方案的分析:
对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为
X1
20
60
100
P
X1的期望为E(X1)=20×+60×+100×=60,
X1的方差为D(X1)=(20-60)2×+(60-60)2×+(100-60)2×=.
对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为
X2
40
60
80
P
X2的期望为E(X2)=40×+60×+80×=60,
X2的方差为D(X2)=(40-60)2×+(60-60)2×+(80-60)2×=.
由于两种方案的奖励额的期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.
2.(2017·高考全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(i)试说明上述监控生产过程方法的合理性;
(ii)下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04
10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95
经计算得=i=9.97,s==≈0.212,
其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程
进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望为EX=16×0.002 6=0.041 6.
(2)(i)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小.
因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ii)由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为(16×9.97-9.22)=10.02,
因此μ的估计值为10.02.
=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
相关资料
更多