还剩14页未读,
继续阅读
2020届数学(理)二轮复习第2部分专题3第1讲 概率、随机变量及其分布学案
展开
第1讲 概率、随机变量及其分布
[做小题——激活思维]
1.若随机变量X的分布列如表所示,E(X)=1.6,则a-b=( )
X
0
1
2
3
P
0.1
a
b
0.1
A.0.2 B.-0.2
C.0.8 D.-0.8
B [由0.1+a+b+0.1=1,得a+b=0.8,又由E(X)=0×0.1+1×a+2×b+3×0.1=1.6,得a+2b=1.3,解得a=0.3,b=0.5,
则a-b=-0.2.]
2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0.5,两个路口连续遇到红灯的概率为0.4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )
A.0.6 B.0.7
C.0.8 D.0.9
C [记“第一个路口遇到红灯”为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0.4,则P(B|A)==0.8,故选C.]
3.两个实习生每人加工一个零件,加工为一等品的概率分别为和,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )
A. B.
C. D.
B [设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=,P(B)=,所以这两个零件中恰有一个一等品的概率为P(A)+P(B)=P(A)P()+P()P(B)=×+×=.]
4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=,则P(Y≥1)=( )
A. B.
C. D.1
C [∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C(1-p)2=,解得p=,
∴P(Y≥1)=1-P(Y=0)=1-C(1-p)4=1-=,故选C.]
5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.
[因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B,
∴D(X)=4××=.]
6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.
(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 7,P(μ-2σ<X<μ+2σ)=0.954 5)
0.135 9 [依题意设X~N(0,32),其中μ=0,σ=3,
∴P(-3<X<3)=0.682 7,P(-6<X<6)=0.954 5.
∴P(3<X<6)=[P(-6<X<6)-P(-3<X<3)]=×(0.954 5-0.682 7)=0.135 9.]
[扣要点——查缺补漏]
1.离散型随机变量的分布列的两个性质
(1)pi≥0 (i=1,2,…,n);
(2)p1+p2+…+pn=1.如T1.
2.变量ξ的数学期望、方差
(1)E(ξ)=x1p1+x2p2+…+xnpn.如T1.
(2)D(ξ)=[x1-E(ξ)]2·p1+[x2-E(ξ)]2·p2+…+[xn-E(ξ)]2·pn,标准差为.
3.期望、方差的性质
(1)E(aξ+b)=aE(ξ)+b,D(aξ+b)=a2D(ξ);
(2)若ξ~B(n,p),则E(ξ)=np ,D(ξ)=np(1-p).
(3)X服从两点分布,则E(ξ)=p,D(ξ)=p(1-p).
4.常见概率的求法
(1)条件概率:在A发生的条件下B发生的概率P(B|A)=,如T2.
(2)相互独立事件同时发生的概率:P(AB)=P(A)P(B),如T3.
(3)在n次独立重复试验中事件A恰好发生k次的概率:P(ξ=k)=Cpkqn-k,(k=0,1,2,…,n,q=1-p),如T4.
(4)超几何分布:在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.
(5)正态分布:若X~N(μ,σ2),则正态曲线关于直线x=μ对称,常借助图象的对称性求随机变量落在某一范围内的概率,如T6.
[教师授课资源]
[备考指导]
新考纲把概率与统计作为数学思想提出来,必会重点考查,近几年的概率与统计高考题新颖灵活,并且作为压轴题出现,在备考中特别重视.
[命题方向]
①数据统计分析,通过观察分析计算数据,计算(,s2,E(X)等)来进行方案的选择,同时与概率、正态分布结合,来解决实际问题(如控制生产线).
②以频率分布直方图为载体,研究平均数,让近似等于正态分布N(μ,σ2)中的μ,进而考查3σ区间与二项分布结合,研究期望与方差.
③以统计案例为载体,考查X2,r的同时,考查非线性回归问题,通过换元,取对数等手段,把非线性回归问题转化为线性回归问题,其中要通过数据的计算及灵活变通.
④以新颖背景为载体,考查分类讨论,要进行多种情况下概率与统计的特征数的计算进行数据比较分析,进行方案的选择.
⑤开放型题目,方案选择理由不唯一,会有多种角度回答,这种题型符合新考纲要求,同时增大阅读量与数字字母化,考查阅读转化能力.,本部分建议重点归类研究近几年全国卷高考题,研究考法与题型,进行总结归纳反思,从而开阔思路和视野,以不变应万变,提升分析问题能力.
条件概率、相互独立事件及二项分布(5年5考)
[高考解读] 高考对该点的考查可以单独考查也可以与概率统计综合考查,注重双基,属基础性题目.解答的关键是分清事件间的关系,套用相应概率公式求解.预测2020年命题风格不变.
1.(2018·全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=( )
A.0.7 B.0.6
C.0.4 D.0.3
B [由题意知,该群体的10位成员使用移动支付的人数X概率分布符合二项分布,所以D(X)=10p(1-p)=2.4,所以p=0.6或p=0.4.由P(X=4)<P(X=6),得Cp4(1-p)6<Cp6(1-p)4,即(1-p)2<p2,所以p>0.5,所以p=0.6.]
2.(2019·全国卷Ⅱ)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
[解](1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.
(2)X=4且甲获胜,就是某局双方10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.
[教师备选题]
1.(2015·全国卷Ⅰ)投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )
A.0.648 B.0.432
C.0.36 D.0.312
A [3次投篮投中2次的概率为P(k=2)=C×0.62×(1-0.6),投中3次的概率为P(k=3)=0.63,所以通过测试的概率为P(k=2)+P(k=3)=C×0.62×(1-0.6)+0.63=0.648.故选A.]
2.(2014·全国卷Ⅱ)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( )
A.0.8 B.0.75
C.0.6 D.0.45
A [根据条件概率公式,直接代入,可求得随后一天的空气质量为优良的概率.
已知连续两天为优良的概率是0.6,那么在前一天空气质量为优良的前提下,要求随后一天的空气质量为优良的概率,可根据条件概率公式,得P==0.8.]
3.(2016·全国卷Ⅱ)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保 费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概 率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
[解](1)设A表示事件“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故
P(A)=0.2+0.2+0.1+0.05=0.55.
(2)设B表示事件“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.1+0.05=0.15.
又P(AB)=P(B),
故P(B|A)====.
因此所求概率为.
(3)记续保人本年度的保费为X元,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
求相互独立事件和独立重复试验的概率的方法
(1)直接法:利用相互独立事件的概率乘法公式直接求解.
(2)间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
提醒:解决条件概率的关键是明确“既定条件”,即在“谁发生的条件下,求谁的概率”.
1.(条件概率)(2019·长沙模拟)已知一种元件的使用寿命超过1年的概率为0.8,超过2年的概率为0.6,若一个这种元件使用到1年时还未损坏,则这个元件使用寿命超过2年的概率为( )
A.0.75 B.0.6
C.0.52 D.0.48
A [设一个这种元件使用到1年时还未损坏为事件A,使用到2年时还未损坏为事件B,则由题意知P(AB)=0.6,P(A)=0.8,则这个元件使用寿命超过2年的概率为P(B|A)===0.75,故选A.]
2.(二项分布)某机械研究所对新研发的某批次机械元件进行寿命追踪调查,随机抽查的200个机械元件情况如下:
使用时间/天
10~20
21~30
31~40
41~50
51~60
个数
10
40
80
50
20
若将频率视作概率,现从该批次机械元件中随机抽取3个,则至少有2个元件的使用寿命在30天以上的概率为( )
A. B.
C. D.
D [由表可知元件使用寿命在30天以上的频率为=,则所求概率为C·×+C·=.]
3.(相互独立事件的概率)甲、乙、丙3位大学生同时应聘某个用人单位的职位,3人能被选中的概率分别为,,,且各自能否被选中互不影响.则3人中至少有1人被选中的概率为________.
[3人都未被选中的概率为P=××=,故3人中至少有1人被选中的概率为1-=.]
随机变量的分布列、均值、方差(5年6考)
[高考解读] 高考对该点的考查常以生产、生活实际为背景,考查考生从题干中提取信息建立数学模型,并应用期望(或方差)对实际问题作出决策的能力.预测2020年会加强对该点的考查.
(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0;
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
切入点:借助独立重复试验的概率公式建立概率函数f(p),并用导数求f(p)的最大值点P0.
[解](1)20件产品中恰有2件不合格品的概率为f(p)=Cp2(1-p)18.
因此f′(p)=C[2p(1-p)18-18p2(1-p)17]=2Cp(1-p)17(1-10p).
令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.
所以E(X)=E(40+25Y)=40+25E(Y)=490.
②如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于E(X)>400,故应该对余下的产品作检验.
[教师备选题]
(2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
[解](1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
从而P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,
故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040;
当n=20时,
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19.
解决分布列、期望、方差问题的3关
(1)判断关:即依据题意判断随机变量的取值及判断所求分布列的类型.
(2)概率关:即依据事件间的相互关系,结合相应的概率公式求出每个随机变量取值的概率.
(3)决策关:即借助分布列,计算随机变量的数学期望,并结合实际问题作出合理决策.
1.(以统计图表为背景)随着移动互联网的发展,与餐饮美食相关的手机APP软件层出不穷.为调查某款订餐软件的商家的服务情况,统计了10次订餐“送达时间”(时间:分钟),得到茎叶图如下:
(1)请计算“送达时间”的平均数与方差;
(2)根据茎叶图,求A,B,C,D的值;
送达时间
35分钟以内(包括35分钟)
超过35分钟
频数
A
B
频率
C
D
(3)在(2)的情况下,以频率代替概率,现有3个客户应用此软件订餐,求在35分钟以内(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.
[解](1)“送达时间”的平均数为
=35(分钟),
方差为
=20.6.
(2)A=6,B=4,C=0.6,D=0.4.
(3)由已知,人数X的可能取值为0,1,2,3,
P(X=0)=C×0.60×0.43=0.064;
P(X=1)=C×0.61×0.42=0.288;
P(X=2)=C×0.62×0.41=0.432;
P(X=3)=C×0.63×0.40=0.216.
所以随机变量X的分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
X服从二项分布B(3,0.6),
E(X)=3×0.6=1.8.
2.(函数与概率统计的交汇)某医院为筛查某种疾病,需要检验血液是否为阳性,现有n(n∈N*)份血液样本,有以下两种检验方式:(1)逐份检验,则需要检验n次;(2)混合检验,将其中k(k∈N*且k≥2)份血液样本分别取样混合在一起检验.若检验结果为阴性,这k份血液全为阴性,因而这k份血液样本只要检验一次就够了,如果检验结果为阳性,为了明确这k份血液究竟哪几份为阳性,就要对这k份再逐份检验,此时这k份血液的检验次数总共为k+1次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为p(0<p<1).
(1)假设有5份血液样本,其中只有2份样本为阳性,若采用逐份检验方式,求恰好经过4次检验就能把阳性样本全部检验出来的概率;
(2)现取其中k(k∈N*且k≥2)份血液样本,记采用逐份检验方式,样本需要检验的总次数为ξ1,采用混合检验方式,样本需要检验的总次数为ξ2.
①试运用概率统计的知识,若Eξ1=Eξ2,试求p关于k的函数关系式p=f(k);
②若p=1-,采用混合检验方式可以使得样本需要检验的总次数的期望值比逐份检验的总次数期望值更少,求k的最大值.
参考数据:ln 2≈0.693 1,ln 3≈1.098 6,ln 4≈1.386 3,ln 5≈1.609 4,ln 6≈1.791 8.
[解](1)p==.
∴恰好经过4次检验就能把阳性样本全部检验出来的概率为.
(2)①由已知得Eξ1=k,ξ2的所有可能取值为1,k+1.
∴P(ξ2=1)=(1-p)k,P(ξ2=k+1)=1-(1-p)k,
∴Eξ2=(1-p)k+(k+1)[1-(1-p)k]=k+1-k(1-p)k.
若Eξ1=Eξ2,则k=k+1-k(1-p)k,∴k(1-p)k=1,(1-p)k=,∴1-p=,∴p=1-.
∴p关于k的函数关系式p=1-(k∈N*且k≥2).
②由题意可知Eξ2<Eξ1,得<(1-p)k,
∵p=1-,∴<,∴ln k>k,
设f(x)=ln x-x(x>0) ,
则f′(x)=,
∴当x>3时,f′(x)<0,即f(x)在(3,+∞)上单调递减,
又ln 4≈1.386 3, ≈1.333 3,
∴ln 4>,
∵ln 5≈1.609 4,≈1.666 7,∴ln 5<.
∴k的最大值为4.
样本的均值、方差与正态分布的综合(5年2考)
[高考解读] 正态分布可与二项分布、控制生产线结合,很受命题者的青睐,主要考查3σ区间与对称性;考查正态分布的题目,要重视题后数据的利用,题后数据作用:①提供方向(计算)与目标;②切勿掉入题后数据误导的陷阱.
(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98
10.04 10.26 9.91 10.13 10.02 9.22 10.04
10.05 9.95
经计算得
=,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
[解](1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.997 4,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.002 6,故X~B(16,0.002 6).
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
[教师备选题]
(2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8
②某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求E(X).
附:≈12.2.
若Z~N(μ,σ2),则P(μ-σ
[解](1)抽取产品的质量指标值的样本平均数和样本方差s2分别为
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)①由(1)知,Z~N(200,150),从而P(187.8
②由①知,一件产品的质量指标值位于区间(187.8,212.2)的概率为0.682 6,依题意知X~B(100,0.682 6),所以E(X)=100×0.682 6=68.26.
解决正态分布问题有4个关键点
(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性求指定范围内的概率值,由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率;(4)曲线与x轴之间面积为1.
(与频率分布直方图交汇)某质检部门从某烤鳗鱼有限公司生产的某批次的烤鳗鱼中随机抽取200箱,检测这些产品的某项质量指标值(记为Z),由检测结果得到如下图所示的频率分布直方图.
(1)质检部门规定,当Z≥95时,产品为合格品;当Z<95时,产品为不合格品.该公司每生产一箱这种产品,若是合格品,则盈利90元;若是不合格品,则亏损30元.记Y为生产一箱这种产品的利润,求Y的分布列和E(Y);
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用所在区间的中点值作代表).
①利用该正态分布,求P(75.6
②某客户从该公司购买了500箱这种产品,记X表示这500箱产品中该质量指标值位于(75.6,124.4)上的产品箱数,利用①的结果,求X的期望与方差.
附:≈12.2,
若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 7,P(μ-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.
[解](1)由频率估计概率,产品为合格品的概率为(0.033+0.024+0.008+0.002)×10=0.67,为不合格品的概率为1-0.67=0.33.
所以随机变量Y的分布列为
Y
90
-30
P
0.67
0.33
所以E(Y)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的质量指标值的样本平均数和样本方差s2分别为=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150,
所以Z~N(100,150).
①因为Z~N(100,150),
所以P(75.6<Z≤124.4)=P(100-12.2×2<Z≤100+12.2×2)≈0.954 5.
②由①可知,一箱产品中该质量指标值位于(75.6,124.4)上的概率为0.954 5,
依题意知X~B(500,0.954 5),
所以E(X)=500×0.954 5=477.25,
D(X)=500×0.954 5×(1-0.954 5)≈21.7.
第1讲 概率、随机变量及其分布
[做小题——激活思维]
1.若随机变量X的分布列如表所示,E(X)=1.6,则a-b=( )
X
0
1
2
3
P
0.1
a
b
0.1
A.0.2 B.-0.2
C.0.8 D.-0.8
B [由0.1+a+b+0.1=1,得a+b=0.8,又由E(X)=0×0.1+1×a+2×b+3×0.1=1.6,得a+2b=1.3,解得a=0.3,b=0.5,
则a-b=-0.2.]
2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0.5,两个路口连续遇到红灯的概率为0.4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )
A.0.6 B.0.7
C.0.8 D.0.9
C [记“第一个路口遇到红灯”为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0.4,则P(B|A)==0.8,故选C.]
3.两个实习生每人加工一个零件,加工为一等品的概率分别为和,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )
A. B.
C. D.
B [设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=,P(B)=,所以这两个零件中恰有一个一等品的概率为P(A)+P(B)=P(A)P()+P()P(B)=×+×=.]
4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=,则P(Y≥1)=( )
A. B.
C. D.1
C [∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C(1-p)2=,解得p=,
∴P(Y≥1)=1-P(Y=0)=1-C(1-p)4=1-=,故选C.]
5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.
[因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B,
∴D(X)=4××=.]
6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.
(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 7,P(μ-2σ<X<μ+2σ)=0.954 5)
0.135 9 [依题意设X~N(0,32),其中μ=0,σ=3,
∴P(-3<X<3)=0.682 7,P(-6<X<6)=0.954 5.
∴P(3<X<6)=[P(-6<X<6)-P(-3<X<3)]=×(0.954 5-0.682 7)=0.135 9.]
[扣要点——查缺补漏]
1.离散型随机变量的分布列的两个性质
(1)pi≥0 (i=1,2,…,n);
(2)p1+p2+…+pn=1.如T1.
2.变量ξ的数学期望、方差
(1)E(ξ)=x1p1+x2p2+…+xnpn.如T1.
(2)D(ξ)=[x1-E(ξ)]2·p1+[x2-E(ξ)]2·p2+…+[xn-E(ξ)]2·pn,标准差为.
3.期望、方差的性质
(1)E(aξ+b)=aE(ξ)+b,D(aξ+b)=a2D(ξ);
(2)若ξ~B(n,p),则E(ξ)=np ,D(ξ)=np(1-p).
(3)X服从两点分布,则E(ξ)=p,D(ξ)=p(1-p).
4.常见概率的求法
(1)条件概率:在A发生的条件下B发生的概率P(B|A)=,如T2.
(2)相互独立事件同时发生的概率:P(AB)=P(A)P(B),如T3.
(3)在n次独立重复试验中事件A恰好发生k次的概率:P(ξ=k)=Cpkqn-k,(k=0,1,2,…,n,q=1-p),如T4.
(4)超几何分布:在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.
(5)正态分布:若X~N(μ,σ2),则正态曲线关于直线x=μ对称,常借助图象的对称性求随机变量落在某一范围内的概率,如T6.
[教师授课资源]
[备考指导]
新考纲把概率与统计作为数学思想提出来,必会重点考查,近几年的概率与统计高考题新颖灵活,并且作为压轴题出现,在备考中特别重视.
[命题方向]
①数据统计分析,通过观察分析计算数据,计算(,s2,E(X)等)来进行方案的选择,同时与概率、正态分布结合,来解决实际问题(如控制生产线).
②以频率分布直方图为载体,研究平均数,让近似等于正态分布N(μ,σ2)中的μ,进而考查3σ区间与二项分布结合,研究期望与方差.
③以统计案例为载体,考查X2,r的同时,考查非线性回归问题,通过换元,取对数等手段,把非线性回归问题转化为线性回归问题,其中要通过数据的计算及灵活变通.
④以新颖背景为载体,考查分类讨论,要进行多种情况下概率与统计的特征数的计算进行数据比较分析,进行方案的选择.
⑤开放型题目,方案选择理由不唯一,会有多种角度回答,这种题型符合新考纲要求,同时增大阅读量与数字字母化,考查阅读转化能力.,本部分建议重点归类研究近几年全国卷高考题,研究考法与题型,进行总结归纳反思,从而开阔思路和视野,以不变应万变,提升分析问题能力.
条件概率、相互独立事件及二项分布(5年5考)
[高考解读] 高考对该点的考查可以单独考查也可以与概率统计综合考查,注重双基,属基础性题目.解答的关键是分清事件间的关系,套用相应概率公式求解.预测2020年命题风格不变.
1.(2018·全国卷Ⅲ)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=( )
A.0.7 B.0.6
C.0.4 D.0.3
B [由题意知,该群体的10位成员使用移动支付的人数X概率分布符合二项分布,所以D(X)=10p(1-p)=2.4,所以p=0.6或p=0.4.由P(X=4)<P(X=6),得Cp4(1-p)6<Cp6(1-p)4,即(1-p)2<p2,所以p>0.5,所以p=0.6.]
2.(2019·全国卷Ⅱ)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立,在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
[解](1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.
(2)X=4且甲获胜,就是某局双方10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.
[教师备选题]
1.(2015·全国卷Ⅰ)投篮测试中,每人投3次,至少投中2次才能通过测试.已知某同学每次投篮投中的概率为0.6,且各次投篮是否投中相互独立,则该同学通过测试的概率为( )
A.0.648 B.0.432
C.0.36 D.0.312
A [3次投篮投中2次的概率为P(k=2)=C×0.62×(1-0.6),投中3次的概率为P(k=3)=0.63,所以通过测试的概率为P(k=2)+P(k=3)=C×0.62×(1-0.6)+0.63=0.648.故选A.]
2.(2014·全国卷Ⅱ)某地区空气质量监测资料表明,一天的空气质量为优良的概率是0.75,连续两天为优良的概率是0.6,已知某天的空气质量为优良,则随后一天的空气质量为优良的概率是( )
A.0.8 B.0.75
C.0.6 D.0.45
A [根据条件概率公式,直接代入,可求得随后一天的空气质量为优良的概率.
已知连续两天为优良的概率是0.6,那么在前一天空气质量为优良的前提下,要求随后一天的空气质量为优良的概率,可根据条件概率公式,得P==0.8.]
3.(2016·全国卷Ⅱ)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保 费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概 率
0.30
0.15
0.20
0.20
0.10
0.05
(1)求一续保人本年度的保费高于基本保费的概率;
(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(3)求续保人本年度的平均保费与基本保费的比值.
[解](1)设A表示事件“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故
P(A)=0.2+0.2+0.1+0.05=0.55.
(2)设B表示事件“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.1+0.05=0.15.
又P(AB)=P(B),
故P(B|A)====.
因此所求概率为.
(3)记续保人本年度的保费为X元,则X的分布列为
X
0.85a
a
1.25a
1.5a
1.75a
2a
P
0.30
0.15
0.20
0.20
0.10
0.05
E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.
因此续保人本年度的平均保费与基本保费的比值为1.23.
求相互独立事件和独立重复试验的概率的方法
(1)直接法:利用相互独立事件的概率乘法公式直接求解.
(2)间接法:当复杂事件正面情况比较多,反面情况较少,则可利用其对立事件进行求解.对于“至少”“至多”等问题往往也用这种方法求解.
提醒:解决条件概率的关键是明确“既定条件”,即在“谁发生的条件下,求谁的概率”.
1.(条件概率)(2019·长沙模拟)已知一种元件的使用寿命超过1年的概率为0.8,超过2年的概率为0.6,若一个这种元件使用到1年时还未损坏,则这个元件使用寿命超过2年的概率为( )
A.0.75 B.0.6
C.0.52 D.0.48
A [设一个这种元件使用到1年时还未损坏为事件A,使用到2年时还未损坏为事件B,则由题意知P(AB)=0.6,P(A)=0.8,则这个元件使用寿命超过2年的概率为P(B|A)===0.75,故选A.]
2.(二项分布)某机械研究所对新研发的某批次机械元件进行寿命追踪调查,随机抽查的200个机械元件情况如下:
使用时间/天
10~20
21~30
31~40
41~50
51~60
个数
10
40
80
50
20
若将频率视作概率,现从该批次机械元件中随机抽取3个,则至少有2个元件的使用寿命在30天以上的概率为( )
A. B.
C. D.
D [由表可知元件使用寿命在30天以上的频率为=,则所求概率为C·×+C·=.]
3.(相互独立事件的概率)甲、乙、丙3位大学生同时应聘某个用人单位的职位,3人能被选中的概率分别为,,,且各自能否被选中互不影响.则3人中至少有1人被选中的概率为________.
[3人都未被选中的概率为P=××=,故3人中至少有1人被选中的概率为1-=.]
随机变量的分布列、均值、方差(5年6考)
[高考解读] 高考对该点的考查常以生产、生活实际为背景,考查考生从题干中提取信息建立数学模型,并应用期望(或方差)对实际问题作出决策的能力.预测2020年会加强对该点的考查.
(2018·全国卷Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f(p)的最大值点p0;
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
①若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);
②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
切入点:借助独立重复试验的概率公式建立概率函数f(p),并用导数求f(p)的最大值点P0.
[解](1)20件产品中恰有2件不合格品的概率为f(p)=Cp2(1-p)18.
因此f′(p)=C[2p(1-p)18-18p2(1-p)17]=2Cp(1-p)17(1-10p).
令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.
(2)由(1)知,p=0.1.
①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.
所以E(X)=E(40+25Y)=40+25E(Y)=490.
②如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.
由于E(X)>400,故应该对余下的产品作检验.
[教师备选题]
(2016·全国卷Ⅰ)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(1)求X的分布列;
(2)若要求P(X≤n)≥0.5,确定n的最小值;
(3)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
[解](1)由柱状图并以频率代替概率可得,一台机器在三年内需更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2.
从而P(X=16)=0.2×0.2=0.04;
P(X=17)=2×0.2×0.4=0.16;
P(X=18)=2×0.2×0.2+0.4×0.4=0.24;
P(X=19)=2×0.2×0.2+2×0.4×0.2=0.24;
P(X=20)=2×0.2×0.4+0.2×0.2=0.2;
P(X=21)=2×0.2×0.2=0.08;
P(X=22)=0.2×0.2=0.04.
所以X的分布列为
X
16
17
18
19
20
21
22
P
0.04
0.16
0.24
0.24
0.2
0.08
0.04
(2)由(1)知P(X≤18)=0.44,P(X≤19)=0.68,
故n的最小值为19.
(3)记Y表示2台机器在购买易损零件上所需的费用(单位:元).
当n=19时,
E(Y)=19×200×0.68+(19×200+500)×0.2+(19×200+2×500)×0.08+(19×200+3×500)×0.04=4 040;
当n=20时,
E(Y)=20×200×0.88+(20×200+500)×0.08+(20×200+2×500)×0.04=4 080.
可知当n=19时所需费用的期望值小于当n=20时所需费用的期望值,故应选n=19.
解决分布列、期望、方差问题的3关
(1)判断关:即依据题意判断随机变量的取值及判断所求分布列的类型.
(2)概率关:即依据事件间的相互关系,结合相应的概率公式求出每个随机变量取值的概率.
(3)决策关:即借助分布列,计算随机变量的数学期望,并结合实际问题作出合理决策.
1.(以统计图表为背景)随着移动互联网的发展,与餐饮美食相关的手机APP软件层出不穷.为调查某款订餐软件的商家的服务情况,统计了10次订餐“送达时间”(时间:分钟),得到茎叶图如下:
(1)请计算“送达时间”的平均数与方差;
(2)根据茎叶图,求A,B,C,D的值;
送达时间
35分钟以内(包括35分钟)
超过35分钟
频数
A
B
频率
C
D
(3)在(2)的情况下,以频率代替概率,现有3个客户应用此软件订餐,求在35分钟以内(包括35分钟)收到餐品的人数X的分布列,并求出数学期望.
[解](1)“送达时间”的平均数为
=35(分钟),
方差为
=20.6.
(2)A=6,B=4,C=0.6,D=0.4.
(3)由已知,人数X的可能取值为0,1,2,3,
P(X=0)=C×0.60×0.43=0.064;
P(X=1)=C×0.61×0.42=0.288;
P(X=2)=C×0.62×0.41=0.432;
P(X=3)=C×0.63×0.40=0.216.
所以随机变量X的分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
X服从二项分布B(3,0.6),
E(X)=3×0.6=1.8.
2.(函数与概率统计的交汇)某医院为筛查某种疾病,需要检验血液是否为阳性,现有n(n∈N*)份血液样本,有以下两种检验方式:(1)逐份检验,则需要检验n次;(2)混合检验,将其中k(k∈N*且k≥2)份血液样本分别取样混合在一起检验.若检验结果为阴性,这k份血液全为阴性,因而这k份血液样本只要检验一次就够了,如果检验结果为阳性,为了明确这k份血液究竟哪几份为阳性,就要对这k份再逐份检验,此时这k份血液的检验次数总共为k+1次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为p(0<p<1).
(1)假设有5份血液样本,其中只有2份样本为阳性,若采用逐份检验方式,求恰好经过4次检验就能把阳性样本全部检验出来的概率;
(2)现取其中k(k∈N*且k≥2)份血液样本,记采用逐份检验方式,样本需要检验的总次数为ξ1,采用混合检验方式,样本需要检验的总次数为ξ2.
①试运用概率统计的知识,若Eξ1=Eξ2,试求p关于k的函数关系式p=f(k);
②若p=1-,采用混合检验方式可以使得样本需要检验的总次数的期望值比逐份检验的总次数期望值更少,求k的最大值.
参考数据:ln 2≈0.693 1,ln 3≈1.098 6,ln 4≈1.386 3,ln 5≈1.609 4,ln 6≈1.791 8.
[解](1)p==.
∴恰好经过4次检验就能把阳性样本全部检验出来的概率为.
(2)①由已知得Eξ1=k,ξ2的所有可能取值为1,k+1.
∴P(ξ2=1)=(1-p)k,P(ξ2=k+1)=1-(1-p)k,
∴Eξ2=(1-p)k+(k+1)[1-(1-p)k]=k+1-k(1-p)k.
若Eξ1=Eξ2,则k=k+1-k(1-p)k,∴k(1-p)k=1,(1-p)k=,∴1-p=,∴p=1-.
∴p关于k的函数关系式p=1-(k∈N*且k≥2).
②由题意可知Eξ2<Eξ1,得<(1-p)k,
∵p=1-,∴<,∴ln k>k,
设f(x)=ln x-x(x>0) ,
则f′(x)=,
∴当x>3时,f′(x)<0,即f(x)在(3,+∞)上单调递减,
又ln 4≈1.386 3, ≈1.333 3,
∴ln 4>,
∵ln 5≈1.609 4,≈1.666 7,∴ln 5<.
∴k的最大值为4.
样本的均值、方差与正态分布的综合(5年2考)
[高考解读] 正态分布可与二项分布、控制生产线结合,很受命题者的青睐,主要考查3σ区间与对称性;考查正态分布的题目,要重视题后数据的利用,题后数据作用:①提供方向(计算)与目标;②切勿掉入题后数据误导的陷阱.
(2017·全国卷Ⅰ)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ-3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ-3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①试说明上述监控生产过程方法的合理性;
②下面是检验员在一天内抽取的16个零件的尺寸:
9.95 10.12 9.96 9.96 10.01 9.92 9.98
10.04 10.26 9.91 10.13 10.02 9.22 10.04
10.05 9.95
经计算得
=,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数作为μ的估计值,用样本标准差s作为σ的估计值,利用估计值判断是否需对当天的生产过程进行检查?剔除(-3,+3)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-3σ
因此P(X≥1)=1-P(X=0)=1-0.997 416≈0.040 8.
X的数学期望E(X)=16×0.002 6=0.041 6.
(2)①如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.002 6,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.040 8,发生的概率很小,因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
②由=9.97,s≈0.212,得μ的估计值为=9.97,σ的估计值为=0.212,由样本数据可以看出有一个零件的尺寸在(-3,+3)之外,因此需对当天的生产过程进行检查.
剔除(-3,+3)之外的数据9.22,剩下数据的平均数为×(16×9.97-9.22)=10.02.
因此μ的估计值为10.02.
x=16×0.2122+16×9.972≈1 591.134,
剔除(-3,+3)之外的数据9.22,剩下数据的样本方差为×(1 591.134-9.222-15×10.022)≈0.008,
因此σ的估计值为≈0.09.
[教师备选题]
(2014·全国卷Ⅰ)从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数和样本方差s2(同一组中的数据用该组区间的中点值作代表);
(2)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
①利用该正态分布,求P(187.8
附:≈12.2.
若Z~N(μ,σ2),则P(μ-σ
=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(2)①由(1)知,Z~N(200,150),从而P(187.8
解决正态分布问题有4个关键点
(1)对称轴x=μ;(2)标准差σ;(3)分布区间.利用对称性求指定范围内的概率值,由μ,σ分布区间的特征进行转化,使分布区间转化为3σ特殊区间,从而求出所求概率;(4)曲线与x轴之间面积为1.
(与频率分布直方图交汇)某质检部门从某烤鳗鱼有限公司生产的某批次的烤鳗鱼中随机抽取200箱,检测这些产品的某项质量指标值(记为Z),由检测结果得到如下图所示的频率分布直方图.
(1)质检部门规定,当Z≥95时,产品为合格品;当Z<95时,产品为不合格品.该公司每生产一箱这种产品,若是合格品,则盈利90元;若是不合格品,则亏损30元.记Y为生产一箱这种产品的利润,求Y的分布列和E(Y);
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用所在区间的中点值作代表).
①利用该正态分布,求P(75.6
附:≈12.2,
若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 7,P(μ-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.
[解](1)由频率估计概率,产品为合格品的概率为(0.033+0.024+0.008+0.002)×10=0.67,为不合格品的概率为1-0.67=0.33.
所以随机变量Y的分布列为
Y
90
-30
P
0.67
0.33
所以E(Y)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的质量指标值的样本平均数和样本方差s2分别为=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150,
所以Z~N(100,150).
①因为Z~N(100,150),
所以P(75.6<Z≤124.4)=P(100-12.2×2<Z≤100+12.2×2)≈0.954 5.
②由①可知,一箱产品中该质量指标值位于(75.6,124.4)上的概率为0.954 5,
依题意知X~B(500,0.954 5),
所以E(X)=500×0.954 5=477.25,
D(X)=500×0.954 5×(1-0.954 5)≈21.7.
相关资料
更多