高中数学高考10 8 离散型随机变量的均值与方差
展开10.8 离散型随机变量的均值与方差
1.离散型随机变量的均值
(1)若离散型随机变量X的概率分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称E(X)=_____________________________为随机变量X的均值或数学期望,它反映了离散型随机变量取值的____________.
(2)若Y=aX+b,其中a,b为常数,则Y也是随机变量,于是E(Y)=____________________.
(3)①若X服从两点分布,则E(X)=____________;
②若X~B(n,p),则E(X)=____________.
2.离散型随机变量的方差
(1)若离散型随机变量X的概率分布列为
X
x1
x2
…
xi
…
xn
P
p1
p2
…
pi
…
pn
则称D(X)=_________________为随机变量X的方差,其算术平方根________为随机变量X的标准差.
(2)D(aX+b)=____________.
(3)①若X服从两点分布,则D(X)=____________;
②若X~B(n,p),则D(X)=____________.
方差反映随机变量取值的稳定与波动、集中与离散的程度:D(X)越小,X取值越集中,D(X)越大,X取值越分散.
自查自纠:
1.(1)x1p1+x2p2+…+xipi+…+xnpn 平均水平
(2)aE(X)+b (3)①p ②np
2.(1)(xi-E(X))2pi (2)a2D(X)
(3)①p(1-p) ②np(1-p)
已知某一随机变量X的分布列如下,且 E(X)=6.3,则a的值为 ( )
X
4
a
9
P
0.5
0.1
b
A.5 B.6 C.7 D.8
解:由分布列性质知0.5+0.1+b=1,所以b=0.4.所以E(X)=4×0.5+a×0.1+9×0.4=6.3,所以a=7.故选C.
设随机变量X的分布列为P(X=k)=(k=2,4,6,8,10),则D(X)等于 ( )
A.5 B.8 C.10 D.16
解:因为E(X)=(2+4+6+8+10)=6,
所以D(X)=[(-4)2+(-2)2+02+22+42]=8.故选B.
()某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立,设X为该群体的10位成员中使用移动支付的人数,D(X)=2.4,P(X=4)<P(X=6),则p=( )
A.0.7 B.0.6 C.0.4 D.0.3
解:易知X~B(10,p),则D(X)=10p(1-p)=2.4,所以p=0.4或p=0.6.
因为P(X=4)<P(X=6),即Cp4(1-p)6<Cp6(1-p)4,所以(1-p)2<p2,可知p>0.5,则p=0.6.故选B.
()一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则DX=________.
解:有放回的抽取,是一个二项分布模型,其中p=0.02,n=100,则DX=np(1-p)=100×0.02×0.98=1.96.故填1.96.
()如果随机变量X~B(n,p),且E(X)=7,D(X)=6,则p=____________.
解:由题意得解得p=.故填.
类型一 摸球模型、抽签模型
一口袋中装有大小相同的2个白球和4个黑球,每次从袋中任意摸出一个球.
(1)采取有放回抽样方式,从中摸出两个球,求两球恰好颜色不同的概率;
(2)采取不放回抽样方式,从中摸出两个球,求摸得白球的个数的均值和方差.
解:(1)“有放回摸取”可看作独立重复试验,每次摸出一球是白球的概率为P==.
记“有放回摸两次,颜色不同”为事件A,其概率为P(A)=.
(2)设摸得白球的个数为X,则X的取值为0,1,2,
P(X=0)=×=,
P(X=1)=×+×=,
P(X=2)=×=.
所以X的分布列为
X
0
1
2
P
E(X)=0×+1×+2×=,
D(X)=×+×+×
=.
点 拨:
求离散型随机变量的分布列的关键在于确定随机变量及其概率.就本题而言,弄清“放回”与“不放回”在概率计算上的区别是正确解题的关键.均值与方差直接套用公式计算即可.
()某节目是大型科学竞技类真人秀节目,有机构为了了解大学生喜欢该节目是否与性别有关,对某校的100名大学生进行了问卷调查,得到如下列联表:
喜欢该节目
不喜欢该节目
合计
男生
15
女生
15
合计
已知在这100人中随机抽取1人,抽到不喜欢该节目的大学生的概率为0.4.
(1)请将上述列联表补充完整,判断是否有99.9%的把握认为喜欢该节目与性别有关,并说明理由;
(2)已知在被调查的大学生中有5名是大一学生,其中3名喜欢该节目,现从这5名大一学生中随机抽取2人,抽到喜欢该节目的人数为X,求X的分布列及数学期望.
下面的临界值表仅供参考:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
参考公式:K2=,其中n=a+b+c+d.
解:(1)由题意知列联表为
喜欢该节目
不喜欢该节目
合计
男生
45
15
60
女生
15
25
40
合计
60
40
100
K2=≈14.063>10.828,
故有99.9%的把握认为喜欢该节目与性别有关.
(2)X的可能取值为0,1,2,
X
0
1
2
P
E(X)=0×+1×+2×=.
类型二 停止型问题
()为迎接在兰州举行的“中国兰州国际马拉松赛”,某单位在推介晚会中进行嘉宾现场抽奖活动.抽奖盒中装有大小相同的6个小球,分别印有“兰州马拉松”和“绿色金城行”两种标志,摇匀后,规定参加者每次从盒中同时抽取两个小球(登记后放回并摇匀),若抽到的两个小球都印有“兰州马拉松”即可中奖,并停止抽奖,否则继续,但每位嘉宾最多抽取3次.已知从盒中同时抽取两个小球不都是“绿色金城行”标志的概率为.
(1)求盒中印有“兰州马拉松”标志的小球个数;
(2)用η表示某位嘉宾抽奖的次数,求η的分布列和数学期望.
则η的分布列为
η
1
2
3
P
所以E(η)=1×+2×+3×=.
点 拨:
解决这类终止型问题,一定要弄清楚终止的条件,根据终止条件确定各种可能结果,再计算相应概率.
某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到该银行取钱时,发现自己忘记了银行卡的密码,但可以确认该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定.
(1)求当天小王的该银行卡被锁定的概率;
(2)设当天小王用该银行卡尝试密码的次数为X,求X的分布列和数学期望.
解:(1)设“当天小王的该银行卡被锁定”为事件A,则P(A)=××=.
(2)依题意得,X所有可能的取值是1,2,3.
又P(X=1)=,P(X=2)=×=,P(X=3)=××1=.
所以X的分布列为
X
1
2
3
P
所以E(X)=1×+2×+3×=.
类型三 二项分布的均值与方差
一家面包房根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图,如图所示.
将日销售量落入各组的频率视为概率,并假设每天的销售量相互独立.
(1)求在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个的概率;
(2)用X表示在未来3天里日销售量不低于100个的天数,求随机变量X的分布列、数学期望E(X)及方差D(X).
解:(1)设A1表示事件“日销售量不低于100个”,A2表示事件“日销售量低于50个”,B表示事件“在未来连续3天里,有连续2天的日销售量都不低于100个且另1天的日销售量低于50个”,因此
P(A1)=(0.006+0.004+0.002)×50=0.6,
P(A2)=0.003×50=0.15,
P(B)=0.6×0.6×0.15×2=0.108.
(2)X的可能取值为0,1,2,3.
P(X=0)=C×(1-0.6)3=0.064,
P(X=1)=C×0.6×(1-0.6)2=0.288,
P(X=2)=C×0.62×(1-0.6)=0.432,
P(X=3)=C×0.63=0.216.
X的分布列为
X
0
1
2
3
P
0.064
0.288
0.432
0.216
因为X~B(3,0.6),所以数学期望E(X)=3×0.6=1.8,
方差D(X)=3×0.6×(1-0.6)=0.72.
点 拨:
n次独立重复试验是重要的模型,要牢记公式:当X~B(n,p)时,E(X)=np,D(X)=npq,其中q=1-p.同时要掌握期望与方差的重要性质:E(aX+b)=aE(X)+b,D(aX+b)=a2D(X).
()为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.
(1)求图中a的值;
(2)估计这种植物果实重量的平均数x和方差s2(同一组中的数据用该组区间的中点值作代表);
(3)已知这种植物果实重量不低于32.5克的即为优质果实,用样本估计总体.若从这种植物果实中随机抽取3个,其中优质果实的个数为X,求X的分布列和数学期望E(X).
解:(1)由5×(0.02+0.04+0.075+a+0.015)=1得a=0.05.
(2)各组中点值和相应的频率依次为
中点值
30
35
40
45
50
频率
0.1
0.2
0.375
0.25
0.075
=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,
s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.
(3)由已知,这种植物果实的优质率p=0.9,且X~B(3,0.9),故其分布列为P(X=k)=C·0.9k·(1-0.9)3-k(k=0,1,2,3),
X的分布列为
X
0
1
2
3
P
0.001
0.027
0.243
0.729
所以E(X)=np=2.7.
类型四 综合运用
()PM2.5是衡量空气污染程度的一个指标,为了了解某市空气质量情况,从去年每天的PM2.5值的数据中随机抽取40天的数据,其频率分布直方图如图所示.
现将PM2.5值划分为如下等级:
PM2.5值
[0,100)
[100,150)
[150,200)
[200,250]
等级
一级
二级
三级
四级
用频率估计概率.
(1)估计该市在下一年的360天中空气质量为一级天气的天数;
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值的数据,再从这8个数据中随机抽取5个,求一级、二级、三级、四级天气都有的概率;
(3)如果该市对环境进行治理,治理后经统计,每天PM2.5值X近似满足X~N(115,752),则治理后的PM2.5值的均值比治理前大约下降了多少?
解:(1)由样本空气质量PM2.5的数据的频率分布直方图可知,其频率分布如下表:
PM2.5值
[0,50)
[50,100)
[100,150)
[150,200)
[200,250]
频率
0.125
0.125
0.375
0.25
0.125
由上表可知,如果该市维持现状不变,则该市下一年的某一天空气质量为一级天气的概率为0.25,
因此在360天中空气质量为一级天气约有360×0.25=90天.
(2)在样本中,按照分层抽样的方法抽取8天的PM2.5值数据,则这8个数据中一级、二级、三级、四级天气的数据分别有2个、3个、2个、1个.
从这8个数据中随机抽取5个,则这四种天气都有的情况有三种:一级天气的数据有2个,其余的均为1个;二级天气的数据有2个,其余的均为1个;三级天气的数据有2个,其余的均为1个.
共有的情况有:CCCC+CCCC+CCCC=24种.
而从8个数据中随机抽取5个,有C=56种情况.
故所求概率为=.
(3)如果该市维持现状不变,设PM2.5的值为Y,则该市的PM2.5值的均值约为
E(Y)=25×0.125+75×0.125+125×0.375+175×0.25+225×0.125=131.25.
如果该市对环境进行治理,则该市的PM2.5值X的均值为E(X)=115.
因此该市治理后的PM2.5值的均值比治理前大约下降了131.25-115=16.25.
点 拨:
随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.
()某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B.已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件,假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X1的分布列如下表,且X1的数学期望E(X1)=6,求a,b的值;
X1
5
6
7
8
P
0.4
a
b
0.1
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
3 5 3 3 8 5 5 6 3 4
6 3 4 7 5 3 4 8 5 3
8 3 4 3 4 4 7 5 6 7
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望;
(3)在(1)(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?并说明理由.
注:①产品的“性价比”=;
②“性价比”大的产品更具可购买性.
解:(1)E(X1)=5×0.4+6a+7b+8×0.1=6,
即6a+7b=3.2,①
由X1的分布列性质得0.4+a+b+0.1=1,即a+b=0.5,②
联立①②,解得
(2)由已知得,样本的频率分布如下表:
等级系数X2
3
4
5
6
7
8
样本频率f
0.3
0.2
0.2
0.1
0.1
0.1
用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的数学期望E(X2)=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,
即乙厂产品的等级系数的数学期望为4.8.
(3)乙厂的产品更具可购买性,理由如下:
因为甲厂产品的等级系数的数学期望为6,零售价为6元/件,所以其性价比为=1,
因为乙厂产品的等级系数的数学期望为4.8,零售价为4元/件,所以其性价比为=1.2,
据此,乙厂的产品更具可购买性.
1.计算均值与方差的基本方法
(1)已知随机变量的概率分布求它的均值、方差和标准差,可直接用定义或公式求;
(2)已知随机变量X的均值、方差,求X的线性函数Y=aX+b的均值、方差和标准差,可直接用均值及方差的性质求;
(3)如能分析所给随机变量服从常用的分布(如两点分布、二项分布等),则可直接利用它们的均值、方差公式来求.
2.求均值与方差常用的结论
掌握下述有关结论,会给解题带来方便:
(1)E(aX+b)=aE(X)+b;
E(X+Y)=E(X)+E(Y);
D(aX+b)=a2D(X).
(2)若X~B(n,p),则E(X)=np,D(X)=np(1-p).
3.(1)在实际中经常用均值来比较平均水平,当平均水平相近时,再用方差比较稳定程度;(2)注意离散型随机变量的均值、方差与样本数据的平均数、方差的区别与联系.
1.已知离散型随机变量X的概率分布列为
X
1
3
5
P
0.5
m
0.2
则其方差D(X)= ( )
A.1 B.0.6 C.2.44 D.2.4
解:由0.5+m+0.2=1得m=0.3,所以E(X)=1×0.5+3×0.3+5×0.2=2.4,
所以D(X)=(1-2.4)2×0.5+(3-2.4)2×0.3+(5-2.4)2×0.2=2.44.故选C.
2.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y1=xi+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为 ( )
A.1+a,4 B.1+a,4+a
C.1,4 D.1,4+a
解:由条件,E(y)=E(x)+a=1+a,D(y)=D(x)=4. 故选A.
3.已知随机变量X服从二项分布,且E(X)=2.4,D(X)=1.44,则二项分布的参数n,p的值为 ( )
A.n=4,p=0.6 B.n=6,p=0.4
C.n=8,p=0.3 D.n=24,p=0.1
解:由二项分布X~B(n,p)及E(X)=np,D(X)=np·(1-p)得2.4=np,且1.44=np(1-p),解得n=6,p=0.4.故选B.
4.()某种种子每粒发芽的概率都为0.9,现播种了1 000粒,对于没有发芽的种子,每粒需再补种2粒,补种的种子数记为X,则X的数学期望为 ( )
A.100 B.200 C.300 D.400
解:设没有发芽的种子有ξ粒,则ξ~B(1 000,0.1),且X=2ξ,所以E(X)=E(2ξ)=2E(ξ)=2×1 000×0.1=200.故选B.
5.甲、乙两人进行乒乓球比赛,约定每局胜者得1分,负者得0分,比赛进行到有一人比对方多2分或打满6局时停止.设甲在每局中获胜的概率为,乙在每局中获胜的概率为,且各局胜负相互独立,则比赛停止时已打局数X的期望E(X)为
( )
A. B. C. D.
解:依题意,X的所有可能值为2,4,6,设每两局比赛为一轮,则一轮结束时比赛停止的概率为()2+()2=.
若一轮结束时比赛还将继续,则甲、乙在该轮中必是各得一分,此时,该轮比赛结果对下轮比赛是否停止没有影响.从而有P(X=2)=,P(X=4)=×=,P(X=6)=()2=,故E(X)=2×+4×+6×=.故选B.
6.口袋中有5只球,编号分别为1,2,3,4,5,从中任取3只球,用X表示取出的球的最大号码,则X的数学期望E(X)的值是 ( )
A.4 B.4.5 C.4.75 D.5
所以E(X)=3×+4×+5×=4.5.故选B.
7.随机变量ξ的取值为0,1,2.若P(ξ=0)=,E(ξ)=1,则D(ξ)=____________.
解:设P(ξ=1)=a,P(ξ=2)=b,
则解得
所以D(ξ)=+×0+×1=.故填.
8.()某项游戏活动的奖励分成一、二、三等奖,且相应获奖概率是以a1为首项,公比为2的等比数列,相应奖金是以700元为首项,公差为-140元的等差数列,则参与该游戏获得奖金的数学期望为________元.
解:由概率分布性质a1+2a1+4a1=1,所以a1=,从而2a1=,4a1=.
因此获得奖金ξ的分布列为
ξ
700
560
420
P
所以Eξ=700×+560×+420×=500(元).故填500.
9.()某省环保部门为加强环境执法监管,派遣四个不同的专家组对A,B,C三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.
解:(1)随机选取,共有34=81种不同方法,恰有一个城市没有专家组选取的有C(CA+C)=42种不同方法,故恰有一个城市没有专家组选取的概率为=.
(2)设事件A:“城市需复检”,则P(A)=1-()4=,X的所有可能取值为0,1,2,3,
P(X=0)=C·()3=,
P(X=1)=C·()2·=,
P(X=2)=C··()2=,
P(X=3)=C·()3=.
所以X的分布列为
X
0
1
2
3
P
因为X~B(3,),所以E(X)=3×=.
10.()某教师为了分析所任教班级某次考试的成绩,将全班同学的成绩制成统计表和频率分布直方图如下:
分组
频数
频率
[50,60)
3
0.06
[60,70)
m
0.10
[70,80)
13
n
[80,90)
p
q
[90,100]
9
0.18
总计
t
1
(1)求表中t,q及图中a的值;
(2)该教师从这次考试成绩低于70分的学生中随机抽取3人进行谈话,设X表示所抽取学生中成绩低于60分的人数,求随机变量X的分布列和数学期望.
解:(1)由题中表格可知,全班总人数t==50,
则m=50×0.10=5,n==0.26,所以a==0.026,3+5+13+9+p=50,即p=20,所以q==0.4.
(2)成绩在[50,60)内的有3人,[60,70)内的有5人.
由题意得X可能的取值为0,1,2,3,
则X服从超几何分布,其分布列为
所以P(X=0)==,P(X=1)==,
P(X=2)=,P(X=3)=.
随机变量X的分布列为
X
0
1
2
3
P
数学期望E(X)=0×+1×+2×+3×=.
11.为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.
(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元,求:
(Ⅰ)顾客所获的奖励额为60元的概率;
(Ⅱ)顾客所获的奖励额的分布列及数学期望;
(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.
即X的分布列为
X
20
60
P
所以顾客所获的奖励额的期望为
E(X)=20×+60×=40(元).
(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.
对于面值由20元和40元组成的情况,同理可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.
以下是对两个方案的分析:
对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为
X
20
60
100
P
X1的期望为E(X1)=20×+60×+100×=60,
X1的方差为D(X1)=(20-60)2×+(60-60)2×+(100-60)2×=.
对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为
X2
40
60
80
P
X2的期望为E(X2)=40×+60×+80×=60,
X2的方差为D(X2)=(40-60)2×+(60-60)2×+(80-60)2×=.
由于两种方案的奖励额的期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.
已知甲盒中仅有1个球且为红球,乙盒中有m个红球和n个蓝球(m≥3,n≥3),从乙盒中随机抽取i(i=1,2)个球放入甲盒中.
(a)放入i个球后,甲盒中含有红球的个数记为ξi(i=1,2);
(b)放入i个球后,从甲盒中取1个球是红球的概率记为pi(i=1,2).
则 ( )
A.p1>p2,E(ξ1)
C.p1>p2,E(ξ1)>E(ξ2) D.p1
高中数学高考课后限时集训71 离散型随机变量的均值与方差、正态分布 作业: 这是一份高中数学高考课后限时集训71 离散型随机变量的均值与方差、正态分布 作业,共9页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
高中数学高考第61讲 离散型随机变量的均值与方差、正态分布(讲)(学生版): 这是一份高中数学高考第61讲 离散型随机变量的均值与方差、正态分布(讲)(学生版),共13页。试卷主要包含了均值,方差,两个特殊分布的期望与方差,正态分布等内容,欢迎下载使用。
高中数学高考第61讲 离散型随机变量的均值与方差、正态分布(讲)(教师版): 这是一份高中数学高考第61讲 离散型随机变量的均值与方差、正态分布(讲)(教师版),共16页。试卷主要包含了均值,方差,两个特殊分布的期望与方差,正态分布等内容,欢迎下载使用。