2020版高考新创新一轮复习数学新课改省份专用讲义:第十章第五节 离散型随机变量的分布列、均值与方差
展开第五节 离散型随机变量的分布列、均值与方差
突破点一 离散型随机变量的分布列
1.随机变量的有关概念
(1)随机变量:随着试验结果变化而变化的变量,常用字母X,Y,ξ,η,…表示.
(2)离散型随机变量:所有取值可以一一列出的随机变量.
2.离散型随机变量分布列的概念及性质
(1)概念:若离散型随机变量X可能取的不同值为x1,x2,…,xi,…,xn,X取每一个值xi(i=1,2,…,n)的概率P(X=xi)=pi,以表格的形式表示如下:
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
此表称为离散型随机变量X的概率分布列,简称为X的分布列.有时也用等式P(X=xi)=pi,i=1,2,…,n表示X的分布列.
(2)分布列的性质:①pi≥0,i=1,2,3,…,n;②i=1.
3.常见的离散型随机变量的分布列
(1)两点分布
X | 0 | 1 |
P | 1-p | p |
若随机变量X的分布列具有上表的形式,则称X服从两点分布,并称p=P(X=1)为成功概率.
(2)超几何分布
在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*.
X | 0 | 1 | … | m |
P | … |
如果随机变量X的分布列具有上表的形式,则称随机变量X服从超几何分布.
一、判断题(对的打“√”,错的打“×”)
(1)抛掷均匀硬币一次,出现正面的次数是随机变量.( )
(2)离散型随机变量的分布列描述了由这个随机变量所刻画的随机现象.( )
(3)某人射击时命中的概率为0.5,此人射击三次命中的次数X服从两点分布.( )
(4)从4名男演员和3名女演员中选出4名,其中女演员的人数X服从超几何分布.( )
(5)离散型随机变量的分布列中,随机变量取各个值的概率之和可以小于1.( )
(6)离散型随机变量的各个可能值表示的事件是彼此互斥的.( )
答案:(1)√ (2)√ (3)× (4)√ (5)× (6)√
二、填空题
1.设随机变量X的分布列如下:
X | 1 | 2 | 3 | 4 | 5 |
P | p |
则p为________.
答案:
2.已知随机变量X的分布列为P(X=i)=(i=1,2,3)则P(X=2)=________.
答案:
3.有一批产品共12件,其中次品3件,每次从中任取一件,在取到合格品之前取出的次品数X的所有可能取值是________.
答案:0,1,2,3
考法一 离散型随机变量分布列的性质
[例1] (1)设随机变量X的概率分布列如下表所示:
X | 0 | 1 | 2 |
P | a |
若F(x)=P(X≤x),则当x的取值范围是[1,2)时,F(x)等于( )
A. B.
C. D.
(2)若随机变量X的分布列为
X | -2 | -1 | 0 | 1 | 2 | 3 |
P | 0.1 | 0.2 | 0.2 | 0.3 | 0.1 | 0.1 |
则当P(X<a)=0.8时,实数a的取值范围是( )
A.(-∞,2] B.[1,2]
C.(1,2] D.(1,2)
[解析] (1)由分布列的性质,得a++=1,所以a=.而x∈[1,2),所以F(x)=P(X≤x)=+=.
(2)由随机变量X的分布列知:P(X<-1)=0.1,P(X<0)=0.3,P(X<1)=0.5,P(X<2)=0.8,
则当P(X<a)=0.8时,实数a的取值范围是(1,2].
[答案] (1)D (2)C
离散型随机变量分布列的性质的应用
(1)利用“总概率之和为1”可以求相关参数的取值范围或值;
(2)利用“离散型随机变量在一范围内的概率等于它取这个范围内各个值的概率之和”求某些特定事件的概率;
(3)可以根据性质判断所得分布列结果是否正确.
考法二 离散型随机变量的分布列求法
[例2] (2019·长春模拟)长春市的“名师云课”活动自开展以来获得广大家长和学生的高度赞誉,在推出的第二季名师云课中,数学学科共计推出36节云课,为了更好地将课程内容呈现给学生,现对某一时段云课的点击量进行统计:
点击量 | [0,1 000] | (1 000,3 000] | (3 000,+∞) |
节数 | 6 | 18 | 12 |
(1)现从36节云课中采用分层抽样的方式选出6节,求选出的点击量超过3 000的节数;
(2)为了更好地搭建云课平台,现将云课进行剪辑,若点击量在区间[0,1 000]内,则需要花费40分钟进行剪辑,若点击量在区间(1 000,3 000]内,则需要花费20分钟进行剪辑,点击量超过3 000,则不需要剪辑,现从(1)中选出的6节课中随机取出2节课进行剪辑,求剪辑时间X的分布列.
[解] (1)根据分层抽样可知,选出的6节课中点击量超过3 000的节数为×6=2.
(2)由分层抽样可知,(1)中选出的6节课中点击量在区间[0,1 000]内的有1节,点击量在区间(1 000,3 000]内的有3节,故X的可能取值为0,20,40,60.
P(X=0)==,
P(X=20)===,
P(X=40)===,
P(X=60)===,
则X的分布列为
X | 0 | 20 | 40 | 60 |
P |
[方法技巧]
求离散型随机变量分布列的步骤
(1)找出随机变量X的所有可能取值xi(i=1,2,3,…,n);
(2)求出各取值的概率P(X=xi)=pi;
(3)列成表格并用分布列的性质检验所求的分布列或某事件的概率是否正确.
考法三 超几何分布
[例3] 在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用.现有6名男志愿者A1,A2,A3,A4,A5,A6和4名女志愿者B1,B2,B3,B4,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.
(1)求接受甲种心理暗示的志愿者中包含A1但不包含B1的概率;
(2)用X表示接受乙种心理暗示的女志愿者人数,求X的分布列.
[解] (1)记接受甲种心理暗示的志愿者中包含A1但不包含B1的事件为M,则P(M==.
(2)由题意知X可取的值为0,1,2,3,4,则
P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)==.
因此X的分布列为
X | 0 | 1 | 2 | 3 | 4 |
P |
[方法技巧] 求超几何分布的分布列的步骤
1.设X是一个离散型随机变量,其分布列为:
X | -1 | 0 | 1 |
P | 2-3q | q2 |
则q的值为( )
A.1 B.±
C.- D.+
解析:选C 由分布列的性质知
∴q=-.
2.某项大型赛事,需要从高校选拔青年志愿者,某大学学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X,求X的分布列.
解:因为8名学生会干部中有5名男生,3名女生,所以X的分布列服从参数N=8,M=3,n=3的超几何分布.
X的所有可能取值为0,1,2,3,其中P(X=i)=(i=0,1,2,3),
则P(X=0)==,P(X=1)==,P(X=2)==,P(X=3)==.
所以X的分布列为
X | 0 | 1 | 2 | 3 |
P |
3.有编号为1,2,3,…,n的n个学生,入坐编号为1,2,3,…,n的n个座位,每个学生规定坐一个座位,设学生所坐的座位号与该生的编号不同的学生人数为X,已知X=2时,共有6种坐法.
(1)求n的值.
(2)求随机变量X的分布列.
解:(1)因为当X=2时,有C种坐法,
所以C=6,即=6,
n2-n-12=0,解得n=4或n=-3(舍去),所以n=4.
(2)因为学生所坐的座位号与该生的编号不同的学生人数为X,
由题意知X的可能取值是0,2,3,4,
所以P(X=0)==,
P(X=2)===,
P(X=3)===,
P(X=4)=1---=,
所以随机变量X的分布列为
X | 0 | 2 | 3 | 4 |
P |
突破点二 离散型随机变量的均值与方差
1.离散型随机变量的均值与方差
若离散型随机变量X的分布列为
X | x1 | x2 | … | xi | … | xn |
P | p1 | p2 | … | pi | … | pn |
(1)称E(X)=x1p1+x2p2+…+xipi+…+xnpn为随机变量X的均值或数学期望,它反映了离散型随机变量取值的平均水平.
(2)称D(X)=(xi-E(X))2pi为随机变量X的方差,它刻画了随机变量X与其均值E(X)的平均偏离程度,其算术平方根为随机变量X的标准差.
2.均值与方差的性质
(1)E(aX+b)=aE(X)+b;
(2)D(aX+b)=a2D(X)(a,b为常数).
一、判断题(对的打“√”,错的打“×”)
(1)期望是算术平均数概念的推广,与概率无关.( )
(2)随机变量的方差和标准差都反映了随机变量取值偏离均值的平均程度,方差或标准差越小,则偏离均值的平均程度越小.( )
(3)在篮球比赛中,罚球命中1次得1分,不中得0分.如果某运动员罚球命中的概率为0.7,那么他罚球1次的得分X的均值是0.7.( )
答案:(1)× (2)√ (3)√
二、填空题
1.已知随机变量X的分布列为P(X=k)=,k=1,2,3,则E(3X+5)=________.
答案:11
2.一个正四面体ABCD的四个顶点上分别标有1分,2分,3分和4分,往地面抛掷一次记不在地面上的顶点的分数为X,则X的均值为________.
解析:X的分布列为:
X | 1 | 2 | 3 | 4 |
P |
∴E(X)=1×+2×+3×+4×=.
答案:
3.随机变量X的可能取值为0,1,2,若P(X=0)=,E(X)=1,则D(X)=________.
解析:设P(X=1)=p,P(X=2)=q,
由题意得解得p=,q=,
∴D(X)=(0-1)2+(1-1)2+(2-1)2=.
答案:
考法一 离散型随机变量的均值与方差
[例1] (2018·天津高考)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.
①用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;
②设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.
[解] (1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.
(2)①随机变量X的所有可能取值为0,1,2,3.
所以P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以随机变量X的分布列为
X | 0 | 1 | 2 | 3 |
P |
随机变量X的数学期望E(X)=0×+1×+2×+3×=.
②设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;
事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥.
由①知P(B)=P(X=2),P(C)=P(X=1),
故P(A)=P(B∪C)=P(X=2)+P(X=1)=.
所以事件A发生的概率为.
求离散型随机变量均值与方差的关键及注意
(1)求离散型随机变量的均值与方差关键是确定随机变量的所有可能值,写出随机变量的分布列,正确运用均值、方差公式进行计算.
(2)注意E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)的应用.
考法二 均值与方差在决策中的应用
[例2] (2019·开封模拟)某产品按行业生产标准分成8个等级,等级系数X依次为1,2,…,8,其中X≥5为标准A,X≥3为标准B,已知甲厂执行标准A生产该产品,产品的零售价为6元/件;乙厂执行标准B生产该产品,产品的零售价为4元/件.假定甲、乙两厂的产品都符合相应的执行标准.
(1)已知甲厂产品的等级系数X1的概率分布列如下表所示:
X1 | 5 | 6 | 7 | 8 |
P | 0.4 | a | b | 0.1 |
且X1的数学期望EX1=6,求a,b的值;
(2)为分析乙厂产品的等级系数X2,从该厂生产的产品中随机抽取30件,相应的等级系数组成一个样本,数据如下:
用这个样本的频率分布估计总体分布,将频率视为概率,求等级系数X2的数学期望;
(3)在(1),(2)的条件下,若以“性价比”为判断标准,则哪个工厂的产品更具可购买性?说明理由.
注:①产品的“性价比”=产品的等级系数的数学期望/产品的零售价;
②“性价比”大的产品更具可购买性.
[解] (1)∵EX1=6,∴5×0.4+6a+7b+8×0.1=6,即6a+7b=3.2,
又0.4+a+b+0.1=1,即a+b=0.5,
∴由得
(2)由已知,用这个样本的频率分布估计总体分布,将频率视为概率,可得等级系数X2的概率分布列如下:
X2 | 3 | 4 | 5 | 6 | 7 | 8 |
P | 0.3 | 0.2 | 0.2 | 0.1 | 0.1 | 0.1 |
∴EX2=3×0.3+4×0.2+5×0.2+6×0.1+7×0.1+8×0.1=4.8,即乙厂产品的等级系数X2的数学期望等于4.8.
(3)乙厂的产品更具可购买性,理由如下:
∵甲厂产品的等级系数的数学期望等于6,价格为6元/件,∴其性价比为=1,
∵乙厂产品的等级系数的数学期望等于4.8,价格为4元/件.
∴其性价比为=1.2,
又1.2>1,∴乙厂的产品更具可购买性.
利用均值、方差进行决策的2个方略
(1)当均值不同时,两个随机变量取值的水平可见分歧,可对问题作出判断.
(2)若两随机变量均值相同或相差不大,则可通过分析两变量的方差来研究随机变量的离散程度或者稳定程度,进而进行决策.
1.随着网络营销和电子商务的兴起,人们的购物方式更具多样化.某调查机构随机抽取10名购物者进行采访,5名男性购物者中有3名倾向于选择网购,2名倾向于选择实体店,5名女性购物者中有2名倾向于选择网购,3名倾向于选择实体店.
(1)若从10名购物者中随机抽取2名,其中男、女各一名,求至少1名倾向于选择实体店的概率;
(2)若从这10名购物者中随机抽取3名,设X表示抽到倾向于选择网购的男性购物者的人数,求X的分布列和数学期望.
解:(1)设“随机抽取2名,其中男、女各一名,至少1名倾向于选择实体店”为事件A,则表示事件“随机抽取2名,其中男、女各一名,都倾向于选择网购”,
则P(A)=1-P()=1-=.
(2)X所有可能的取值为0,1,2,3,
且P(X=k)=,
则P(X=0)=,P(X=1)=,P(X=2)=,
P(X=3)=.
所以X的分布列为:
X | 0 | 1 | 2 | 3 |
P |
E(X)=0×+1×+2×+3×=.
2.张老师开车上班,有路线①与路线②两条路线可供选择.
路线①:沿途有A,B两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若A处遇红灯或黄灯,则导致延误时间2分钟;若B处遇红灯或黄灯,则导致延误时间3分钟;若两处都遇绿灯,则全程所花时间为20分钟.
路线②:沿途有a,b两处独立运行的交通信号灯,且两处遇到绿灯的概率依次为,,若a处遇红灯或黄灯,则导致延误时间8分钟;若b处遇红灯或黄灯,则导致延误时间5分钟;若两处都遇绿灯,则全程所花时间为15分钟.
(1)若张老师选择路线①,求他20分钟能到校的概率;
(2)为使张老师日常上班途中所花时间较少,你建议张老师选择哪条路线?并说明理由.
解:(1)走路线①,20分钟能到校意味着张老师在A,B两处均遇到绿灯,记该事件发生的概率为P,则P=×=.
(2)设选择路线①的延误时间为随机变量ξ,则ξ的所有可能取值为0,2,3,5.
则P(ξ=0)=×=,P(ξ=2)=×=,
P(ξ=3)=×=,P(ξ=5)=×=.
ξ的数学期望E(ξ)=0×+2×+3×+5×=2.
设选择路线②的延误时间为随机变量η,则η的所有可能取值为0,8,5,13.
则P(η=0)=×=,P(η=8)=×=,
P(η=5)=×=,P(η=13)=×=.
η的数学期望E(η)=0×+8×+5×+13×=5.
因此选择路线①平均所花时间为20+2=22分钟,选择路线②平均所花时间为15+5=20分钟,
所以为使张老师日常上班途中所花时间较少,建议张老师选择路线②.
突破点三 均值、方差与统计案例的综合问题
[典例] (2019·湖南湘东五校联考)已知具有相关关系的两个变量x,y之间的几组数据如下表所示:
x | 2 | 4 | 6 | 8 | 10 |
y | 3 | 6 | 7 | 10 | 12 |
(1)请根据上表数据绘制散点图;
(2)请根据上表提供的数据,求出y关于x的线性回归方程=x+,并估计当x=20时y的值;
(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列及数学期望.
参考公式:=,=-.
[解] (1)散点图如图所示.
(2)依题意得,=×(2+4+6+8+10)=6,=×(3+6+7+10+12)=7.6,
=4+16+36+64+100=220,iyi=6+24+42+80+120=272,
===1.1,
所以=7.6-1.1×6=1,
所以线性回归方程为=1.1x+1,
故当x=20时,=23.
(3)可以判断,落在直线2x-y-4=0右下方的点的坐标满足2x-y-4>0,
所以符合条件的点的坐标为(6,7),(8,10),(10,12),
故ξ的所有可能取值为1,2,3.
P(ξ=1)==,
P(ξ=2)===,
P(ξ=3)==,
故ξ的分布列为
ξ | 1 | 2 | 3 |
P |
E(ξ)=1×+2×+3×==.
[方法技巧]
解决此类问题的关键是读懂题意,从已知条件给出的图表中准确获取数据信息, 再根据相关公式正确计算并分析得出结论.
[针对训练]
社会公众人物的言行在一定程序上影响着年轻人的人生观、价值观.某媒体机构为了了解大学生对影星、歌星以及著名主持人方面的新闻(简称“星闻”)的关注情况,随机调查了某大学的200位大学生,得到信息如下表:
| 男大学生 | 女大学生 |
不关注“星闻” | 80 | 40 |
关注“星闻” | 40 | 40 |
(1)从所抽取的200人内关注“星闻”的大学生中,再抽取3人做进一步调查,求这3人性别不全相同的概率;
(2)是否有95%以上的把握认为关注“星闻”与性别有关?并说明理由;
(3)把以上的频率视为概率,若从该大学被调查的男大学生中随机抽取4人,设这4人中关注“星闻”的人数为ξ,求ξ的分布列及数学期望.
附:K2=,n=a+b+c+d.
P(K2≥k0) | 0.050 | 0.010 | 0.001 |
k0 | 3.841 | 6.635 | 10.828 |
解:(1)由已知得,所求概率P=1-=.
(2)由于K2的观测值k==≈5.556>3.841,
故有95%以上的把握认为关注“星闻”与性别有关.
(3)由题意可得,从被调查的男大学生中抽取一位关注“星闻”的男大学生的概率为=,不关注“星闻”的概率为.ξ的所有可能取值为0,1,2,3,4.
P(ξ=0)=4=;P(ξ=1)=C××3=;P(ξ=2)=C×2×2==;P(ξ=3)=C×3×=;P(ξ=4)=4=.
所以ξ的分布列为
ξ | 0 | 1 | 2 | 3 | 4 |
P |
因为ξ~B,所以E(ξ)=.