2019届二轮复习高考解答题突破(六) 概率与统计学案(全国通用)
展开高考解答题突破(六) 概率与统计
突破“两辨”——辨析、辨型
[思维流程]
[技法点拨]
概率与统计问题的求解关键是辨别它的模型,只要找到模型,问题便迎刃而解.而概率模型的提取往往需要经过观察、分析、归纳、判断等复杂的辨析思维过程,常常因题设条件理解不准,某个概念认识不清而误入歧途.另外,还需弄清楚概率模型中等可能事件、互斥事件、对立事件、独立事件等事件间的关系,注意放回和不放回试验的区别,合理划分复合事件.
考向一 离散型随机变量的均值与方差
在解决离散型随机变量的均值与方差的问题时,要善于将复杂事件分解为较简单事件,对照相关概率类型,如互斥事件类型、相互独立事件类型、古典概型等,然后用相关公式求解.
[解] (1)由频率分布直方图可知,日销售量不低于8吨的频率为2×(0.125+0.075)=0.4,记未来3天内,第i天日销售量不低于8吨为事件Ai(i=1,2,3),则P(Ai)=0.4,
=0.4×0.4×(1-0.4)+(1-0.4)×0.4×0.4=0.192.
(2)由(1)知,第i天日销售量不低于8吨的概率P(Ai)=0.4.
依题意,X的可能取值为0,1,2,3,
解决离散型随机变量的均值与方差的关键
(1)会判断,先判断事件的类型,再利用对立事件的概率公式、条件概率的公式等求解概率;
(2)会计算,要求随机变量X的期望,需先求出X的所有可能取值,然后求出随机变量X取每个值时的概率,再利用随机变量的数学期望的定义进行计算.
[对点训练]
1.(2018·山东潍坊一模)某公司新上一条生产线,为保证新的生产线正常工作,需对该生产线进行检测.现从该生产
线上随机抽取100件产品,测量产品数据,用统计方法得到样本的平均数μ=14,标准差σ=2,绘制如图所示的频率分布直方图.以频率值作为概率估计值.
(1)从该生产线加工的产品中任意抽取一件,记其数据为X,依据以下不等式评判(P表示对应事件的概率):
①P(μ-σ<X<μ+σ)≥0.6826;
②P(μ-2σ<X<μ+2σ)≥0.9544;
③P(μ-3σ<X<μ+3σ)≥0.9974,
评判规则:若至少满足以上两个不等式,则生产状况为优,无需检修;否则需检修生产线,试判断该生产线是否需要检修;
(2)将数据不在(μ-2σ,μ+2σ)内的产品视为次品,从该生产线加工的产品中任意抽取2件,次品数记为Y,求Y的分布列与数学期望E(Y).
[解] (1)由频率分布直方图可得:
P(12<X<16)=(0.29+0.11)×2=0.8>0.6826
P(10<X<18)=(0.04+0.29+0.11+0.03)×2=0.94<0.9544
P(8<X<20)=(0.005+0.04+0.29+0.11+0.03+0.015)×2=0.98<0.9974
∴符合①,不符合②③,故该生产线需要检修.
(2)100件产品中,次品个数为100×(1-0.94)=6,正品个数为94,
∴Y的所有可能取值为0,1,2,
其中P(Y=0)==,P(Y=1)==,P(Y=2)==.
∴Y的分布列为
Y | 0 | 1 | 2 |
P |
∴Y的数学期望为E(Y)=0×+1×+2×=.
考向二 线性回归分析与独立性检验
1.在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.
2.独立性检验的关键是根据2×2列联表准确计算出K2,再做判断.
[解题指导] →→→
[解] (1)记“至少有一个大于600”为事件A,
则P(A)=1-=.
==600.
∴=
==0.3,
=-=600-0.3×556=433.2,
故特征量x为570时,特征量y的估计值为604.2.
线性回归分析与独立性检验问题的关注点
(1)由回归方程分析得出的数据只是预测值不是精确值,此类问题的易错点是方程中的计算,代入公式计算要细心.
(2)独立性检验是指利用2×2列联表,通过计算随机变量K2来确定在多大程度上两个分类变量有关系的方法.
[对点训练]
2.(2018·山西太原模拟)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:分钟)进行调查,将收集的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图),将日均课外体育锻炼时间不低于40分钟的学生评价为“课外体育达标”.
(1)请根据直方图中的数据填写下面的2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?
| 课外体育不达标 | 课外体育达标 | 合计 |
男 | 60 |
|
|
女110 |
|
|
|
合计 |
|
|
|
(2)现按照“课外体育达标”与“课外体育不达标”进行分层抽样,抽取8人,再从这8名学生中随机抽取3人参加体育知识问卷调查,记“课外体育不达标”的人数为ξ,求ξ的分布列和数学期望.
附:K2=.
P(K2≥k0 | 0.15 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 2.072 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
[解] (1)由题意得“课外体育达标”人数为200×[(0.02+0.005)×10]=50,
则“课外体育不达标”人数为150,
∴列联表如下:
| 课外体育不达标 | 课外体育达标 | 合计 |
男 | 60 | 30 | 90 |
女 | 90 | 20 | 110 |
合计 | 150 | 50 | 200 |
∴K2==≈6.061<6.635.
∴在犯错误的概率不超过0.01的前提下不能认为“课外体育达标”与性别有关.
(2)由题意采用分层抽样在“课外体育达标”的学生中抽取2人,在“课外体育不达标”的学生中抽取6人,由题意知:ξ的所有可能取值为1,2,3,
P(ξ=1)===;
P(ξ=2)===;
P(ξ=3)===.
故ξ的分布列为
ξ | 1 | 2 | 3 |
P |
故ξ的数学期望为E(ξ)=1×+2×+3×=.
专题跟踪训练(三十一)
1.(2018·东北四校联考)一个袋中有大小、质地完全相同的4个红球和1个白球,共5个球,现从中每次随机取出2个球,若取出的有白球必须把白球放回去,红球不放回,然后取第二次,第三次,……,直到把红球取完只剩下1个白球为止.用ξ表示终止时取球的次数.
(1)求ξ=2的概率;
(2)求ξ的分布列及数学期望.
[解] (1)∵随机变量ξ=2表示从袋中随机取球2次且每次取的都是红球,∴P(ξ=2)=×=,即ξ=2的概率为.
(2)由题意知随机变量ξ的所有可能取值为2,3,4,由(1)知P(ξ=2)=.又P(ξ=4)=×××=,
∴P(ξ=3)==,
∴ξ的分布列为
ξ | 2 | 3 | 4 |
P |
E(ξ)=2×+3×+4×=.
2.(2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;
(2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;
(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k类电影得到人们喜欢,“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差D(ξ1),D(ξ2),D(ξ3),D(ξ4),D(ξ5),D(ξ6)的大小关系.
[解] (1)由题意知,样本电影的总部数是140+50+300+200+800+510=2000,
第四类电影中获得好评的电影部数是200×0.25=50.
故所求概率是=0.025.
(2)设事件A为“从第四类电影中随机选出的电影获得好评”,
事件B为“从第五类电影中随机选出的电影获得好评”.
故所求概率为P(A+B)=P(A)+P(B)=P(A)(1-P(B))+(1-P(A))P(B).
由题意知:P(A)估计为0.25,P(B)估计为0.2.
故所求概率估计为0.25×0.8+0.75×0.2=0.35.
(3)D(ξ1)>D(ξ4)>D(ξ2)=D(ξ5)>D(ξ3)>D(ξ6).
3.(2018·广州测试)某单位共10名员工,他们某年的收入如下表:
(1)求该单位员工当年年薪的平均值和中位数;
(2)从该单位中任取2人,此2人中年薪收入高于5万的人数记为ξ,求ξ的分布列和期望;
(3)已知员工年薪收入与工作年限成正线性相关关系,若某员工工作第一年至第四年的年薪分别为3万元,4.2万元,5.6万元,7.2万元,预测该员工第五年的年薪为多少?
附:线性回归方程=x+中系数计算公式=,=-,其中,表示样本均值.
[解] (1)平均值为10万元,中位数为6万元.
(2)年薪高于5万的有6人,低于或等于5万的有4人,ξ取值为0,1,2.
P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,
所以ξ的分布列为
ξ | 0 | 1 | 2 |
P |
数学期望为E(ξ)=0×+1×+2×=.
(3)设xi,yi(i=1,2,3,4)分别表示工作年限及相应年薪,则=2.5,=5
(xi-)2=2.25+0.25+0.25+2.25=5,
(xi-)(yi-)=-1.5×(-2)+(-0.5)×(-0.8)+0.5×0.6+1.5×2.2=7,
===1.4.
=-=5-1.4×2.5=1.5,
因此线性回归方程为=1.4x+1.5,
可预测该员工第5年的年薪收入约为8.5万元.
4.已知鸡的产蛋量与鸡舍的温度有关.为了确定某一个时段鸡舍的控制温度,某企业需要了解鸡舍的时段控制温度x(单位:℃)对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响.为此,该企业选取了7个鸡舍的时段控制温度xi和产蛋量yi(i=1,2,…7,)的数据,对数据初步处理后得到了如图所示的散点图及一些统计量的值.
其中ki=lnyi,=ki.
(1)根据散点图判断,y=bx+a与y=c1ec2x(e为自然对数的底数)哪一个适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断及表中的数据,建立y关于x的回归方程;
(3)已知时段投入成本z与x,y的关系为z=e-2.5y-0.1x+10,当鸡舍的时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值是多少?
附:对于一组具有线性相关关系的数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为
=,=-.
参考数据:
e-2.5 | e-0.75 | e | e3 | e7 |
0.08 | 0.47 | 2.72 | 20.09 | 1096.63 |
[解] (1)由题中散点图可以判断,y=c1ec2x适宜作为该种鸡的时段产蛋量y关于鸡舍的时段控制温度x的回归方程类型.
(2)令k=lny,建立k关于x的线性回归方程k=dx+c(d=c2,c=lnc1).由题意,得===0.25,=-=3.60-0.25×17.40=-0.75,
所以k关于x的线性回归方程为=0.25x-0.75,c2=0.25,c1=e-0.75=0.47,
故y关于x的回归方程为=0.47e0.25x.
(3)由(2)知,当x=28时,鸡的时段产蛋量y的预报值=0.47e0.25×28=0.47e7=0.47×1096.63≈515.42(t),
时段投入成本z的预报值=e-2.5×515.42-0.1×28+10=0.08×515.42-2.8+10≈48.43(万元).