高考数学二轮复习高考大题规范解答系列六_概率与统计含解析
展开高考大题规范解答系列(六)——概率与统计
考点一 离散型随机变量的分布列与期望
例1 (2021·山西联考)已知甲盒中有三个白球和三个红球,乙盒中仅装有三个白球,球除颜色外完全相同.现从甲盒中任取三个球放入乙盒中.
(1)求乙盒中红球个数X的分布列与期望;
(2)求从乙盒中任取一球是红球的概率.
【标准答案】——规范答题 步步得分
(1)由题意知X的可能取值为0,1,2,3.
P(X=0)==,P(X=1)==,···························2分
P(X=2)==,P(X=3)==,···························4分
所以X的分布列为
X | 0 | 1 | 2 | 3 |
P |
··················································5分
所以E(X)=0×+1×+2×+3×=.·······················6分
(2)当乙盒中红球个数为0时,P1=0,·····················7分
当乙盒中红球个数为1时,P2=×=,·····················8分
当乙盒中红球个数为2,P3=×=,·······················9分
当乙盒中红球个数为3时,P4=×=,·····················10分
所以从乙盒中任取一球是红球的概率为P1+P2+P3+P4=.·····12分
【评分细则】
(1)第一问中,正确算出P(X=0),P(X=1),P(X=2),P(X=3)各得1分,列出分布列得1分,求出期望得1分.
(2)第二问中,分类讨论,每种情况各占1分.
(3)其他方法按步骤酌情给分.
例2 (2019·课标Ⅰ,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈,则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈,则乙药得1分,甲药得-1分;若都治愈或都未治愈,则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
①证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
②求p4,并根据p4的值解释这种试验方案的合理性.
【标准答案】——规范答题 步步得分
(1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)·(1-β),
P(X=1)=α(1-β).
所以X的分布列为
X | -1 | 0 | 1 |
P | (1-α)β | αβ+(1-α)(1-β) | α(1-β) |
···················································4分
(2)①由(1)得a=0.4,b=0.5,c=0.1.·····················5分
因此pi=0.4Pi-1+0.5pi+0.1pi+1,
故0.1(pi+1-pi)=0.4(pi-pi-1),
即pi+1-pi=4(pi-pi-1).·····························6分
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列. 7分
②由①可得
p8=p8-p7+p7-p6+…+p1-p0+p0
=(p8-p7)+(p7-p6)+…+(p1-p0)=p1.
由于p8=1,故p1=,
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)
=p1=.·············································10分
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9, 11分
此时得出错误结论的概率非常小,说明这种试验方案合理.·······12分
【评分细则】
①每个式子1分,表格1分;给出X的可能取值给1分;
②得出a、b、c的值(有正确的)得1分;
③得到Pi+1-Pi=4(Pi-Pi-1)得1分;
④给出结论得1分;
⑤得出P8,P4,P1的表达式各得1分;
⑥说明P4非常小得1分;
⑦说明实验方案合理得1分.
【名师点评】
1.核心素养:本题主要考查相互独立事件的概率、随机变量的期望、方差的应用、二项分布、决策问题等,考查数据处理能力、运算求解能力,考查或然与必然思想,考查的核心素养的逻辑推理、数学建模、数学运算、数据分析.
2.解题技巧:破解此类题的关键:一是认真读题,读懂题意;二是会利用导数求最值;三是会利用公式求服从特殊分布的离散型随机变量的期望值;四是会利用期望值,解决决策型问题.
〔变式训练1〕
(2021·湖南五市十校教研教改共同体联考)某学校为了了解学生对新冠病毒的传播和预防知识的掌握情况,学校决定组织一次有关新冠病毒预防知识竞答.竞答分为必答题(共5题)和选答题(共2题)两部分.每位同学答题相互独立,且每道题答对与否互不影响.已知甲同学答对每道必答题的概率为,答对每道选答题的概率为.
(1)求甲恰好答对4道必答题的概率;
(2)在选答阶段,若选择回答且答对奖励5分,答错扣2分,选择放弃回答得0分.已知甲同学对于选答的两道题,选择回答和放弃回答的概率均为,试求甲同学在选答题阶段,得分X的分布列.
[解析] (1)甲恰好答对4道必答题的概率为
P=C4×=.
(2)依题意,每道题选择回答并答对的概率为×=,
选择回答且答错的概率为×=,
选择放弃回答的概率为.
甲得分的可能性为-4分,-2分,0分,3分,5分和10分.
所以P(X=-4)=,
P(X=-2)=C××=,
P(X=0)=×=,
P(X=3)=C×××=,
P(X=5)=C××=,
P(X=10)=××2=.
所以X的分布列为
X | -4 | -2 | 0 | 3 | 5 | 10 |
P |
考点二 线性回归分析
例3 (2018·全国2)下图是某地区2000年至2016年环境基础设施投资y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①;=-30.4+13.5t,根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【分析】 (1)模型①中取t=19,模型②中取t=9,求出对应的函数值即可;(2)利用所给折线图中数据的增长趋势,加以分析即可.
【标准答案】——规范答题 步步得分
(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=-30.4+13.5×19=226.1(亿元).······················3分
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).··························6分
(2)利用模型②得到的预测值更可靠.
··················································8分
理由如下:
(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)
··················································12分
【评分细则】
①根据模型①求出预测值给3分;
②根据模型②求出预测值给3分;
③判断模型②得到的预测值更可靠给2分;
④作出正确的判断,写出合理理由,给4分;
【名师点评】
1.核心素养:本题主要考查线性回归方程的实际应用,考查考生的应用意识,分析问题与解决问题的能力以及运算求解能力,考查数学的核心素养是数据分析、数学建模、数学运算.
2.解题技巧:统计中涉及的图形较多、常见的有条形统计图、折线图、茎叶图、频率分布直方图、应熟练地掌握这些图形的特点,提高识图与用图的能力.
〔变式训练2〕
(2021·安徽蚌埠质检)经销商小王对其所经营的某一型号二手汽车的使用年数x(0<x≤10,x∈N)与每辆的销售价格y(单位:万元)进行整理,得到如表的对应数据:
使用年数 | 2 | 4 | 6 | 8 | 10 |
售价 | 16 | 13 | 9.5 | 7 | 4.5 |
(1)试求y关于x的回归直线方程;
(2)已知每辆该型号汽车的收购价格ω(单位:万元)与使用年数x(0<x≤10,x∈N)的函数关系为ω=0.05x2-1.75x+17.2,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润z最大.
附:回归直线的斜率和截距的最小二乘估计公式分别为=,=- .
[解析] (1)由表中数据,得=×(2+4+6+8+10)=6,
=×(16+13+9.5+7+4.5)=10,
由最小二乘法得
==-1.45,
=10-(-1.45)×6=18.7,
所以y关于x的回归直线方程为y=-1.45x+18.7.
(2)由题意,z=y-ω
=-1.45x+18.7-(0.05x2-1.75x+17.2)
=-0.05x2+0.3x+1.5,
其中0<x≤10,且x∈N,
z=-0.05x2+0.3x+1.5
=-0.05(x-3)2+1.95,
所以预测x=3时,销售一辆该型号汽车所获得的利润最大.
考点三 独立性检验
例4 (2018·课标全国Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
| 超过m | 不超过m |
第一种生产方式 |
|
|
第二种生产方式 |
|
|
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=.
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
【分析】 (1)根据茎叶图中的数据大致集中在哪个茎,作出判断;
(2)通过茎叶图确定数据的中位数,按要求完成2×2列联表;
(3)根据(2)中2×2列联表,将有关数据代入公式计算得K2的值,借助临界值表作出统计推断.
【标准答案】——规范答题 步步得分
(1)第二种生产方式的效率更高.·························4分
理由如下:
(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.
(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.
(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.
(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多.关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.
(2)由茎叶图知m==80.·······························6分
列联表如下:
| 超过m | 不超过m |
第一种生产方式 | 15 | 5 |
第二种生产方式 | 5 | 15 |
··················································8分
(3)由于K2==10>6.635,······························11分
所以有99%的把握认为两种生产方式的效率有差异.
··················································12分
【评分细则】
①答案给出了4种理由,考生答出任意一种或其他合理理由,均给4分;
②由茎叶图求出中位数,给2分;
③按要求完成2×2列联表,给2分;
④根据公式正确求出K2的值,给3分;
⑤借助于临界值表作出判断,给1分.
【名师点评】
1.核心素养:茎叶图及独立性检验是高考命题的重点,在每年的高考试题都以不同的命题背景进行命制.此类问题主要考查学生的分析问题和解决实际问题的能力,同时考查“数据分析”的数学核心素养.
2.解题技巧:(1)审清题意:弄清题意,理顺条件和结论;
(2)找数量关系:把图形语言转化为数字,找关键数量关系;
(3)建立解决方案:找准公式,将2×2列联表中的数值代入公式计算;
(4)作出结论:依据数据,借助临界值表作出正确判断.
〔变式训练3〕
(2021·湖南百校联考)2020年3月受新冠肺炎疫情的影响,我市全体学生只能网上在线学习.为了了解学生在线学习的情况,市教研院数学教研室随机从市区各高中学校抽取60名学生对线上教学情况进行调查(其中男生与女生的人数之比为2:1),结果发现男生中有10名对线上教学满意,女生中有12名对线上教学不满意.
(1)请完成如下2×2列联表,并回答能否有90%的把握认为“对线上教学是否满意与性别有关”;
| 满意 | 不满意 | 合计 |
男生 |
|
|
|
女生 |
|
|
|
合计 |
|
| 60 |
(2)以这60名学生对线上教学的态度的频率作为1名学生对线上教学的态度的概率,若从全市学生中随机抽取3人,设这3人中对线上教学满意的人数为X,求随机变量X的分布列与数学期望.
附:参考公式及临界值表
K2=,其中n=a+b+c+d.
P(K2>k0) | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.706 | 3.841 | 5.024 | 6.635 |
[解析] (1)由题意可知抽取60名学生中男生有40人,女生有20人,则列联表如下:
| 满意 | 不满意 | 合计 |
男生 | 10 | 30 | 40 |
女生 | 8 | 12 | 20 |
合计 | 18 | 42 | 60 |
因为K2==≈1.429<2.706,
所以没有90%的把握认为“对线上教学是否满意与性别有关”.
(2)X的可能取值为0,1,2,3,由题意可知,X~B,
P(X=k)=Ck3-k,k=0,1,2,3,
随机变量X的分布列为
X | 0 | 1 | 2 | 3 |
P |
E(X)=3×=.
考点四 正态分布
例5 国庆70周年阅兵式上的女兵们是一道靓丽的风景线,每一名女兵都是经过层层筛选才最终入选受阅方队,筛选标准非常严格,例如要求女兵身高(单位:cm)在区间[165,175]内.现从全体受阅女兵中随机抽取200人,对她们的身高进行统计,将所得数据分为[165,167),[167,169),[169,171),[171,173),[173,175]五组,得到如图所示的频率分布直方图,其中第三组的频数为75,最后三组的频率之和为0.7.
(1)请根据频率分布直方图估计样本的平均数和方差s2(同一组中的数据用该组区间的中点值代表);
(2)根据样本数据,可认为受阅女兵的身高X(cm)近似服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2.
(ⅰ)求P(167.86<X<174.28);
(ⅱ)若从全体受阅女兵中随机抽取10人,求这10人中至少有1人的身高在174.28 cm以上的概率.
参考数据:若X~N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 6,P(μ-2σ<X<μ+2σ)=0.954 4,≈10.7,0.954 410≈0.63,0.977 29≈0.81,0.977 210≈0.79.
[解析] (1)由题知五组频率依次为0.1,0.2,0.375,0.25,0.075,1分
故=0.1×166+0.2×168+0.375×170+0.25×172+0.075×174=170,2分
s2=(170-166)2×0.1+(170-168)2×0.2+(170-172)2×0.25+(170-174)2×0.075=4.6;4分
(2)由题知μ=170,
σ==≈2.14,5分
(ⅰ)P(167.86<X<174.28)=P(μ-σ<X<μ+2σ)=0.682 6+=0.818 5,8分
(ⅱ)P(X>174.28)==0.022 8,
故10人中至少有1人的身高在174.28 cm以上的概率
P=1-(1-0.022 8)10=1-0.977 210≈1-0.79=0.21.12分
〔变式训练4〕
(2021·贵州遵义模拟)3D打印通常是采用数字技术材料打印机来实现的,常在模具制造、工业设计等领域被用于制造模型,后逐渐用于一些产品的直接制造,已经有使用这种技术打印而成的零部件.该技术应用十分广泛,可以预计在未来会有广阔的发展空间,某制造企业向A高校3D打印实验团队租用一台3D打印设备,用于打印一批对内径有较高精度要求的零件.该团队在实验室打印出了一批这样的零件,从中随机抽取10件零件,度量其内径的茎叶图如图所示(单位:μm).
(1)计算平均值μ与标准差σ;
(2)假设这台3D打印设备打印出的零件内径Z服从正态分布N(μ,σ2),该团队到工厂安装调试后,试打了5个零件,度量其内径分别为:86,95,103,109,118(单位:μm),试问:此打印设备是否需要进一步调试,为什么?
参考数据:P(μ-2σ<Z<μ+2σ)=0.954 4,
P(μ-3σ<Z<μ+3σ)=0.997 4,
0.954 43=0.87, 0.997 44=0.99,
0.045 62=0.002.
[解析] (1)
μ=
=105 μm,
σ2=
=36,
所σ=6μm.
(2)结论:需要进一步调试.
理由如下:如果机器正常工作,则Z服从正态分布N(105,62),
P(μ-3σ<Z<μ+3σ)=P(87<Z<123)=0.997 4,
零件内径在(87,123)之外的概率只有0.002 6,
而86∉(87,123),根据3σ原则知机器异常,需要进一步调试.(还可有其它解释,合理即可)
考点五 *概率、统计与函数、数列、不等式的综合
例6 (2021·百师联盟期末)出版商为了解某科普书一个季度的销售量y(单位:千本)和利润x(单位:元/本)之间的关系,对近年来几次调价之后的季销售量进行统计分析,得到如下的10组数据.
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
x | 2.4 | 3.1 | 4.6 | 5.3 | 6.4 | 7.1 | 7.8 | 8.8 | 9.5 | 10 |
y | 18.1 | 14.1 | 9.1 | 7.2 | 4.9 | 3.9 | 3.2 | 2.3 | 2.1 | 1.4 |
根据上述数据画出如图所示的散点图:
(1)根据图中所示的散点图判断y=ax+b和y=cln x+d哪个更适宜作为销售量y关于利润x的回归方程类型?(给出判断即可,不需要说明理由);
(2)根据(1)中的判断结果及参考数据,求出y关于x的回归方程;
(3)根据回归方程分析:设该科普书一个季度的利润总额为z(单位:千元),当季销售量y为何值时,该书一个季度的利润总额预报值最大?(季利润总额=季销售量×每本书的利润)
参考公式及参考数据:
①对于一组数据(u1,ν1),(u2,ν2),…,(un,νn),其回归直线ν=+u的斜率和截距的公式分别为=,=-.
②参考数据:
(xi-)2 | (ui-)2 | (xi-) (yi-) | (ui-) (yi-) | |||
6.50 | 6.63 | 1.75 | 82.50 | 2.70 | -143.25 | -27.54 |
表中ui=ln xi,= ui.
另:ln 4.06≈1.40.计算时,所有的小数都精确到0.01.
[解析] (1)y=cln x+d更适宜作为销售量y关于利润x的回归方程类型.
(2)令u=ln x,先建立y关于u的线性回归方程,
由于===-10.20,
=-·=6.63+10.20×1.75=24.48,
所以y关于u的线性回归方程为
=24.48-10.20u,
即y关于x的回归方程为
=24.48-10.20ln x.
(3)由题意得
z=xy=x(24.48-10.20ln x),
z′=[x(24.48-10.20ln x)]′
=14.28-10.20ln x,
令z′=0即14.28-10.20ln x=0,
解得ln x=1.40,所以x≈4.06.
当x∈(0,4.06)时,z′>0,
所以z在(0,4.06)上单调递增,
当x∈(4.06,+∞)时,z′<0,
所以z在(4.06,+∞)上单调递减,
所以当x=4.06时,即季销量y=10.20千本时,季利润总额预报值最大.
〔变式训练5〕
(2021·河北省部分重点高中期末联考)11月,2019全国美丽乡村篮球大赛在中国农村改革的发源地——安徽凤阳举办,其间甲、乙两人轮流进行篮球定点投篮比赛(每人各投一次为一轮).在相同的条件下,每轮甲乙两人站在同一位置,甲先投,每人投一次球,两人有1人命中,命中者得1分,未命中者得-1分;两人都命中或都未命中,两人均得0分.设甲每次投球命中的概率为,乙每次投球命中的概率为,且各次投球互不影响.
(1)经过1轮投球,记甲的得分为X,求X的分布列;
(2)若经过n轮投球,用pi表示经过第i轮投球,累计得分,甲的得分高于乙的得分的概率.
①求p1,p2,p3;
②规定p0=0,经过计算机计算可估计得pi=api+1+bpi+cpi-1(b≠1),请根据①中p1,p2,p3的值分别写出a,c关于b的表达式,并由此求出数列{pn}的通项公式.
[解析] (1)X的可能取值为-1,0,1.
P(X=-1)=×=,
P(X=0)=×+×=,
P(X=1)=×=.
∴X的分布列为
X | -1 | 0 | 1 |
P |
(2)①由(1)知,P1=,
经过两轮投球甲的累计得分高有两种情况:一是两轮甲各得1分;二是两轮有一轮甲得0分,有一轮甲得1分,
∴P2=×+C××=.
经过三轮投球,甲的累计得分高有四种情况:一是三轮甲各得1分;二是三轮有两轮各得1分,一轮得0分;三是1轮得1分,两轮各得0分;四是两轮各得1分,1轮得-1分,
∴P3=3+C2×+C××2+C2×=.
②由pi=api+1+bpi+cpi-1,
知pi=pi+1+pi-1,
将p0=0,p1=,p2=,p3=代入,
求得=,=,
∴a=(1-b),c=(1-b),
∴pi=pi+1+pi-1,
pi+1=pi-pi-1.
∴pi+1-pi=(pi-pi-1),
∵p1-p0=,
∴{pn-pn-1}是等比数列,首项和公比都是,
pn-pn-1=,
∴pn=p0+(p1-p0)+(p2-p1)+…+(pn-pn-1)
==.
高考数学二轮复习高考大题规范解答系列二_三角函数含解析: 这是一份高考数学二轮复习高考大题规范解答系列二_三角函数含解析,共5页。
高考数学二轮复习高考大题规范解答系列五_解析几何含解析: 这是一份高考数学二轮复习高考大题规范解答系列五_解析几何含解析,共12页。
高考数学二轮复习高考大题规范解答系列四_立体几何含解析: 这是一份高考数学二轮复习高考大题规范解答系列四_立体几何含解析,共14页。