所属成套资源:十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)原卷版+解析版
- 专题13 平面解析几何选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题14 平面解析几何解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题15 概率统计与计数原理选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题17 坐标系与参数方程-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
- 专题18 不等式选讲-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科) 试卷 0 次下载
专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)
展开
这是一份专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科),文件包含专题16概率统计解答题解析版docx、专题16概率统计解答题原卷版docx等2份试卷配套教学资源,其中试卷共89页, 欢迎下载使用。
大数据之十年高考真题(2013-2022)与优质模拟题(新高考卷与新课标理科卷)
专题16概率统计解答题
真题汇总命题趋势
1.【2022年全国甲卷理科19】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【答案】(1)0.6;
(2)分布列见解析,EX=13.
【解析】
(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为
P=PABC+PABC+PABC+PABC
=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2
=0.16+0.16+0.24+0.04=0.6.
(2)依题可知,X的可能取值为0,10,20,30,所以,
PX=0=0.5×0.4×0.8=0.16,
PX=10=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
PX=20=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
PX=30=0.5×0.6×0.2=0.06.
即X的分布列为
X
0
10
20
30
P
0.16
0.44
0.34
0.06
期望EX=0×0.16+10×0.44+20×0.34+30×0.06=13.
2.【2022年全国乙卷理科19】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得i=110xi2=0.038,i=110yi2=1.6158,i=110xiyi=0.2474.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=i=1n(xi−x)(yi−y)i=1n(xi−x)2i=1n(yi−y)2,1.896≈1.377.
【答案】(1)0.06m2;0.39m3
(2)0.97
(3)1209m3
【解析】
(1)样本中10棵这种树木的根部横截面积的平均值x=0.610=0.06
样本中10棵这种树木的材积量的平均值y=3.910=0.39
据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,
平均一棵的材积量为0.39m3
(2)r=i=110(xi−x)(yi−y)i=110(xi−x)2i=110(yi−y)2=i=110xiyi−10xyi=110xi2−10x2i=110yi2−10y2
=0.2474−10×0.06×0.39(0.038−10×0.062)(1.6158−10×0.392)=0.01340.0001896≈0.01340.01377≈0.97
则r≈0.97
(3)设该林区这种树木的总材积量的估计值为Ym3,
又已知树木的材积量与其根部横截面积近似成正比,
可得0.060.39=186Y,解之得Y=1209m3.
则该林区这种树木的总材积量估计为1209m3
3.【2022年新高考1卷20】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:
不够良好
良好
病例组
40
60
对照组
10
90
(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?
(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.P(B|A)P(B|A)与P(B|A)P(B|A)的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.
(ⅰ)证明:R=P(A|B)P(A|B)⋅P(A|B)P(A|B);
(ⅱ)利用该调查数据,给出P(A|B),P(A|B)的估计值,并利用(ⅰ)的结果给出R的估计值.
附K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
PK2≥k
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)答案见解析
(2)(i)证明见解析;(ii)R=6;
【解析】
(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,
又P(K2≥6.635)=0.01,24>6.635,
所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.
(2)(i)因为R=P(B|A)P(B|A)⋅P(B|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB)⋅P(AB)P(A)⋅P(A)P(AB),
所以R=P(AB)P(B)⋅P(B)P(AB)⋅P(AB)P(B)⋅P(B)P(AB)
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B),
(ii) 由已知P(A|B)=40100,P(A|B)=10100,
又P(A|B)=60100,P(A|B)=90100,
所以R=P(A|B)P(A|B)⋅P(A|B)P(A|B)=6
4.【2022年新高考2卷19】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:
(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);
(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;
(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).
【答案】(1)44.65岁;
(2)0.89;
(3)0.0014.
【解析】
(1)平均年龄x=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023
+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).
(2)设A={一人患这种疾病的年龄在区间[20,70)},所以
P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.
(3)设B={任选一人年龄位于区间[40,50),C={任选一人患这种疾病},
则由条件概率公式可得
P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.
5.【2021年全国甲卷理科17】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品
二级品
合计
甲机床
150
50
200
乙机床
120
80
200
合计
270
130
400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1)75%;60%;
(2)能.
(1)甲机床生产的产品中的一级品的频率为150200=75%,
乙机床生产的产品中的一级品的频率为120200=60%.
(2)K2=400(150×80−120×50)2270×130×200×200=40039>10>6.635,
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
6.【2021年新高考1卷18】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【答案】(1)见解析;(2)B类.
(1)由题可知,X的所有可能取值为0,20,100.
P(X=0)=1−0.8=0.2;
P(X=20)=0.8(1−0.6)=0.32;
P(X=100)=0.8×0.6=0.48.
所以X的分布列为
X
0
20
100
P
0.2
0.32
0.48
(2)由(1)知,E(X)=0×0.2+20×0.32+100×0.48=54.4.
若小明先回答B问题,记Y为小明的累计得分,则Y的所有可能取值为0,80,100.
P(Y=0)=1−0.6=0.4;
P(Y=80)=0.6(1−0.8)=0.12;
P(X=100)=0.8×0.6=0.48.
所以E(Y)=0×0.4+80×0.12+100×0.48=57.6.
因为54.41,则p1+2p2+3p3>1,故p2+2p3>p0.
此时f'(0)=−(p2+p0+p3)6.635,
因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.
14.【2019年新课标3理科17】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
【答案】解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,
根据直方图得到P(C)的估计值为0.70.
则由频率分布直方图得:
a+0.20+0.15=0.70.05+b+0.15=1−0.7,
解得乙离子残留百分比直方图中a=0.35,b=0.10.
(2)估计甲离子残留百分比的平均值为:
x甲=2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值为:
x乙=3×0.05+4×0.1+5×0.15+6×0.35+7×0.2+8×0.15=6.
15.【2019年全国新课标2理科18】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
【答案】解:(1)设双方10:10平后的第k个球甲获胜为事件Ak(k=1,2,3,…),
则P(X=2)=P(A1A2)+P(A1A2)
=P(A1)P(A2)+P(A1)P(A2)
=0.5×0.4+0.5×0.6=0.5.
(2)P(X=4且甲获胜)=P(A1A2A2A4)+P(A1A2A3A4)
=P(A1)P(A2)P(A3)P(A4)+P(A1)P(A2)P(A3)P(A4)
=(0.5×0.4+0.5×0.6)×0.5×0.4=0.1.
16.【2019年新课标1理科21】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得﹣1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得﹣1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api﹣1+bpi+cpi+1(i=1,2,…,7),其中a=P(X=﹣1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.
(i)证明:{pi+1﹣pi}(i=0,1,2,…,7)为等比数列;
(ii)求p4,并根据p4的值解释这种试验方案的合理性.
【答案】(1)解:X的所有可能取值为﹣1,0,1.
P(X=﹣1)=(1﹣α)β,P(X=0)=αβ+(1﹣α)(1﹣β),P(X=1)=α(1﹣β),
∴X的分布列为:
X
﹣1
0
1
P
(1﹣α)β
αβ+(1﹣α)(1﹣β)
α(1﹣β)
(2)(i)证明:∵α=0.5,β=0.8,
∴由(1)得,a=0.4,b=0.5,c=0.1.
因此pi=0.4pi﹣1+0.5pi+0.1pi+1(i=1,2,…,7),
故0.1(pi+1﹣pi)=0.4(pi﹣pi﹣1),即(pi+1﹣pi)=4(pi﹣pi﹣1),
又∵p1﹣p0=p1≠0,∴{pi+1﹣pi}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列;
(ii)解:由(i)可得,
p8=(p8﹣p7)+(p7﹣p6)+…+(p1﹣p0)+p0=p1(1−48)1−4=48−13P1,
∵p8=1,∴p1=348−1,
∴P4=(p4﹣p3)+(p3﹣p2)+(p2﹣p1)+(p1﹣p0)+p0=44−13p1=1257.
P4表示最终认为甲药更有效的概率.
由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为P4=1257≈0.0039,此时得出错误结论的概率非常小,说明这种试验方案合理.
17.【2018年新课标1理科20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.
(1)记20件产品中恰有2件不合格品的概率为f(p),求f (p)的最大值点p0.
(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.
(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;
(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?
【答案】解:(1)记20件产品中恰有2件不合格品的概率为f(p),
则f(p)=C202p2(1−p)18,
∴f'(p)=C202[2p(1−p)18−18p2(1−p)17]=2C202p(1−p)17(1−10p),
令f′(p)=0,得p=0.1,
当p∈(0,0.1)时,f′(p)>0,
当p∈(0.1,1)时,f′(p)<0,
∴f (p)的最大值点p0=0.1.
(2)(i)由(1)知p=0.1,
令Y表示余下的180件产品中的不合格品数,依题意知Y~B(180,0.1),
X=20×2+25Y,即X=40+25Y,
∴E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.
(ii)如果对余下的产品作检验,由这一箱产品所需要的检验费为400元,
∵E(X)=490>400,
∴应该对余下的产品进行检验.
18.【2018年新课标2理科18】如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:y^=−30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【答案】解:(1)根据模型①:y^=−30.4+13.5t,
计算t=19时,y^=−30.4+13.5×19=226.1;
利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;
根据模型②:y^=99+17.5t,
计算t=9时,y^=99+17.5×9=256.5;.
利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;
(2)模型②得到的预测值更可靠;
因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,
而从2000年到2009年间递增的幅度较小些,
从2010年到2016年间递增的幅度较大些,
所以,利用模型②的预测值更可靠些.
19.【2018年新课标3理科18】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:
超过m
不超过m
第一种生产方式
第二种生产方式
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】解:(1)根据茎叶图中的数据知,
第一种生产方式的工作时间主要集中在72~92之间,
第二种生产方式的工作时间主要集中在65~85之间,
所以第二种生产方式的工作时间较少些,效率更高;
(2)这40名工人完成生产任务所需时间按从小到大的顺序排列后,
排在中间的两个数据是79和81,计算它们的中位数为m=79+812=80;
由此填写列联表如下;
超过m
不超过m
总计
第一种生产方式
15
5
20
第二种生产方式
5
15
20
总计
20
20
40
(3)根据(2)中的列联表,计算
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=40×(15×15−5×5)220×20×20×20=10>6.635,
∴能有99%的把握认为两种生产方式的效率有差异.
20.【2017年新课标1理科19】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布N(μ,σ2).
(1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在(μ﹣3σ,μ+3σ)之外的零件数,求P(X≥1)及X的数学期望;
(2)一天内抽检零件中,如果出现了尺寸在(μ﹣3σ,μ+3σ)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)试说明上述监控生产过程方法的合理性;
(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得x=116i=116 xi=9.97,s=116i=116 (xi−x)2=116(i=116 xi2−16x2)≈0.212,其中xi为抽取的第i个零件的尺寸,i=1,2,…,16.
用样本平均数x作为μ的估计值μ̂,用样本标准差s作为σ的估计值σ̂,利用估计值判断是否需对当天的生产过程进行检查?剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据,用剩下的数据估计μ和σ(精确到0.01).
附:若随机变量Z服从正态分布N(μ,σ2),则P(μ﹣3σ<Z<μ+3σ)=0.9974,0.997416≈0.9592,0.008≈0.09.
【答案】解:(1)由题可知尺寸落在(μ﹣3σ,μ+3σ)之内的概率为0.9974,
则落在(μ﹣3σ,μ+3σ)之外的概率为1﹣0.9974=0.0026,
因为P(X=0)=C160×(1﹣0.9974)0×0.997416≈0.9592,
所以P(X≥1)=1﹣P(X=0)=0.0408,
又因为X~B(16,0.0026),
所以E(X)=16×0.0026=0.0416;
(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种状况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.
(ⅱ)由x=9.97,s≈0.212,得μ的估计值为μ̂=9.97,σ的估计值为σ̂=0.212,由样本数据可以看出一个
零件的尺寸在(μ̂−3σ̂,μ̂+3σ̂)之外,因此需对当天的生产过程进行检查.
剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据9.22,剩下的数据的平均数为
115(16×9.97﹣9.22)=10.02,
因此μ的估计值为10.02.
i=116 xi2=16×0.2122+16×9.972≈1591.134,
剔除(μ̂−3σ̂,μ̂+3σ̂)之外的数据9.22,剩下的数据的样本方差为
115(1591.134﹣9.222﹣15×10.022)≈0.008,
因此σ的估计值为0.008≈0.09.
21.【2017年新课标2理科18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:
(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:
箱产量<50kg
箱产量≥50kg
旧养殖法
新养殖法
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d).
【答案】解:(1)记B表示事件“旧养殖法的箱产量低于50kg”,C表示事件“新养殖法的箱产量不低于50kg”,
由P(A)=P(BC)=P(B)P(C),
则旧养殖法的箱产量低于50kg:(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估计值0.62,
新养殖法的箱产量不低于50kg:(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估计值为,
则事件A的概率估计值为P(A)=P(B)P(C)=0.62×0.66=0.4092;
∴A发生的概率为0.4092;
(2)2×2列联表:
箱产量<50kg
箱产量≥50kg
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
则K2=200(62×66−38×34)2100×100×96×104≈15.705,
由15.705>6.635,
∴有99%的把握认为箱产量与养殖方法有关;
(3)由新养殖法的箱产量频率分布直方图中,箱产量低于50kg的直方图的面积:
(0.004+0.020+0.044)×5=0.34,
箱产量低于55kg的直方图面积为:
(0.004+0.020+0.044+0.068)×5=0.68>0.5,
故新养殖法产量的中位数的估计值为:50+0.5−0.340.068≈52.35(kg),
新养殖法箱产量的中位数的估计值52.35(kg).
22.【2017年新课标3理科18】某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:
最高气温
[10,15)
[15,20)
[20,25)
[25,30)
[30,35)
[35,40)
天数
2
16
36
25
7
4
以最高气温位于各区间的频率代替最高气温位于该区间的概率.
(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;
(2)设六月份一天销售这种酸奶的利润为Y(单位:元),当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?
【答案】解:(1)由题意知X的可能取值为200,300,500,
P(X=200)=2+1690=0.2,
P(X=300)=3690=0.4,
P(X=500)=25+7+490=0.4,
∴X的分布列为:
X
200
300
500
P
0.2
0.4
0.4
(2)由题意知这种酸奶一天的需求量至多为500瓶,至少为200瓶,
∴只需考虑200≤n≤500,
当300≤n≤500时,
若最高气温不低于25,则Y=6n﹣4n=2n;
若最高气温位于区间[20,25),则Y=6×300+2(n﹣300)﹣4n=1200﹣2n;
若最高气温低于20,则Y=6×200+2(n﹣200)﹣4n=800﹣2n,
∴EY=2n×0.4+(1200﹣2n)×0.4+(800﹣2n)×0.2=640﹣0.4n,
当200≤n≤300时,
若最高气温不低于20,则Y=6n﹣4n=2n,
若最高气温低于20,则Y=6×200+2(n﹣200)﹣4n=800﹣2n,
∴EY=2n×(0.4+0.4)+(800﹣2n)×0.2=160+1.2n.
∴n=300时,Y的数学期望达到最大值,最大值为520元.
23.【2016年新课标1理科19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得如图柱状图:
以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.
(Ⅰ)求X的分布列;
(Ⅱ)若要求P(X≤n)≥0.5,确定n的最小值;
(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在n=19与n=20之中选其一,应选用哪个?
【答案】解:(Ⅰ)由已知得X的可能取值为16,17,18,19,20,21,22,
P(X=16)=(20100)2=125,
P(X=17)=20100×40100×2=425,
P(X=18)=(40100)2+2(20100)2=625,
P(X=19)=2×40100×20100+2×(20100)2=625,
P(X=20)=(20100)2+2×40100×20100=525=15,
P(X=21)=2×(20100)2=225,
P(X=22)=(20100)2=125,
∴X的分布列为:
X
16
17
18
19
20
21
22
P
125
425
625
625
15
225
125
(Ⅱ)由(Ⅰ)知:
P(X≤18)=P(X=16)+P(X=17)+P(X=18)
=125+425+625=1125.
P(X≤19)=P(X=16)+P(X=17)+P(X=18)+P(X=19)
=125+425+625+625=1725.
∴P(X≤n)≥0.5中,n的最小值为19.
(Ⅲ)解法一:由(Ⅰ)得P(X≤19)=P(X=16)+P(X=17)+P(X=18)+P(X=19)
=125+425+625+625=1725.
买19个所需费用期望:
EX1=200×19×1725+(200×19+500)×525+(200×19+500×2)×225+(200×19+500×3)×125=4040,
买20个所需费用期望:
EX2=200×20×2225+(200×20+500)×225+(200×20+2×500)×125=4080,
∵EX1<EX2,
∴买19个更合适.
解法二:购买零件所用费用含两部分,一部分为购买零件的费用,
另一部分为备件不足时额外购买的费用,
当n=19时,费用的期望为:19×200+500×0.2+1000×0.08+1500×0.04=4040,
当n=20时,费用的期望为:20×200+500×0.08+1000×0.04=4080,
∴买19个更合适.
24.【2016年新课标2理科18】某保险的基本保费为a(单位:元),继续购买该保险的投保人成为续保人,续保人本年度的保费与其上年度出险次数的关联如下:
上年度出险次数
0
1
2
3
4
≥5
保费
0.85a
a
1.25a
1.5a
1.75a
2a
设该险种一续保人一年内出险次数与相应概率如下:
一年内出险次数
0
1
2
3
4
≥5
概率
0.30
0.15
0.20
0.20
0.10
0.05
(Ⅰ)求一续保人本年度的保费高于基本保费的概率;
(Ⅱ)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;
(Ⅲ)求续保人本年度的平均保费与基本保费的比值.
【答案】解:(Ⅰ)∵某保险的基本保费为a(单位:元),
上年度出险次数大于等于2时,续保人本年度的保费高于基本保费,
∴由该险种一续保人一年内出险次数与相应概率统计表得:
一续保人本年度的保费高于基本保费的概率:
p1=1﹣0.30﹣0.15=0.55.
(Ⅱ)设事件A表示“一续保人本年度的保费高于基本保费”,事件B表示“一续保人本年度的保费比基本保费高出60%”,
由题意P(A)=0.55,P(AB)=0.10+0.05=0.15,
由题意得若一续保人本年度的保费高于基本保费,
则其保费比基本保费高出60%的概率:
p2=P(B|A)=P(AB)P(A)=0.150.55=311.
(Ⅲ)由题意,续保人本年度的平均保费与基本保费的比值为:
0.85a×0.30+a×0.15+1.25a×0.2+1.5a×0.20+1.75a×0.1+2a×0.05a=1.23,
∴续保人本年度的平均保费与基本保费的比值为1.23.
25.【2016年新课标3理科18】如图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1﹣7分别对应年份2008﹣2014.
(Ⅰ)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以证明;
(Ⅱ)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.
附注:
参考数据:i=17 yi=9.32,i=17 tiyi=40.17,i=17 (yi−y)2=0.55,7≈2.646.
参考公式:相关系数r=i=1n (ti−t)(yi−y)i=1n (ti−t)2i=1n (yi−y)2,
回归方程y^=a^+b^t中斜率和截距的最小二乘估计公式分别为:
b^=i=1n (ti−t)(yi−y)i=1n (ti−t)2,a^=y−b^t.
【答案】解:(1)由折线图看出,y与t之间存在较强的正相关关系,理由如下:
∵r=i=17 (ti−t)(yi−y)i=17 (ti−t)2i=17 (yi−y)2=i=17 tiyi−7tyi=17 (ti−t)2i=17 (yi−y)2≈40.17−4×9.3227⋅0.55≈2.892.9106≈0.993,
∵0.993>0.75,
故y与t之间存在较强的正相关关系;
(2)b^=i=1n (ti−t)(yi−y)i=1n (ti−t)2=i=17 tiyi−7tyi=17 ti2−7t2≈2.8928≈0.103,
a^=y−b^t≈1.331﹣0.103×4≈0.92,
∴y关于t的回归方程ŷ=0.10t+0.92,
2016年对应的t值为9,
故ŷ=0.10×9+0.92=1.82,
预测2016年我国生活垃圾无害化处理量为1.82亿吨.
26.【2015年新课标1理科19】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
x
y
w
i=18 (xi−x)2
i=18 (wi−w)2
i=18 (xi−x)(yi−y)
i=18 (wi−w)(yi−y)
46.6
563
6.8
289.8
1.6
1469
108.8
表中wi=xi,w=18i=18 wi
(Ⅰ)根据散点图判断,y=a+bx与y=c+dx哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)已知这种产品的年利润z与x、y的关系为z=0.2y﹣x.根据(Ⅱ)的结果回答下列问题:
(i)年宣传费x=49时,年销售量及年利润的预报值是多少?
(ii)年宣传费x为何值时,年利润的预报值最大?
附:对于一组数据(u1v1),(u2v2)…..(unvn),其回归线v=α+βu的斜率和截距的最小二乘估计分别为:β^=i=1n (ui−u)(vi−v)i=1n (ui−u)2,α^=v−β^u.
【答案】解:(Ⅰ)由散点图可以判断,y=c+dx适宜作为年销售量y关于年宣传费x的回归方程类型;
(Ⅱ)令w=x,先建立y关于w的线性回归方程,由于d^=108.81.6=68,
c^=y−d^w=563﹣68×6.8=100.6,
所以y关于w的线性回归方程为y^=100.6+68w,
因此y关于x的回归方程为y^=100.6+68x,
(Ⅲ)(i)由(Ⅱ)知,当x=49时,年销售量y的预报值y^=100.6+6849=576.6,
年利润z的预报值z^=576.6×0.2﹣49=66.32,
(ii)根据(Ⅱ)的结果可知,年利润z的预报值z^=0.2(100.6+68x)﹣x=﹣x+13.6x+20.12,
当x=13.62=6.8时,即当x=46.24时,年利润的预报值最大.
27.【2015年新课标2理科18】某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:
A地区:62 73 81 92 95 85 74 64 53 76
78 86 95 66 97 78 88 82 76 89
B地区:73 83 62 51 91 46 53 73 64 82
93 48 65 81 74 56 54 76 65 79
(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
【答案】解:(1)两地区用户满意度评分的茎叶图如下
通过茎叶图可以看出,A地区用户满意评分的平均值高于B地区用户满意评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散;
(2)记CA1表示事件“A地区用户满意度等级为满意或非常满意”,
记CA2表示事件“A地区用户满意度等级为不满意”,
记CB1表示事件“B地区用户满意度等级为不满意”,
记CB2表示事件“B地区用户满意度等级为满意”,
则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,
则C=CA1CB1∪CA2CB2,
P(C)=P(CA1CB1)+P(CA2CB2)=P(CA1)P(CB1)+P(CA2)P(CB2),
由所给的数据CA1,CA2,CB1,CB2,发生的频率为1620,420,1020,820,
所以P(CA1)=1620,P(CA2)=420,P(CB1)=1020,P(CB2)=820,
所以P(C)=1620×1020+820×420=0.48.
28.【2014年新课标1理科18】从某企业生产的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(Ⅰ)求这500件产品质量指标值的样本平均数x和样本方差s2(同一组中数据用该组区间的中点值作代表);
(Ⅱ)由直方图可以认为,这种产品的质量指标值Z服从正态分布N(μ,σ2),其中μ近似为样本平均数x,σ2近似为样本方差s2.
(i)利用该正态分布,求P(187.8<Z<212.2);
(ii)某用户从该企业购买了100件这种产品,记X表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.
附:150≈12.2.
若Z~N(μ,σ2)则P(μ﹣σ<Z<μ+σ)=0.6826,P(μ﹣2σ<Z<μ+2σ)=0.9544.
【答案】解:(Ⅰ)抽取产品的质量指标值的样本平均数x和样本方差s2分别为:
x=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(﹣30)2×0.02+(﹣20)2×0.09+(﹣10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150.
(Ⅱ)(i)由(Ⅰ)知Z~N(200,150),从而P(187.8<Z<212.2)=P(200﹣12.2<Z<200+12.2)=0.6826;
(ii)由(i)知一件产品的质量指标值位于区间(187.8,212.2)的概率为0.6826,
依题意知X~B(100,0.6826),所以EX=100×0.6826=68.26.
29.【2014年新课标2理科19】某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如表:
年份
2007
2008
2009
2010
2011
2012
2013
年份代号t
1
2
3
4
5
6
7
人均纯收入y
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(Ⅰ)求y关于t的线性回归方程;
(Ⅱ)利用(Ⅰ)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
附:回归直线的斜率和截距的最小二乘估计公式分别为:b̂=i=1n (ti−t)(yi−y)i=1n (ti−t)2,â=y−b̂t.
【答案】解:(Ⅰ)由题意,t=17×(1+2+3+4+5+6+7)=4,
y=17×(2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3,
∴b̂=(−3)×(−1.4)+(−2)×(−1)+(−1)×(−0.7)+0×0.1+1×0.5+2×0.9+3×1.69+4+1+0+1+4+9=1428=0.5,
â=y−b̂t=4.3﹣0.5×4=2.3.
∴y关于t的线性回归方程为ŷ=0.5t+2.3;
(Ⅱ)由(Ⅰ)知,b=0.5>0,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元.
将2015年的年份代号t=9代入ŷ=0.5t+2.3,得:
ŷ=0.5×9+2.3=6.8,
故预测该地区2015年农村居民家庭人均纯收入为6.8千元.
30.【2013年新课标1理科19】一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为12,且各件产品是否为优质品相互独立.
(Ⅰ)求这批产品通过检验的概率;
(Ⅱ)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.
【答案】解:(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,
第二次取出的4件产品全是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,
这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,
所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)
=416×116+116×12=364
(Ⅱ)X可能的取值为400,500,800,并且P(X=800)=14,P(X=500)=116,
P(X=400)=1−116−14=1116,故X的分布列如下:
X
400
500
800
P
1116
116
14
故EX=400×1116+500×116+800×14=506.25
31.【2013年新课标2理科19】经销商经销某种农产品,在一个销售季度内,每售出1t该产品获利润500元,未售出的产品,每1t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130t该农产品.以x(单位:t,100≤x≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(Ⅰ)将T表示为x的函数;
(Ⅱ)根据直方图估计利润T不少于57000元的概率;
(Ⅲ)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若x∈[100,110))则取x=105,且x=105的概率等于需求量落入[100,110)的频率,求T的数学期望.
【答案】解:(Ⅰ)由题意得,当x∈[100,130)时,T=500x﹣300(130﹣x)=800x﹣39000,
当x∈[130,150)时,T=500×130=65000,
∴T=800x−39000,x∈[100,130)65000,x∈[130,150].
(Ⅱ)由(Ⅰ)知,利润T不少于57000元,当且仅当120≤x≤150.
由直方图知需求量X∈[120,150]的频率为0.7,
所以下一个销售季度的利润T不少于57000元的概率的估计值为0.7.
(Ⅲ)依题意可得T的分布列如图,
T
45000
53000
61000
65000
p
0.1
0.2
0.3
0.4
所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.
模拟好题
1.某汽车生产厂家为了解某型号电动汽车的“实际平均续航里程数”,收集了使用该型号电动汽车1年以上的部分客户的相关数据,得到他们的电动汽车的“实际平均续航里程数”.从年龄在40岁以下的客户中抽取10位归为A组,从年龄在40岁及以上的客户中抽取10位归为B组,将他们的电动汽车的“实际平均续航里程数”整理成下图,其中“+”表示A组的客户,“⊙”表示B组的客户.
注:“实际平均续航里程数”是指电动汽车的行驶总里程与充电次数的比值.
(1)记A,B两组客户的电动汽车的“实际平均续航里程数”的平均值分别为m,n,根据图中数据,试比较m,n的大小(结论不要求证明);
(2)从抽取的20位客户中随机抽取2位,求其中至少有1位是A组的客户的概率;
(3)如果客户的电动汽车的“实际平均续航里程数”不小于350,那么称该客户为“驾驶达人”,现从该市使用这种电动汽车的所有客户中,随机抽取年龄40岁以下和40岁以上的客户各1位,记“驾驶达人”的人数为X,求随机变量X的分布列和数学期望.
【答案】(1)ms12,s2>s22,故s2同时大于s12和s22.
3.2022 年春节后,新冠肺炎的新变种奥密克戎在我国部分地区爆发. 该病毒是一种人传人,不易被人们直接发现,潜伏期长且传染性极强的病毒. 我们把与该病毒感染者有过密切接触的人群称为密切接触者. 一旦发现感染者,社区会立即对其进行流行性病医学调查,找到其密切接触者进行隔离观察. 调查发现某位感染者共有 10 位密切接触者,将这 10 位密切接触者隔离之后立即进行核酸检测. 核酸检测方式既可以采用单样本检测,又可以采用 “ k 合 1 检测法”. “ k 合 1 检测法” 是将 k 个样本混合在一起检测,若混合样本呈阳性,则该组中各个样本再全部进行单样本检测; 若混合样本呈阴性,则可认为该混合样本中每个样本都是阴性. 通过病毒指标检测,每位密切按触者为阴性的概率为 p0
相关试卷
这是一份专题16 概率统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)学生版及教师版,文件包含专题16概率统计解答题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科教师版pdf、专题16概率统计解答题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科学生版pdf等2份试卷配套教学资源,其中试卷共81页, 欢迎下载使用。
这是一份专题15 概率统计与计数原理选择填空题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(新高考卷与全国理科)学生及教师版,文件包含专题15概率统计与计数原理选择填空题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科教师版pdf、专题15概率统计与计数原理选择填空题-大数据之十年高考真题2013-2022与优质模拟题汇编新高考卷与全国理科学生版pdf等2份试卷配套教学资源,其中试卷共53页, 欢迎下载使用。
这是一份专题16概率与统计解答题-大数据之十年高考真题(2013-2022)与优质模拟题汇编(全国文科),文件包含专题16概率与统计解答题解析版docx、专题16概率与统计解答题原卷版docx等2份试卷配套教学资源,其中试卷共79页, 欢迎下载使用。