2022高考数学一轮复习 第十章 高考专题突破六 高考中的概率与统计问题
展开题型一 随机事件的概率
例1 某社区举办“环保我参与”有奖问答比赛活动,某场比赛中,甲、乙、丙三个家庭同时回答一道有关环保知识的问题.已知甲家庭回答正确这道题的概率是eq \f(3,4),甲、丙两个家庭都回答错误的概率是eq \f(1,12),乙、丙两个家庭都回答正确的概率是eq \f(1,4).若各家庭回答是否正确互不影响.
(1)求乙、丙两个家庭各自回答正确这道题的概率;
(2)求甲、乙、丙三个家庭中不少于2个家庭回答正确这道题的概率.
解 (1)记“甲家庭回答正确这道题”“乙家庭回答正确这道题”“丙家庭回答正确这道题”分别为事件A,B,C,则P(A)=eq \f(3,4),且有eq \b\lc\{\rc\ (\a\vs4\al\c1(P\x\t(A)·P\x\t(C)=\f(1,12),,PB·PC=\f(1,4),))
即eq \b\lc\{\rc\ (\a\vs4\al\c1([1-PA]·[1-PC]=\f(1,12),,PB·PC=\f(1,4),))
所以P(B)=eq \f(3,8),P(C)=eq \f(2,3).
(2)有0个家庭回答正确的概率为
P0=P(eq \x\t(A)eq \x\t(B)eq \x\t(C))=P(eq \x\t(A))·P(eq \x\t(B))·P(eq \x\t(C))=eq \f(1,4)×eq \f(5,8)×eq \f(1,3)=eq \f(5,96),
有1个家庭回答正确的概率为
P1=P(Aeq \x\t(B)eq \x\t(C)∪eq \x\t(A)Beq \x\t(C)∪eq \x\t(A)eq \x\t(B)C)=P(Aeq \x\t(B)eq \x\t(C))+P(eq \x\t(A)Beq \x\t(C))+P(eq \x\t(A)eq \x\t(B)C)
=P(A)·P(eq \x\t(B))·P(eq \x\t(C))+P(eq \x\t(A))·P(B)·P(eq \x\t(C))+P(eq \x\t(A))·P(eq \x\t(B))·P(C)
=eq \f(3,4)×eq \f(5,8)×eq \f(1,3)+eq \f(1,4)×eq \f(3,8)×eq \f(1,3)+eq \f(1,4)×eq \f(5,8)×eq \f(2,3)=eq \f(7,24),
所以不少于2个家庭回答正确这道题的概率为
P=1-P0-P1=1-eq \f(5,96)-eq \f(7,24)=eq \f(21,32).
思维升华 随机事件的概率求解策略
(1)对复杂的随机事件表示成互斥事件的和,独立事件的积;
(2)利用概率的性质进行计算.
跟踪训练1 (1)(2020·上海市七宝中学模拟)通过手机验证码登录哈啰单车App,验证码由四位数字随机组成,如某人收到的验证码(a1,a2,a3,a4)满足a1
解析 ∵a1=2,2
只要选出3个数,让其按照从小到大的顺序排列,分别对应a2,a3,a4即可,
∴P=eq \f(C\\al(3,7),C\\al(4,10))=eq \f(1,6).
(2)某城市2020年的空气质量状况如表所示:
其中污染指数T≤50时,空气质量为优;50<T≤100时,空气质量为良,100<T≤150时,空气质量为轻微污染,则该城市2020年空气质量达到良或优的概率为________.
答案 eq \f(3,5)
解析 由题意可知2020年空气质量达到良或优的概率为p=eq \f(1,10)+eq \f(1,6)+eq \f(1,3)=eq \f(3,5).
题型二 用样本估计总体
例2 (2021·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴eq \f(6,x)=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=eq \f(95,3)≈32,则中位数为32.
(3)①5个年龄组成绩的平均数为eq \x\t(x)1=eq \f(1,5)×(93+96+97+94+90)=94,方差为seq \\al(2,1)=eq \f(1,5)×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为eq \x\t(x)2=eq \f(1,5)×(93+98+94+95+90)=94,方差为seq \\al(2,2)=eq \f(1,5)×[(-1)2+42+02+12+(-4)2]=6.8.
②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
思维升华 (1)注意频率分布直方图中平均数、中位数、众数的求法.
(2)处理决策问题时,一般先比较平均数,若平均数相同,再比较方差.
跟踪训练2 (2020·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.
已知摊位租金900元/档,售余精品可以进货价退回厂家.
(1)求表中10个销售数据的中位数和平均数;
(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理?
解 (1)中位数为eq \f(43+46,2)=44.5,
平均数为eq \f(35+46+32+42+43+50+39+52+51+60,10)=45.
(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担.
今年白天的平均销售量为eq \f(35+32+43+39+51,5)=40(件/天),
今年晚上的平均销售量为eq \f(46+42+50+52+60,5)=50(件/天),
所以甲同学应分担的租金为900×eq \f(40,40+50)=400(元),
乙同学应分担的租金为900×eq \f(50,40+50)=500(元).
(注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)
题型三 离散型随机变量及其分布列
例3 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:
(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;
(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1 000元的人数,求X的分布列和均值;
(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2 000元的人数有变化?说明理由.
规范解答
解 (1)由题意知,样本中仅使用A的学生有18+9+3=30(人),仅使用B的学生有10+14+1=25(人),A,B两种支付方式都不使用的学生有5人,
故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).[1分]
所以从全校学生中随机抽取1人,该学生上个月A,B两种支付方式都使用的概率为eq \f(40,100)=0.4.[2分]
(2)X的所有可能值为0,1,2.[3分]
记事件C为“从样本仅使用A的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”.
由题设知,事件C,D相互独立,且P(C)=eq \f(9+3,30)=0.4,
P(D)=eq \f(14+1,25)=0.6,[4分]
所以P(X=2)=P(CD)=P(C)P(D)=0.24.[5分]
P(X=1)=P(Ceq \x\t(D)∪eq \x\t(C)D)=P(C)P(eq \x\t(D))+P(eq \x\t(C))P(D)
=0.4×(1-0.6)+(1-0.4)×0.6=0.52,[6分]
P(X=0)=P(eq \x\t(C) eq \x\t(D))=P(eq \x\t(C))P(eq \x\t(D))=0.24.[7分]
所以X的分布列为
[8分]
故X的均值E(X)=0×0.24+1×0.52+2×0.24=1.0.[9分]
(3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额大于2 000元”.
假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=eq \f(1,C\\al(3,30))=eq \f(1,4 060).[11分]
答案示例1:可以认为有变化.理由如下:
P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.
答案示例2:无法确定有没有变化,理由如下:
事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]
第一步:审清题意,理清条件和结论,找到关键数量关系.
第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.
第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.
第四步:作出判断得结论,依据题意,借助数表作出正确判断.
第五步:反思回顾,查看关键点、易错点和答题规范性.
跟踪训练3 某项大型赛事需要从高校选拔青年志愿者,某大学学生实践中心积极参与,在8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X,求X的分布列及均值.
解 因为8名学生会干部中有5名男生,3名女生,所以X服从参数N=8,M=3,n=3的超几何分布.
X的所有可能取值为0,1,2,3,其中P(X=i)=eq \f(C\\al(i,3)C\\al(3-i,5),C\\al(3,8))
(i=0,1,2,3).
由公式可得P(X=0)=eq \f(C\\al(0,3)C\\al(3,5),C\\al(3,8))=eq \f(5,28),
P(X=1)=eq \f(C\\al(1,3)C\\al(2,5),C\\al(3,8))=eq \f(15,28),
P(X=2)=eq \f(C\\al(2,3)C\\al(1,5),C\\al(3,8))=eq \f(15,56),
P(X=3)=eq \f(C\\al(3,3)C\\al(0,5),C\\al(3,8))=eq \f(1,56).
所以X的分布列为
所以X的均值为E(X)=0×eq \f(5,28)+1×eq \f(15,28)+2×eq \f(15,56)+3×eq \f(1,56)=eq \f(63,56)=eq \f(9,8).
题型四 回归分析与独立性检验
例4 近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:
并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:
(1)求y关于x的线性回归方程;(计算结果保留两位小数)
(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?
参考公式:eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x),K2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
临界值表:
解 依题意得,eq \x\t(x)=eq \f(1+2+3+4+5,5)=3,eq \x\t(y)=eq \f(8+10+13+25+24,5)=16,
故eq \i\su(i=1,5, )(xi-eq \x\t(x))(yi-eq \x\t(y))=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47,
eq \i\su(i=1,5, )(xi-eq \x\t(x))2=4+1+1+4=10,
则eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(5),\s\d6(i=1)) xi-\x\t(x)yi-\x\t(y),\(∑,\s\up6(5),\s\d6(i=1))xi-\x\t(x)2)=eq \f(47,10)=4.7,
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=16-4.7×3=1.9,
所以y关于x的线性回归方程为eq \(y,\s\up6(^))=4.7x+1.9,
(2)依题意,女性不愿意参与管理的人数为50,
计算得K2的观测值为
k=eq \f(300×150×50-50×502,200×100×200×100)=eq \f(300×5 000×5 000,200×100×200×100)=18.75>10.828,
故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.
思维升华 统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.
跟踪训练4 (2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x分别为1~7).
(1)根据散点图分析y与x之间的相关关系;
(2)根据散点图相应数据计算得eq \i\su(i=1,7,y)i=1 074,eq \i\su(i=1,7,x)iyi=4 517,求y关于x的线性回归方程;
(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.(只写出结论)
附:线性回归方程eq \(y,\s\up6(^))=eq \(a,\s\up6(^))+eq \(b,\s\up6(^))x中斜率和截距的最小二乘估计公式分别为
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2) =eq \f(\i\su(i=1,n,x)iyi-n\x\t(x) \x\t(y),\i\su(i=1,n,x)\\al(2,i)-n\x\t(x)2) ,eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x由小变大时,y也由小变大,从而y与x之间是正相关关系.
(2)由题中数据可得eq \x\t(x)=eq \f(1,7)(1+2+3+4+5+6+7)=4,
eq \x\t(y)=eq \f(1,7)×1 074=eq \f(1 074,7),
从而eq \(b,\s\up6(^))=eq \f(\i\su(i=1,7,x)iyi-7\x\t(x)·\x\t(y),\i\su(i=1,7,x)\\al(2,i)-7\x\t(x)2) =eq \f(4 517-7×\f(1 074,7)×4,12+22+32+42+52+62+72-7×42)=eq \f(221,28),
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x)=eq \f(1 074,7)-eq \f(221,28)×4=eq \f(853,7),
从而所求y关于x的线性回归方程为eq \(y,\s\up6(^))=eq \f(221,28)x+eq \f(853,7).
(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.
课时精练
1.(2020·全国Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
乙分厂产品等级的频数分布表
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
解 (1)由表可知,甲分厂加工出来的一件产品为A级品的概率的估计值为eq \f(40,100)=0.4,乙分厂加工出来的一件产品为A级品的概率的估计值为eq \f(28,100)=0.28.
(2)甲分厂加工100件产品的总利润为
40×(90-25)+20×(50-25)+20×(20-25)-20×(50+25)=1 500(元),
所以甲分厂加工100件产品的平均利润为15元;
乙分厂加工100件产品的总利润为
28×(90-20)+17×(50-20)+34×(20-20)-21×(50+20)=1 000(元),
所以乙分厂加工100件产品的平均利润为10元.
比较甲、乙两分厂加工的产品的平均利润,厂家应选择甲分厂承接加工业务.
2.从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.
(1)求这些产品的质量指标值落在区间[75,85]内的频率;
(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X,求X的分布列与均值.
解 (1)设落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x和2x,
依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,
解得x=0.05.
所以质量指标值落在区间[75,85]内的频率为0.05.
(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布X~B(n,p),其中n=3.
由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.
因为X的所有可能取值为0,1,2,3,
则P(X=0)=Ceq \\al(0,3)×0.60×0.43=0.064,P(X=1)=Ceq \\al(1,3)×0.61×0.42=0.288,
P(X=2)=Ceq \\al(2,3)×0.62×0.41=0.432,P(X=3)=Ceq \\al(3,3)×0.63×0.40=0.216,
所以X的分布列为
所以X的均值为E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.
(或直接根据二项分布的均值公式得到E(X)=np=3×0.6=1.8)
3.(2019·全国Ⅲ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:K2=eq \f(nad-bc2,a+bc+da+cb+d).
解 (1)由调查数据,男顾客中对该商场服务满意的频率为eq \f(40,50)=0.8,
因此男顾客对该商场服务满意的概率的估计值为0.8.
女顾客中对该商场服务满意的频率为eq \f(30,50)=0.6,
因此女顾客对该商场服务满意的概率的估计值为0.6.
(2)K2的观测值k=eq \f(100×40×20-30×102,50×50×70×30)≈4.762.
由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.
4.(2021·四川省成都市第七中学模拟)某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量y(g)与尺寸x(mm)之间近似满足关系式y=c·xb(b,c为大于0的常数).按照某指标测定,当产品质量与尺寸的比在区间(0.302,0.388)内时为优等品.现随机抽取6件合格产品,测得数据如下:
(1)现从抽取的6件合格产品中再任选2件,求选中的2件均为优等品的概率;
(2)根据测得的数据作了初步处理,得相关统计量的值如下表:
根据所给统计量,求y关于x的非线性回归方程.
附:对于样本(vi,ui)(i=1,2,…,6),其回归直线eq \(u,\s\up6(^))=eq \(b,\s\up6(^))·v+eq \(a,\s\up6(^))的斜率和截距的最小二乘估计公式分别为:
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )(vi-\x\t(v))(ui-\x\t(u)),\i\su(i=1,n, )(vi-\x\t(v))2) =eq \f(\i\su(i=1,n,v)iui-n\x\t(v) \x\t(u),\i\su(i=1,n,v)\\al(2,i)-n\x\t(v)2) ,eq \(a,\s\up6(^))=eq \x\t(u)-eq \(b,\s\up6(^))eq \x\t(v).
解 (1)由已知,优等品的质量与尺寸的比eq \f(y,x)∈(0.302,0.388),
则随机抽取的6件合格产品中,有3件为优等品,记为a,b,c,
有3件为非优等品,记为d,e,f,
现从抽取的6件合格产品中再任选2件,所有结果为(a,b),(a,c),(a,d),(a,e)(a,f),(b,c),(b,d),(b,e),(b,f),(c,d),(c,e),(c,f),(d,e),(d,f),(e,f),
选中的两件均为优等品的所有结果为(a,b),(a,c),(b,c),
所以所求概率为eq \f(3,15)=eq \f(1,5).
(2)对y=c·xb两边取自然对数得ln y=ln c+bln x,
令vi=ln xi,ui=ln yi,则eq \(u,\s\up6(^))=eq \(b,\s\up6(^))·v+eq \(a,\s\up6(^)),且eq \(a,\s\up6(^))=ln c,
由所给统计量及最小二乘估计公式有
eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(6),\s\d6(i=1))viui-6\x\t(u)\x\t(v),\(∑,\s\up6(6),\s\d6(i=1))v\\al(2,i)-6\x\t(v)2)=eq \f(75.3-24.6×18.3÷6,101.4-24.62÷6)=eq \f(0.27,0.54)=eq \f(1,2),
eq \(a,\s\up6(^))=eq \x\t(u)-eq \(b,\s\up6(^))eq \x\t(v)=eq \f(18.3-\f(1,2)×24.6,6)=1,
由eq \(a,\s\up6(^))=ln c得c=e,
所以y关于x的非线性回归方程为eq \(y,\s\up6(^))=ex0.5.
5.(2021·南阳模拟)2020年初,新型冠状病毒肆虐,全民开启防疫防控.冠状肺炎的感染主要是人与人之间进行传播,可以通过飞沫以及粪便进行传染,冠状肺炎感染人群年龄大多数是40岁以上的人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期中位数为5,平均数为7.1,方差为5.06.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:
(1)是否有95%的把握认为“长潜伏期”与年龄有关?
(2)假设潜伏期Z服从正态分布N(μ,σ2),其中μ近似为样本平均数eq \x\t(x),σ2近似为样本方差s2.现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;
(3)以题目中的样本频率估计概率,设1 000个病例中恰有k(k∈N*)个属于“长潜伏期”的概率是g(k),当k为何值时,g(k)取得最大值?
附:K2=eq \f(nad-bc2,a+bc+da+cb+d).
若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ≤Z≤μ+σ)≈0.682 7,P(μ-2σ≤Z≤μ+2σ)≈0.954 5,P(μ-3σ≤Z≤μ+3σ)≈0.997 3,eq \r(5.06)≈2.25.
解 (1)k=eq \f(200×30×40-110×202,140×60×50×150)≈3.17,
由于3.17<3.841,
故没有95%的把握认为“长潜伏期”与年龄有关.
(2)由题意知潜伏期Z~N(7.1,2.252),
由P(Z≥13.85)≈eq \f(1-0.997 3,2)=0.001 35,
得知潜伏期超过14天的概率很低,因此隔离14天是合理的.
(3)由于200个病例中有50个属于长潜伏期,
若以样本频率估计概率,一个患者属于“长潜伏期”的概率是eq \f(1,4),
于是g(k)=Ceq \\al(k,1 000)·eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))k·eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))1 000-k.
则eq \f(gk,gk-1)=eq \f(C\\al(k,1 000)·\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))k·\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))1 000-k,C\\al(k-1,1 000)·\b\lc\(\rc\)(\a\vs4\al\c1(\f(1,4)))k-1·\b\lc\(\rc\)(\a\vs4\al\c1(\f(3,4)))1 001-k)=eq \f(C\\al(k,1 000),3C\\al(k-1,1 000))=eq \f(1,3)·eq \f(k-1!1 001-k!,k!1 000-k!)=eq \f(1,3)·eq \b\lc\(\rc\)(\a\vs4\al\c1(\f(1 001,k)-1)).
当0
当eq \f(1 001,4)
故当k=250时,g(k)取得最大值.污染指数T
30
60
100
110
130
140
概率p
eq \f(1,10)
eq \f(1,6)
eq \f(1,3)
eq \f(7,30)
eq \f(2,15)
eq \f(1,30)
日期
2月14日
2月15日
2月16日
2月17日
2月18日
销售
量/件
白天
35
32
43
39
51
晚上
46
42
50
52
60
支付金额(元)
支付方式
(0,1 000]
(1 000,2 000]
大于2 000
仅使用A
18人
9人
3人
仅使用B
10人
14人
1人
X
0
1
2
P
0.24
0.52
0.24
X
0
1
2
3
P
eq \f(5,28)
eq \f(15,28)
eq \f(15,56)
eq \f(1,56)
土地使用面积x(单位:亩)
1
2
3
4
5
管理时间y(单位:月)
8
10
13
25
24
愿意参与管理
不愿意参与管理
男性村民
150
50
女性村民
50
P(K2≥k0)
0.100
0.050
0.025
0.010
0.001
k0
2.706
3.841
5.024
6.635
10.828
等级
A
B
C
D
频数
40
20
20
20
等级
A
B
C
D
频数
28
17
34
21
X
0
1
2
3
P
0.064
0.288
0.432
0.216
满意
不满意
男顾客
40
10
女顾客
30
20
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
尺寸x(mm)
38
48
58
68
78
88
质量y(g)
16.8
18.8
20.7
22.4
24
25.5
质量与尺寸的比eq \f(y,x)
0.442
0.392
0.357
0.329
0.308
0.290
eq \i\su(i=1,6, )(ln xi·ln yi)
eq \i\su(i=1,6, )(ln xi)
eq \i\su(i=1,6, )(ln yi)
eq \i\su(i=1,6, )(ln xi)2
75.3
24.6
18.3
101.4
长潜伏期
非长潜伏期
总计
40岁以上
30
110
140
40岁及40岁以下
20
40
60
总计
50
150
200
P(K2≥k0)
0.1
0.05
0.01
k0
2.706
3.841
6.635
2024高考数学一轮复习讲义(步步高版)第十章 §10.8 概率与统计的综合问题: 这是一份2024高考数学一轮复习讲义(步步高版)第十章 §10.8 概率与统计的综合问题,共18页。
高中数学高考66第十一章 概率 高考专题突破6 高考中的概率与统计问题 无答案: 这是一份高中数学高考66第十一章 概率 高考专题突破6 高考中的概率与统计问题 无答案,共9页。
北师大版高考数学一轮复习第六章 高考专题突破三 高考中的数列问题试卷: 这是一份北师大版高考数学一轮复习第六章 高考专题突破三 高考中的数列问题试卷,共11页。试卷主要包含了[4分],所以bn=3n等内容,欢迎下载使用。