所属成套资源:2023版新高考人教A版数学一轮复习讲义
2023版步步高新高考人教A版一轮复习讲义第十章 §10.9 概率与统计的综合问题
展开§10.9 概率与统计的综合问题题型一 频率分布直方图与分布列的综合问题例1 (2022·湖北九师联盟模拟)某校高三年级举行了高校强基计划模拟考试(满分100分),将不低于50分的考生的成绩分为5组,即[50,60),[60,70),[70,80),[80,90),[90,100],并绘制频率分布直方图如图所示,其中在[90,100]内的人数为3.(1)求a的值,并估计不低于50分考生的平均成绩(同一组中的数据用该组区间的中点值代替);(2)现把[50,60)和[90,100]内的所有学生的考号贴在质地、形状和大小均相同的小球上,并放在盒子内,现从盒中随机抽取2个小球,若取出的两人成绩差不小于30,则称这两人为“黄金搭档组”.现随机抽取4次,每次取出2个小球,记下考号后再放回盒内,记取出“黄金搭档组”的次数为X,求X的分布列和均值E(X).解 (1)由题意,得(0.005+0.01+0.015+a+0.045)×10=1,解得a=0.025,不低于50分考生的平均成绩估计为55×0.1+65×0.25+75×0.45+85×0.15+95×0.05=73(分).(2)在[90,100]上的频率为0.005×10=0.05,由条件得总人数为eq \f(3,0.05)=60,所以在[50,60]内的人数为60×0.1=6,每次抽取出‘黄金搭档组”的概率P=eq \f(C\o\al(1,6)C\o\al(1,3),C\o\al(2,9))=eq \f(1,2),因此X~Beq \b\lc\(\rc\)(\a\vs4\al\co1(4,\f(1,2))),P(X=0)=Ceq \o\al(0,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))0×eq \b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,2)))4=eq \f(1,16),P(X=1)=Ceq \o\al(1,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))1×eq \b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,2)))3=eq \f(1,4),P(X=2)=Ceq \o\al(2,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))2×eq \b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,2)))2=eq \f(3,8),P(X=3)=Ceq \o\al(3,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))3×eq \b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,2)))1=eq \f(1,4),P(X=4)=Ceq \o\al(4,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,2)))4×eq \b\lc\(\rc\)(\a\vs4\al\co1(1-\f(1,2)))0=eq \f(1,16),X的分布列为E(X)=np=4×eq \f(1,2)=2.教师备选(2022·湛江模拟)某高三学生小明准备利用暑假的7月和8月勤工俭学,现有“送外卖员”和“销售员”两份工作可供其选择.已知“销售员”工作每日底薪为50元,每日销售的前5件每件奖励20元,超过5件的部分每件奖励30元.小明通过调查,统计了100名销售员1天的销售记录,其柱状图如图1;“送外卖员”没有底薪,收入与送的单数相关,在一日内:1至20单(含20单)每送一单3元,超过20单且不超过40单的部分每送一单4元,超过40单的部分,每送一单4.5元.小明通过随机调查,统计了100名送外卖员的日送单数,并绘制成如下频率分布直方图(如图2).图1图2(1)分别求出“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式、“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式;(2)若将频率视为概率,根据统计图,试分别估计“销售员”的日薪X1和“送外卖员”的日薪X2(同一组中的数据用该组区间的中点值代表)的均值,分析选择哪种工作比较合适,并说明你的理由.解 (1)“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式为y1=eq \b\lc\{\rc\ (\a\vs4\al\co1(20x1+50,x1≤5,x1∈N,,30x1,x1>5,x1∈N,))“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式为y2=eq \b\lc\{\rc\ (\a\vs4\al\co1(3x2,x2≤20,x2∈N,,4x2-20,2040,x2∈N.))(2)由柱状图知,日平均销售量满足如下表格:所以X1的分布列为所以E(X1)=110×0.05+130×0.2+150×0.25+180×0.4+210×0.1=162(元).由频率分布直方图可知,日送单数满足如下表格:所以X2的分布列为所以E(X2)=30×0.05+100×0.25+185×0.45+275×0.2+365×0.05=183(元).由以上计算得E(X2)>E(X1),做“送外卖员”挣的更多,故小明选择做“送外卖员”的工作比较合适.思维升华 高考常将频率分布直方图与分布列等交汇在一起进行考查,因此在解答此类题时,准确的把题中所涉及的事件进行分解,明确所求问题所属的事件类型是关键.跟踪训练1 (2022·太原模拟)国家发改委、住建部发布了《生活垃圾分类制度实施方案》规定46个城市实施生活垃圾强制分类,垃圾回收利用率要达35%以上.某市在实施垃圾分类之前,对该市大型社区(即人口数量在1万左右)一天产生的垃圾量(单位:吨)进行了调查.已知该市这样的大型社区有200个,如图是某天从中随机抽取50个社区所产生的垃圾量绘制的频率分布直方图.现将垃圾量超过14吨/天的社区称为“超标”社区.(1)根据上述资料,估计当天这50个社区垃圾量的平均值eq \x\to(x)(四舍五入精确到整数);(2)若当天该市这类大型社区的垃圾量X~N(μ,9),其中μ近似为(1)中的样本平均值eq \x\to(x),请根据X的分布估计这200个社区中“超标”社区的个数(四舍五入精确到整数);(3)市环保部门决定对样本中“超标”社区的垃圾来源进行调查,现从这些社区中随机抽取3个进行重点监控,设Y为其中当天垃圾量至少为16吨的社区个数,求Y的分布列与均值.附:P(μ-σ≤X≤μ+σ)≈0.682 7;P(μ-2σ≤X≤μ+2σ)≈0.954 5;P(μ-3σ≤X≤μ+3σ)≈0.997 3.解 (1)由频率分布直方图得该样本中垃圾量为[4,6),[6,8),[8,10),[10,12),[12,14),[14,16),[16,18]的频率分别为0.08,0.10,0.20,0.24,0.18,0.12,0.08,eq \x\to(x)=5×0.08+7×0.10+9×0.20+11×0.24+13×0.18+15×0.12+17×0.08=11.04≈11,∴当天这50个社区垃圾量的平均值为11吨.(2)由(1)知μ=11,∵σ2=9,∴σ=3,∴P(X>14)=P(X>μ+σ)=eq \f(1-0.682 7,2)=0.158 65,∴这200个社区中“超标”社区的个数为200×0.158 65≈32.(3)由(1)得样本中当天垃圾量为[14,16)的社区有50×0.12=6(个),垃圾量为[16,18)的社区有50×0.08=4(个),∴Y的所有可能取值为0,1,2,3,P(Y=0)=eq \f(C\o\al(3,6),C\o\al(3,10))=eq \f(1,6),P(Y=1)=eq \f(C\o\al(2,6)C\o\al(1,4),C\o\al(3,10))=eq \f(1,2),P(Y=2)=eq \f(C\o\al(1,6)C\o\al(2,4),C\o\al(3,10))=eq \f(3,10),P(Y=3)=eq \f(C\o\al(3,4),C\o\al(3,10))=eq \f(1,30),∴Y的分布列为∴E(Y)=0×eq \f(1,6)+1×eq \f(1,2)+2×eq \f(3,10)+3×eq \f(1,30)=eq \f(6,5).题型二 回归模型与分布列的综合问题例2 学习于才干信仰,犹如运动于健康体魄,持之以恒、行之愈远愈受益.为了顺利实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某市教育局为了解全市教职工在“学习强国”中每天学习得分情况,从全市教职工中随机抽取1 000名教职工,得到他们平均每天的学习得分,得分都在[15,50]内,将他们的得分分为七组:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45),[45,50]后得到频率分布直方图如图所示.(1)从样本中得分不低于40的教职工中用分层随机抽样的方法抽取12人,然后从这12人中随机抽取3人进行学习体会交流,用X表示参加学习体会交流且得分不低于45分的人数,求X的分布列和均值;(2)某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:由表中数据可知该老师每天一次最多答对题数y与第x天之间可用线性模型拟合,请用样本相关系数加以说明,并求出y关于x的经验回归方程.参考数据:eq \r(6)≈2.45,eq \i\su(i=1,7,x)iyi=600,eq \i\su(i=1, 7, )(xi-eq \x\to(x))2=28,eq \i\su(i=1, 7, )(yi-eq \x\to(y))2=168.参考公式:r=eq \f(\i\su(i=1,n,x)iyi-n\x\to(x) \x\to(y),\r(\i\su(i=1,n, )xi-\x\to(x)2\i\su(i=1,n, )yi-\x\to(y)2)),经验回归方程eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))+eq \o(b,\s\up6(^))x中斜率和截距的最小二乘估计公式eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,n,x)iyi-n\x\to(x) \x\to(y),\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2),eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x).解 (1)在抽取的1 000名教职工中得分在[40,45)的有0.016×5×1 000=80(人),得分在[45,50]的有0.008×5×1 000=40(人),所以在得分为[40,45)的人中应抽取eq \f(80,80+40)×12=8(人),在得分为[45,50]的人中应抽取12-8=4(人).由题可得X的所有可能取值为0,1,2,3,P(X=0)=eq \f(C\o\al(0,4)C\o\al(3,8),C\o\al(3,12))=eq \f(14,55),P(X=1)=eq \f(C\o\al(1,4)C\o\al(2,8),C\o\al(3,12))=eq \f(28,55),P(X=2)=eq \f(C\o\al(2,4)C\o\al(1,8),C\o\al(3,12))=eq \f(12,55),P(X=3)=eq \f(C\o\al(3,4)C\o\al(0,8),C\o\al(3,12))=eq \f(1,55),所以X的分布列为E(X)=0×eq \f(14,55)+1×eq \f(28,55)+2×eq \f(12,55)+3×eq \f(1,55)=1.(2)由条件可知eq \x\to(x)=4,eq \x\to(y)=19,则y关于x的样本相关系数r=eq \f(\o(∑,\s\up6(7),\s\do4(i=1))xiyi-7\x\to(x) \x\to(y),\r(\o(∑,\s\up6(7),\s\do4(i=1))xi-\x\to(x)2\o(∑,\s\up6(7),\s\do4(i=1))yi-\x\to(y)2))=eq \f(600-7×4×19,28\r(6))≈eq \f(68,68.6)≈0.99.因为0.99与1非常接近,所以y关于x有较强的线性相关关系,因为eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,7,x)iyi-7\x\to(x) \x\to(y),\i\su(i=1,7,x)\o\al(2,i)-7\x\to(x)2)=eq \f(17,7),eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x)=19-eq \f(17,7)×4=eq \f(65,7)’所以y关于x的经验回归方程是eq \o(y,\s\up6(^))=eq \f(65,7)+eq \f(17,7)x.教师备选设某幼苗从观察之日起,第x天的高度为y(cm),测得的一些数据如下表所示:作出这组数据的散点图发现:y(cm)与x(天)之间近似满足关系式y=beq \r(x)+a,其中a,b均为大于0的常数.(1)试借助一元线性回归模型,根据所给数据,用最小二乘法对a,b作出估计,并求出y关于x的经验回归方程;(2)在作出的这组数据的散点图中,甲同学随机圈取了其中的3个点,记这3个点中幼苗的高度大于eq \x\to(y)的点的个数为ξ,其中eq \x\to(y)为表格中所给的幼苗高度的平均数,试求随机变量ξ的分布列和均值.附:对于一组数据(v1,μ1),(v2,μ2),…,(vn,μn),其经验回归方程eq \o(μ,\s\up6(^))=eq \o(α,\s\up6(^))+eq \o(β,\s\up6(^))v的斜率和截距的最小二乘估计分别为eq \o(β,\s\up6(^))=eq \f(\i\su(i=1,n,v)iμi-n\x\to(v) \x\to(μ),\i\su(i=1,n,v)\o\al(2,i)-n\x\to(v)2),eq \o(α,\s\up6(^))=eq \x\to(μ)-eq \o(β,\s\up6(^))eq \x\to(v).解 (1)令μ=eq \r(x),则y=bμ+a,根据已知数据表得到下表:eq \x\to(μ)=eq \f(1+2+3+4+5+6+7,7)=4,eq \x\to(y)=eq \f(0+4+7+9+11+12+13,7)=8,通过上表计算可得eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,n,μ)iyi-n\x\to(μ) \x\to(y),\i\su(i=1,n,μ)\o\al(2,i)-n\x\to(μ)2) =eq \f(283-7×4×8,140-7×16)=eq \f(59,28),因为回归直线eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))μ+eq \o(a,\s\up6(^))过点(eq \x\to(μ),eq \x\to(y)),所以eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(μ)=-eq \f(3,7),故y关于x的经验回归方程为eq \o(y,\s\up6(^))=eq \f(59,28)eq \r(x)-eq \f(3,7).(2)7天中幼苗高度大于eq \x\to(y)=8的有4天,小于等于8的有3天,从散点图中任取3个点,即从这7天中任取3天,所以这3个点中幼苗的高度大于eq \x\to(y)的点的个数ξ的所有可能取值为0,1,2,3,P(ξ=0)=eq \f(C\o\al(3,3)C\o\al(0,4),C\o\al(3,7))=eq \f(1,35);P(ξ=1)=eq \f(C\o\al(2,3)C\o\al(1,4),C\o\al(3,7))=eq \f(12,35);P(ξ=2)=eq \f(C\o\al(1,3)C\o\al(2,4),C\o\al(3,7))=eq \f(18,35);P(ξ=3)=eq \f(C\o\al(0,3)C\o\al(3,4),C\o\al(3,7))=eq \f(4,35).所以随机变量ξ的分布列为随机变量ξ的均值E(ξ)=0×eq \f(1,35)+1×eq \f(12,35)+2×eq \f(18,35)+3×eq \f(4,35)=eq \f(12,7).思维升华 高考常将回归模型与分布列等交汇在一起进行考查,求解时注意概率模型的应用,明确所求问题所属的事件类型是关键.跟踪训练2 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:现用eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))+eq \f(\o(b,\s\up6(^)),x)作为回归方程模型,请利用表中数据,求出该回归方程;(a,b用分数表示)(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为eq \f(2,3),且各局之间相互独立,设比赛X局后结束,求随机变量X的分布列及均值.参考数据eq \b\lc\(\rc\)(\a\vs4\al\co1(其中t=\f(1,xi))):参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程eq \o(v,\s\up6(^))=eq \o(α,\s\up6(^))+eq \o(β,\s\up6(^))u的斜率和截距的最小二乘估计分别为eq \o(β,\s\up6(^))=eq \f(\i\su(i=1,n,u)ivi-n\x\to(u) \x\to(v),\i\su(i=1,n,u)\o\al(2,i)-n\x\to(u)2),eq \o(α,\s\up6(^))=eq \x\to(v)-eq \o(β,\s\up6(^))eq \x\to(u).解 (1)因为eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))+eq \f(\o(b,\s\up6(^)),x),ti=eq \f(1,xi),所以eq \o(y,\s\up6(^))=eq \o(a,\s\up6(^))+eq \o(b,\s\up6(^))t.因为eq \x\to(y)=eq \f(910+800+600+440+300+240+210,7)=500,所以eq \o(b,\s\up6(^))=eq \f(\i\su(i=1,7,t)iyi-7\x\to(t) \x\to(y),\i\su(i=1,7,t)\o\al(2,i)-7\x\to(t)2)=eq \f(1 750-7×0.37×500,0.55)=eq \f(455,0.55)=eq \f(9 100,11),所以eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(t)=500-eq \f(9 100,11)×0.37=eq \f(2 133,11),所以eq \o(y,\s\up6(^))=eq \f(2 133,11)+eq \f(9 100,11)t,所以所求回归方程为eq \o(y,\s\up6(^))=eq \f(2 133,11)+eq \f(9 100,11x).(2)随机变量X的所有可能取值为3,4,5,P(X=3)=eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))3+eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))3=eq \f(1,3),P(X=4)=Ceq \o\al(2,3)eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))2×eq \f(1,3)×eq \f(2,3)+Ceq \o\al(2,3)eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))2×eq \f(2,3)×eq \f(1,3)=eq \f(10,27),P(X=5)=Ceq \o\al(2,4)eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))2×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))2×eq \f(2,3)+Ceq \o\al(2,4)eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,3)))2×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(2,3)))2×eq \f(1,3)=eq \f(8,27).所以随机变量X的分布列为E(X)=3×eq \f(1,3)+4×eq \f(10,27)+5×eq \f(8,27)=eq \f(107,27).题型三 独立性检验与分布列的综合问题例3 (2022·苏州模拟)为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如下频率分布直方图:A型B型(1)将使用寿命超过2 500小时和不超过2 500小时的台数填入下面的列联表:根据上面的列联表,依据小概率值α=0.01的独立性检验,能否认为使用寿命是否超过2 500小时与型号有关?(2)用分层随机抽样的方法从不超过2 500小时的A型和B型设备中抽取8台,再从这8台设备中随机抽取3台,其中A型设备为X台,求X的分布列和均值;(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作2 500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.参考公式:χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.参考数据:解 (1)由频率分布直方图可知,A型超过2 500小时的有100×(0.000 6+0.000 5+0.000 3)× 500=70(台),则A型不超过2 500小时的有30台,同理,B型超过2 500小时的有100×(0.000 6+0.000 3+0.000 1)×500=50(台),则B型不超过2 500小时的有50台.列联表如下:零假设为H0:使用寿命是否超过2 500小时与型号无关,根据列联表中的数据,经计算得到χ2=eq \f(200×70×50-30×502,100×100×120×80)≈8.333>6.635=,所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为使用寿命是否超过 2 500小时与型号有关.(2)由(1)和分层随机抽样的定义可知A型设备有3台,B型设备有5台,所以X的所有可能取值为0,1,2,3,P(X=0)=eq \f(C\o\al(3,5),C\o\al(3,8))=eq \f(5,28),P(X=1)=eq \f(C\o\al(1,3)C\o\al(2,5),C\o\al(3,8))=eq \f(15,28),P(X=2)=eq \f(C\o\al(2,3)C\o\al(1,5),C\o\al(3,8))=eq \f(15,56),P(X=3)=eq \f(C\o\al(3,3),C\o\al(3,8))=eq \f(1,56),所以X的分布列为所以E(X)=0×eq \f(5,28)+1×eq \f(15,28)+2×eq \f(15,56)+3×eq \f(1,56)=eq \f(9,8).(3)由频率分布直方图中的频率估计概率知:A型设备每台更换的概率为0.3,所以10台A型设备估计要更换3台;B型设备每台更换的概率为0.5,所以10台B型设备估计要更换5台,选择A型设备的总费用y1=(10+3)×1+10×2×0.75×2 500×10-4=16.75 (万元),选择B型设备的总费用y2=(10+5)×0.6+10×6×0.75×2 500×10-4=20.25 (万元),y110.828=x0.001,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为产品的合格率与技术升级有关.(2)由于所有次品中,甲、乙生产线生产的次品比例为4∶1,故抽取的10件中有8件甲生产线的,2件乙生产线的,从中随机抽取5件中属于甲生产线的数量X的所有可能取值为3,4,5,则P(X=3)=eq \f(C\o\al(3,8)C\o\al(2,2),C\o\al(5,10))=eq \f(2,9),P(X=4)=eq \f(C\o\al(4,8)C\o\al(1,2),C\o\al(5,10))=eq \f(5,9),P(X=5)=eq \f(C\o\al(5,8),C\o\al(5,10))=eq \f(2,9),所以X的分布列为所以E(X)=3×eq \f(2,9)+4×eq \f(5,9)+5×eq \f(2,9)=4.(3)甲生产线抽检的产品中有70件A等级,90件B等级,40件C等级;乙生产线抽检的产品中有130件A等级,60件B等级,10件C等级,因为用样本的频率估计概率,所以对于甲生产线,单件产品的利润eq \x\to(x)甲=eq \f(70m+90×40-200×20,200)=eq \f(7,20)m-2,对于乙生产线,单件产品的利润eq \x\to(x)乙=eq \f(130m+60×40-200×20,200)=eq \f(13,20)m-8.eq \x\to(x)乙-eq \x\to(x)甲=eq \f(13,20)m-8-eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(7,20)m-2))≤9,所以m≤50.即A等级产品的出厂单价最高为50元.思维升华 高考常将独立性检验与分布列等交汇在一起进行考查,由频率分布直方图解决相关问题,解题的关键是正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.跟踪训练3 (2022·邯郸模拟)暑假期间,学生居家生活和学习,教育部门特别强调,身体健康与学习成绩同样重要.某校对300名学生的锻炼时间进行调查,数据如表:将学生日均锻炼的时间在[40,60]的学生评价为“体育合格”.(1)请根据上述表格中的统计数据填写下面2×2列联表,依据小概率值α=0.001的独立性检验,能否认为“体育合格”与性别无关?(2)从上述体育合格的学生中,按性别用分层随机抽样的方法抽取9名学生,再从这9名学生中随机抽取3人了解他们锻炼时间较多的原因,记所抽取的3人中男生的人数为随机变量X,求X的分布列和均值.参考公式:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.参考数据:解 (1)列联表如下:零假设为H0:“体育合格”与性别无关,根据列联表中的数据,经计算得到χ2=eq \f(300×100×30-110×602,210×90×140×160)≈9.1843.841=x0.05,所以依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为参加张家口赛区志愿者服务的候选人与性别有关.(3)X的所有可能取值为2,3,4,P(X=2)=eq \f(C\o\al(2,4)C\o\al(3,3),C\o\al(5,7))=eq \f(2,7),P(X=3)=eq \f(C\o\al(3,4)C\o\al(2,3),C\o\al(5,7))=eq \f(4,7),P(X=4)=eq \f(C\o\al(4,4)C\o\al(1,3),C\o\al(5,7))=eq \f(1,7),所以X的分布列为所以E(X)=2×eq \f(2,7)+3×eq \f(4,7)+4×eq \f(1,7)=eq \f(20,7).3.(2022·南京模拟)某乒乓球教练为了解某同学近期的训练效果,随机记录了该同学40局接球训练成绩,每局训练时教练连续发100个球,该同学每接球成功得1分,否则不得分,且每局训练结果相互独立,得到如图所示的频率分布直方图.(1)同一组数据用该组区间的中点值作代表,①求该同学40局接球训练成绩的样本平均数eq \x\to(x);②若该同学的接球训练成绩X近似地服从正态分布N(μ,100),其中μ近似为样本平均数eq \x\to(x),求P(54≤X≤64)的值;(2)为了提高该同学的训练兴趣,教练与他进行比赛.一局比赛中教练连续发100个球,该同学得分达到80分为获胜,否则教练获胜.若有人获胜达3局,则比赛结束,记比赛的局数为Y.以频率分布直方图中该同学获胜的频率作为概率,求均值E(Y).参考数据:若随机变量ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈ 0.954 5,P(μ-3σ≤ξ≤μ+3σ)≈0.997 3.解 (1)①由频率分布直方图可得eq \x\to(x)=55×0.1+65×0.2+75×0.45+85×0.2+95×0.05=74.②由题意可知μ=74,σ=10,则54=μ-2σ,64=μ-σ,所以P(54≤X≤64)=P(μ-2σ≤X≤μ-σ)=eq \f(Pμ-2σ≤X≤μ+2σ-Pμ-σ≤X≤μ+σ,2)≈0.135 9.(2)由频率分布直方图可知,在一局中,该同学得分达到80分的概率为(0.02+0.005)×10=eq \f(1,4),由题意可知,随机变量Y的所有可能取值为3,4,5,P(Y=3)=eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))3+eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))3=eq \f(7,16),P(Y=4)=eq \f(1,4)Ceq \o\al(2,3)·eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))2×eq \f(3,4)+eq \f(3,4)Ceq \o\al(2,3)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))2×eq \f(1,4)=eq \f(45,128),P(Y=5)=eq \f(1,4)Ceq \o\al(2,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))2×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))2+eq \f(3,4)Ceq \o\al(2,4)×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(3,4)))2×eq \b\lc\(\rc\)(\a\vs4\al\co1(\f(1,4)))2=eq \f(27,128),所以随机变量Y的分布列为因此,E(Y)=3×eq \f(7,16)+4×eq \f(45,128)+5×eq \f(27,128)=eq \f(483,128).4.(2022·福州模拟)某种病菌在某地区人群中的带菌率为10%,目前临床医学研究中已有费用昂贵但能准确检测出个体是否带菌的方法.现引进操作易、成本低的新型检测方法:每次只需检测x,y两项指标,若指标x的值大于4且指标y的值大于100,则检验结果呈阳性,否则呈阴性.为考查该检测方法的准确度,随机抽取50位带菌者(用“*”表示)和50位不带菌者(用“+”表示)各做1次检测,他们检测后的数据,制成如下统计图:(1)从这100名被检测者中,随机抽取一名不带菌者,求检测结果呈阳性的概率;(2)依据小概率值α=0.001的独立性检验,能否认为“带菌”与“检测结果呈阳性”有关?(3)现用新型检测方法,对该地区人群进行全员检测,用频率估计概率,求每个被检者“带菌”且“检测结果呈阳性”的概率.附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.解 (1)方法一 设A=“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”,根据统计图可知在不带菌者中,检测结果呈阳性的有5人,所以P(A)=eq \f(5,50)=eq \f(1,10).方法二 设A=“从这100名被检测者中,随机抽取一名为不带菌者”,D=“从这100名被检测者中,随机抽取一名检测结果呈阳性”,则“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”的概率就是“在事件A发生的条件下,事件D发生”的概率,记为P(D|A).根据题意,P(A)=eq \f(1,2),P(AD)=eq \f(5,100),利用条件概率公式,得P(D|A)=eq \f(PAD,PA)=eq \f(\f(5,100),\f(1,2))=eq \f(1,10).(2)零假设为H0:“带菌”与“检测结果呈阳性”无关,可作出2×2列联表如下:根据列联表中的数据,经计算得到χ2=eq \f(100×35×45-15×52,40×60×50×50)=37.5>10.828=x0.001,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为“带菌”与“检测结果呈阳性”有关.(3)设B=“被检测者带菌”,C=“被检测者检测结果呈阳性”,则BC=“被检者‘带菌’且‘检测结果呈阳性’”,用频率估计概率,根据题意可知P(B)=0.1,P(C|B)=eq \f(35,50)=0.7,所以由条件概率公式可知P(BC)=P(B)·P(C|B)=0.1×0.7=0.07.X01234Peq \f(1,16)eq \f(1,4)eq \f(3,8)eq \f(1,4)eq \f(1,16)销售量/件34567频率0.050.20.250.40.1X1110130150180210P0.050.20.250.40.1单数/单1030507090频率0.050.250.450.20.05X230100185275365P0.050.250.450.20.05Y0123Peq \f(1,6)eq \f(1,2)eq \f(3,10)eq \f(1,30)天数1234567一次最多答对题数12151618212427X0123Peq \f(14,55)eq \f(28,55)eq \f(12,55)eq \f(1,55)第x天14916253649高度y(cm)0479111213x14916253649μ=eq \r(x)1234567y0479111213ξ0123Peq \f(1,35)eq \f(12,35)eq \f(18,35)eq \f(4,35)x(天)1234567y(秒/题)910800600440300240210eq \i\su(i=1,7,t)iyieq \x\to(t)eq \i\su(i=1,7,t)eq \o\al(2,i)-7eq \x\to(t)21 7500.370.55X3 4 5 Peq \f(1,3)eq \f(10,27)eq \f(8,27)超过2 500小时不超过2 500小时合计A型B型合计α0.0500.0100.001xα3.8416.63510.828超过2 500小时不超过2 500小时合计A型7030100B型5050100合计12080200X0123Peq \f(5,28)eq \f(15,28)eq \f(15,56)eq \f(1,56)等级ABC频数20015050合格品次品合计甲160乙10合计α0.050.0250.0100.0050.001xα3.8415.0246.6357.87910.828合格品次品合计甲16040200乙19010200合计35050400X345Peq \f(2,9)eq \f(5,9)eq \f(2,9)平均每天锻炼的时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60]总人数305060705535体育不合格体育合格合计男60160女合计α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828体育不合格体育合格合计男10060160女11030140合计21090300X0123Peq \f(1,84)eq \f(3,14)eq \f(15,28)eq \f(5,21)月份x34567均价y0.950.981.111.121.20X123Peq \f(1,55)eq \f(27,55)eq \f(27,55)男生女生合计希望去张家口赛区10 20不希望去张家口赛区合计4040α0.0500.0100.001xα3.8416.63510.828男生女生合计希望去张家口赛区10 20 30不希望去张家口赛区30 2050合计404080X234Peq \f(2,7)eq \f(4,7)eq \f(1,7)Y345Peq \f(7,16)eq \f(45,128)eq \f(27,128)α0.0500.0100.001xα3.8416.63510.828阳性阴性合计带菌351550不带菌54550合计4060100