高考数学复习专题四概率与统计讲义
展开专题四 概率与统计小题专项 统计与统计案例、概率(理、新教材)命|题|分|析统计与统计案例、概率的选择题、填空题涉及的内容较为简单,主要有概率、抽样方法、统计图表的应用、用样本的数字特征估计总体、线性回归及统计案例。试题属基础题,分值一般为5分。明确考点 扣准要点必 备 知 识一、统计与统计案例1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样。三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围。2.统计中的四个数字特征(1)众数:在样本数据中,出现次数最多的那个数据。(2)中位数:样本数据中,将数据按大小顺序排列,位于最中间的数据。如果数据的个数为偶数,就取中间两个数据的平均数作为中位数。(3)平均数:样本数据的算术平均数,即=(x1+x2+…+xn)。(4)方差与标准差。s2=[(x1-)2+(x2-)2+…+(xn-)2],s=。3.直方图的两个结论(1)小长方形的面积=组距×=频率。(2)各小长方形的面积之和等于1。4.回归分析与独立性检验(1)回归直线=x+经过样本点的中心(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值。(2)独立性检验。对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是: y1y2总计x1aba+bx2cdc+d总计a+cb+dn则K2=(其中n=a+b+c+d为样本容量)。二、概率1.概率模型公式及相关结论(1)古典概型的概率公式。P(A)==。(2)几何概型的概率公式。P(A)=。(3)条件概率。在A发生的条件下B发生的概率:P(B|A)=。(4)相互独立事件同时发生的概率:若A,B相互独立,则P(AB)=P(A)·P(B)。(5)若事件A,B互斥,则P(A∪B)=P(A)+P(B),P()=1-P(A)。2.独立重复试验与二项分布如果事件A在一次试验中发生的概率是p,那么它在n次独立重复试验中恰好发生k次的概率为Pn(k)=Cpk(1-p)n-k,k=0,1,2,…,n。用X表示事件A在n次独立重复试验中发生的次数,则X服从二项分布,即X~B(n,p)且P(X=k)=Cpk(1-p)n-k。3.超几何分布在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则P(X=k)=,k=0,1,2,…,m,其中m=min{M,n},且n≤N,M≤N,n,M,N∈N*,此时称随机变量X服从超几何分布。超几何分布的模型是不放回抽样,超几何分布中的参数是M,N,n。4.离散型随机变量的均值、方差(1)离散型随机变量X的分布列为Xx1x2x3…xi…xnPp1p2p3…pi…pn离散型随机变量X的分布列具有两个性质:①pi≥0,i=1,2,3,…,n;②i=1。(2)E(X)=x1p1+x2p2+…+xipi+…+xnpn称为随机变量X的均值或数学期望。D(X)=(xi-E(X))2pi称为随机变量X的方差。(3)数学期望、方差的性质。①E(aX+b)=aE(X)+b,D(aX+b)=a2D(X)。②X~B(n,p),则E(X)=np,D(X)=np(1-p)。③X服从两点分布,则E(X)=p,D(X)=p(1-p)。精析精研 重点攻关考 向 突 破考向一 用样本估计总体【例1】 (1)(2021·长春市质量监测)党的十八大以来,我们在脱贫攻坚领域取得了前所未有的成就,农村贫困人口大幅减少,困扰中华民族几千年的绝对贫困问题,取得历史性成就,同时为全球减贫事业作出了重要贡献。2020年为脱贫攻坚收官之年,下图为2013年至2019年每年我国农村减贫人数的条形图。根据该条形图分析,下述结论:①平均每年减贫人数超过1 300万人;②每年减贫人数均保持在1 100万人以上;③打破了以往随着脱贫工作深入推进,难度越来越大,减贫人数逐年递减的规律;④减贫人数的中位数是1 240万人。正确的个数为( )A.1 B.2 C.3 D.4解析 对于①,由题图,得平均每年减贫人数为×(1 650+1 232+1 442+1 240+1 289+1 386+1 109)≈1 335(万人),故①正确;对于②,由题图知减贫人数最少的一年为2019年,减贫人数为1 109万人,故②正确;对于③,由题图易知减贫人数在2016—2018年逐年递增,故③正确;对于④,由题图知,减贫人数的中位数为1 289万人,故④不正确。综上所述,正确的有3个,故选C。答案 C(2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查。根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( )A.抽样表明,该校约有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸解析 根据频率分布直方图可列下表:阅读时间/分钟[0,10)[10,20)[20,30)[30,40)[40,50)[50,60]抽样人数/名10182225205抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸。答案 A(3)(2021·成都诊断性检测)甲、乙两台机床同时生产一种零件,10天中,两台机床每天生产出的次品数分别是:甲0102203124乙22111211011,2分别表示甲、乙两组数据的平均数,s,s分别表示甲、乙两组数据的方差,则下列选项正确的是( )A.1=2,s>s B.1>2,s>sC.1<2,s>s D.1>2,s<s解析 由题表中数据,得1==,2==,所以1>2。又由题表中数据知,甲组数据比乙组数据的波动幅度大,所以s>s。故选B。答案 B方法悟通(1)用频率分布直方图估计总体的数字特征应注意以下几点。①频率分布直方图的纵轴是,而不是频率。②在频率分布直方图中,每个小长方形的面积才是相应区间的频率。③最高的小长方形底边中点的横坐标是众数。④平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标是中位数。(2)对于其他的统计图表,要注意结合问题背景分析其所表达的意思,进而解决所给问题。 【变式训练1】 (1)某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险。各种保险按相关约定进行参保与理赔。该保险公司对5个险种参保客户进行抽样调查,得出如图所示的统计图,以下四个选项中,说法错误的是( )A.54周岁以上客户人数最少B.18~29周岁客户参保总费用最少C.丁险种更受客户青睐D.30周岁以上的客户约占参保客户的80%解析 由参保人数比例图可知,54周岁以上客户人数最少,30周岁以上的客户约占参保客户的80%,所以A,D项中说法均正确;由参保险种比例图可知,丁险种更受客户青睐,所以C项中说法正确;由不同年龄段人均参保费用图可知,18~29周岁客户人均参保费用最少,但18~29周岁客户所占比例为20%,所以总费用不一定最少。故选B。答案 B(2)甲、乙、丙三名同学在军训的实弹射击中各射击10发子弹,三人的射击成绩如表。s1,s2,s3分别表示甲、乙、丙三名同学这次射击成绩的标准差,则( )环数7环8环9环10环甲的频数2332乙的频数1441丙的频数3223A.s3>s1>s2 B.s2>s1>s3C.s1>s2>s3 D.s2>s3>s1解析 解法一:设1,2,3分别为甲、乙、丙射击成绩的平均数,1=×(7×2+8×3+9×3+10×2)=8.5,s=×[2×(7-8.5)2+3×(8-8.5)2+3×(9-8.5)2+2×(10-8.5)2]=1.05,同理可得,2=×(7×1+8×4+9×4+10×1)=8.5,s=0.65,3=8.5,s=1.45,所以s3>s1>s2。解法二:乙的数据比较集中,方差最小,标准差最小;丙的数据比较分散,方差最大,标准差最大。答案 A(3)某学校共有1 000名学生,其中男生400人,为了解该校学生在学校的月消费情况,采取分层抽样的方法随机抽取了100名学生进行调查,月消费金额(单位:元)分布在450~950之间。根据调查的结果绘制的学生在校月消费金额的频率分布直方图如图所示。则图中a的值为________,估计该校学生月消费金额的平均数为________元(同一组中的数据用该组区间的中点值作代表)。解析 由题意知100×(0.001 5+a+0.002 5+0.001 5+0.001 0)=1,解得a=0.003 5,该校学生月消费金额的平均数=500×0.15+600×0.35+700×0.25+800×0.15+900×0.1=670(元)。答案 0.003 5 670考向二 相关关系与独立性检验【例2】 (1)已知一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(x6,y6),用最小二乘法得到其线性回归方程为=-2x+4,若x1,x2,x3,…,x6的平均数为1,则y1+y2+y3+…+y6=( )A.10 B.12 C.13 D.14解析 回归直线过样本点的中心(,),因为=1,所以=-2×1+4=2,所以y1+y2+y3+…+y6=6×2=12。故选B。答案 B(2)为了判断高中生是否选修理科与性别的关系,现随机调查了50名学生,得到如下的2×2列联表: 选修理科选修文科总计男131023女72027总计203050根据表中的数据,得到K2的观测值k=≈4.844,若P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025,则认为高中生是否选修理科与性别有关系出错的可能性约为( )A.2.5% B.5% C.1% D.10%解析 因为4.844>3.841,P(K2≥3.841)≈0.05,所以认为是否选修理科与性别有关系出错的可能性约为5%。答案 B方法悟通(1)在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值;回归直线过样本点的中心(,),应引起关注。(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K2求解即可。 【变式训练2】 (1)节能降耗是企业的生存之本,所以要树立一种“点点滴滴降成本,分分秒秒增效益”的节能意识,以最好的管理来实现节能效益的最大化。为此某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:年号x12345年生产利润y/千万元0.70.811.11.4预测第8年该国企的年生产利润约为( )(参考公式及数据:回归直线=x+的斜率和截距的最小二乘估计分别为==,=-,iyi-5 =1.7,-52=10)A.1.88千万元 B.2.21千万元C.1.85千万元 D.2.34千万元解析 由已知可得==3,==1, ==0.17,则=-=1-0.17×3=0.49,所以年生产利润与年号的回归方程为=0.17x+0.49,当x=8时,=0.17×8+0.49=1.85。故选C。答案 C(2)随机采访50名观众对某电视节目的满意度,得到如下列联表:单位:人 满意不满意总计男102030女15520总计252550附表和公式如下:P(K2≥k0)0.1000.0500.0100.001k02.7063.8416.63510.828K2=,其中n=a+b+c+d为样本容量。根据以上数据可知( )A.有95%的把握认为对电视节目的满意度与性别无关B.有99%的把握认为对电视节目的满意度与性别C.有99%的把握认为对电视节目的满意度与性别D.有95%的把握认为对电视节目的满意度与性别有关解析 由于K2=≈8.333>6.635,所以有99%的把握认为对电视节目的满意度与性别有关,故选C。答案 C考向三 古典概型与几何概型【例3】 (1)(2021·银川市质量检测)在脱贫攻坚战中,某单位拟派出甲、乙、丙、丁四名同志到三个乡镇参加精准扶贫工作,每名同志只去一个乡镇,每个乡镇至少安排一名同志,则甲、乙分到同一个乡镇的概率等于( )A. B. C. D.解析 先将四名同志中的两名捆绑在一起,然后和余下的两名同志任意分配到三个乡镇,共有CA=36(种)安排方法,其中甲、乙分到同一个乡镇的安排方法有A=6(种),所以所求概率为=。故选A。答案 A(2)(2021·贵阳四校联考)在区间[-2,2]内随机取一个数x,则事件“y=且y∈”发生的概率为( )A. B. C. D.解析 设事件M为“y=且y∈”。易知该分段函数是一个增函数,则或解得-1≤x≤1,所以该事件发生的概率P(M)==。故选D。答案 D方法悟通几何概型问题与古典概型问题求解的思路是相同的,但应注意古典概型适用于试验结果有限的事件,而几何概型适用于试验结果无限的事件。对于两个区域A,B,且A⊂B,当区域B是线段(角、平面图形、立体图形)时,点P落在区域A内的概率与线段的长度(角的度数、平面图形的面积、立体图形的体积)有关时,可以选择长度(角度、面积、体积)作为区域的测度。记点P落在区域A内为事件M,则其概率的计算公式是:P(M)=。 【变式训练3】 (1)(2021·广东惠州第三次调研)我国古代数学家赵爽为了证明勾股定理,创制了一副“弦图”,后人称其为赵爽弦图。如图是在赵爽弦图的基础上创作出的一个“数学风车”,其中正方形ABCD内部为赵爽弦图,正方形ABCD外部四个阴影三角形称为“风叶”。现从该“风叶”的8个顶点中任取2个顶点,则2个顶点取自同一片“风叶”的概率为( )A. B. C. D.解析 从该“风叶”的8个顶点中任取2个顶点,不同的情况有C=28(种)。其中2个顶点取自同一片“风叶”的情况有4C=12(种)。故所求概率为P==。故选A。答案 A(2)(2021·湖北新高考适应性测试)如果3个正整数按照一定顺序可以组成一个等比数列,则称这3个数为一组“等比数”(如1,2,4为一组“等比数”)。从1,2,3,4,5,6,7,8,9中任取3个不同的数,则这3个数构成一组“等比数”的概率为( )A. B. C. D.解析 从9个数中任取3个不同的数,有C=84(种)情况,其中,构成一组“等比数”的情况有{1,2,4},{1,3,9},{2,4,8},{4,6,9},共4种,故这3个数构成一组“等比数”的概率P==。故选C。答案 C(3) (2021·安徽示范高中培优联考)明朝著名易学家来知德以其太极图解释一年、一日之象的图式。如图是来氏一日气象图,其大圆半径为4,大圆内部的同心小圆半径为1,两圆之间的图案是对称的,若在大圆内随机取一点,则该点取自黑色区域的概率为________。解析 设大圆面积为S1,小圆面积为S2,则S1=π×42=16π,S2=π×12=π,可得黑色区域的面积为×(S1-S2)=,所以在大圆内随机取一点,该点取自黑色区域的概率P==。答案 考向四 条件概率【例4】 (2021·四川仁寿一中第一次调研)现从4名男医生和3名女医生中随机抽取两人加入“援鄂医疗队”,用A表示事件“抽到的两名医生性别相同”,用B表示事件“抽到的两名医生都是女医生”,则P(B|A)=( )A. B. C. D.解析 解法一:由已知得P(A)===,P(AB)===,则P(B|A)===。故选A。解法二:P(B|A)===。故选A。答案 A方法悟通解本题的关键点有两处。一是注意积事件的概率的求解:若事件A、事件B是相互独立事件,则P(AB)=P(A)P(B)。二是注意P(B|A)与P(AB)的区别:P(B|A)表示在事件A发生的条件下,事件B发生的概率,P(AB)表示事件A和事件B同时发生的概率。 【变式训练4】 (1)某教师准备对一天的五节课进行课程安排,要求语文、数学、外语、物理、化学每科分别要排一节课,则数学不排第一节课,物理不排最后一节课的情况下,化学排第四节课的概率是( )A. B. C. D.解析 记事件A为“数学不排第一节课,物理不排最后一节课”,事件B为“化学排第四节课”,则P(A)==,P(AB)==,故P(B|A)==。故选C。答案 C(2)非洲成员代表团团长及相关的人员参加了中非合作论坛北京峰会,会后某记者在场地外随机进行采访,假设第一次采访到的人恰好是参会的代表团团长的概率为0.7,连续两次采访到的人都是代表团团长的概率为0.6,则在第一次采访到的人是代表团团长的条件下,第二次采访到的也是代表团团长的概率为________。解析 记第一次采访到的人是代表团团长为事件A,第二次采访到的人是代表团团长为事件B,则P(A)=0.7,P(AB)=0.6,则P(B|A)==。答案 考向五 相互独立事件与二项分布【例5】 (1)某校为了增强学生的记忆力和辨识力,组织了一场比赛。A,B两队各由4名选手组成,每局两队各派一名选手参加比赛,比赛分为四局。除第三局胜者得2分外,其余各局胜者均得1分,每局的负者得0分。假设每局比赛A队选手获胜的概率均为,且各局比赛结果相互独立,则比赛结束时A队的得分高于B队的得分的概率为( )A. B. C. D.解析 A队的得分高于B队的得分的情况有三种:A队的得分为5分,A队的得分为4分,A队的得分为3分。A队的得分为5分的概率为4=,A队的得分为4分的概率为C×2××=,A队的得分为3分的概率为C××2×+C3×=,因此所求概率为++=。故选C。答案 C(2)一个箱子中装有形状完全相同的5个白球和n(n∈N*)个黑球。现从中有放回地摸取4次,每次都是随机摸取1个球,设摸得白球的次数为X,若D(X)=1,则E(X)=( )A.1 B.2 C.3 D.4解析 设每次随机摸取1个球,取到白球的概率为p。由题意知,X~B(4,p),因为D(X)=4p(1-p)=1,所以p=,则E(X)=4p=4×=2。故选B。答案 B 方法悟通(1)求复杂事件的概率,要正确分析复杂事件的构成,看复杂事件是能转化为几个彼此互斥的事件的和事件还是能转化为几个相互独立事件同时发生的积事件,然后用概率公式求解。(2)求随机变量均值与方差的关键是正确求出随机变量的分布列,若随机变量服从二项分布,则可直接使用公式求解。 【变式训练5】 (1)某市为了加强疫情的防控力度,举全市之力入户上门排查确诊的新冠肺炎患者、疑似的新冠肺炎患者、无法明确排除新冠肺炎的发热患者和与确诊患者的密切接触者“四类”人员,强化网格化管理,不落一户、不漏一人。在排查期间,一户6口之家被确认为“与确诊患者的密切接触者”,这种情况下医护人员要对其家庭成员随机地逐一进行核酸检测,若出现阳性,则该家庭为“感染高危户”。设该家庭每个成员检测呈阳性的概率均为p(0<p<1)且相互独立,该家庭至少检测了5个人才能确定为“感染高危户”的概率为f(p),当p=p0时,f(p)最大,则p0=( )A.1- B.C. D.1-解析 设检测5个人确定为“感染高危户”为事件A,检测6个人确定为“感染高危户”为事件B,则P(A)=p(1-p)4,P(B)=p(1-p)5,即f(p)=p(1-p)4+p(1-p)5=p(2-p)(1-p)4。设x=1-p>0,则g(x)=(1-x)(1+x)x4=(1-x2)x4=×[(2-2x2)×x2×x2]≤×3=,当且仅当2-2x2=x2,即x=时取等号,此时p=p0=1-。故选A。答案 A(2)(2021·绵阳市诊断性考试)已知某科技公司员工发表论文获奖的概率都为p,且各员工发表论文是否获奖相互独立。若X为该公司的6名员工发表论文获奖的人数,D(X)=0.96,E(X)>2,则p=________。解析 由已知可得X~B(6,p),则D(X)=6p(1-p)=0.96,即25p2-25p+4=0,解得p=或,若p=,则E(X)=6×<2,不符合题意;若p=,则E(X)=6×=>2,符合题意。故p=。答案 考向六 正态分布【例6】 (1)已知随机变量X服从正态分布N(0,1),随机变量Y服从正态分布N(1,1),且P(X>1)=0.158 7,则P(1<Y<2)=( )A.0.158 7 B.0.341 3C.0.841 3 D.0.658 7解析 设Z=Y-1,因为Y~N(1,1),所以Z~N(0,1),所以P(1<Y<2)=P(0<Z<1)=0.5-P(Z>1)=0.5-0.158 7=0.341 3。故选B。答案 B(2)1 000名学生的成绩近似服从正态分布N(100,100),则成绩在120分以上的学生人数约为________(注:正态总体N(μ,σ2)在区间(μ-σ,μ+σ),(μ-2σ,μ+2σ),(μ-3σ,μ+3σ)内取值的概率分别为0.683,0.954,0.997)。解析 因为1 000名学生成绩近似服从正态分布N(100,100),所以μ=100,σ=10,成绩在(μ-2σ,μ+2σ)=(80,120)的人数约为1 000×0.954=954。所以成绩在120分以上的人数约为×(1 000-954)=23。答案 23方法悟通本题(1)考查正态分布曲线的特点及曲线所表示的意义,主要考查正态曲线的对称性;一般地,X服从正态分布,正态分布一般记为N(μ,σ2),μ为正态分布的均值(均值就是对称轴),σ是正态分布的标准差;本题属于基础题。本题(2)求解此类题的关键:一是μ,σ2所反映的变量的特征;二是正态曲线和x轴之间的平面图形的面积为1;三是正态曲线的对称性。对于求特殊区间的概率的问题,要将所求区间的概率向三个特殊区间的概率P(μ-σ<x≤μ+σ),P(μ-2σ<x≤μ+2σ),P(μ-3σ<x≤μ+3σ)转化,然后利用特定值求出相应的概率。 【变式训练6】 (2021·昆明市诊断测试)随着《生物多样性公约》第十五次缔约方大会(COP15)重新确定于2021年5月17日至30日在云南省昆明市举办,“生物多样性”的目标、方法和全球通力合作,又成为国际范围的热点关注内容。昆明市市花为云南山茶花,又名滇山茶,原产云南,国家二级保护植物。为了监测滇山茶的生长情况,从不同林区随机抽取100株滇山茶测量胸径D(单位:厘米)作为样本,通过数据分析得到D~N(12.5,4.52),若将D≥21.5的植株建档重点监测,据此估算20 000株滇山茶建档的约有________株。附:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)≈0.682 7,P(μ-2σ<X≤μ+2σ)≈0.954 5。解析 因为D~N(12.5,4.52),所以μ=12.5,σ=4.5,所以P(D≥21.5)=P(D≥μ+2σ)=≈=0.022 75,由样本估计总体的思想得20 000株滇山茶建档的约有0.022 75×20 000=455(株)。答案 455练真题 明确考向回 味 高 考1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析 对于A,根据频率分布直方图可知,家庭年收入低于4.5万元的农户比率约为(0.02+0.04)×1×100%=6%,故A正确;对于B,根据频率分布直方图可知,家庭年收入不低于10.5万元的农户比率约为(0.04+0.02+0.02+0.02)×1×100%=10%,故B正确;对于C,根据频率分布直方图可知,该地农户家庭年收入的平均值约为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),故C错误;对于D,根据频率分布直方图可知,家庭年收入介于4.5万元至8.5万元之间的农户比率约为(0.10+0.14+0.20+0.20)×1×100%=64%>50%,故D正确。答案 C2.(2021·全国甲卷)将4个1和2个0随机排成一行,则2个0不相邻的概率为( )A. B. C. D.解析 解法一(将4个1和2个0视为完全不同的元素):4个1分别设为1A,1B,1C,1D,2个0分别设为0A,0B,将4个1和2个0随机排成一行有A种排法,将1A,1B,1C,1D排成一行有A种排法,再将0A,0B插空有A种排法,所以2个0不相邻的概率P==。解法二(含有相同元素的排列):将4个1和2个0安排在6个位置,则选择2个位置安排0,共有C种排法;将4个1排成一行,把2个0插空,即在5个位置中选2个位置安排0,共有C种排法。所以2个0不相邻的概率P==。答案 C3.(2021·全国乙卷)在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于的概率为( )A. B. C. D.解析 在区间(0,1)中随机取一个数,记为x,在区间(1,2)中随机取一个数,记为y,两数之和大于,即x+y>,则在如图所示的平面直角坐标系中,点(x,y)构成的区域是边长为1的正方形区域(不含边界),事件A“两数之和大于”即x+y>中,点(x,y)构成的区域为图中阴影部分(不含边界),由几何概型的概率计算公式得P(A)==。故选B。答案 B4.(2020·全国Ⅰ卷)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x解析 根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图并结合选项可排除A,B,C,故选D。答案 D5.(2020·全国Ⅲ卷)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且i=1,则下面四种情形中,对应样本的标准差最大的一组是( )A.p1=p4=0.1,p2=p3=0.4B.p1=p4=0.4,p2=p3=0.1C.p1=p4=0.2,p2=p3=0.3D.p1=p4=0.3,p2=p3=0.2解析 观察法,比较A,B,C,D四项,B数据最分散,所以B的标准差最大。故选B。答案 B6.(2019·全国Ⅰ卷)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束)。根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”。设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是________。解析 记事件M为甲队以4∶1获胜,则甲队共比赛五场,且第五场甲队获胜,前四场甲队胜三场负一场,所以P(M)=0.6×(0.62×0.52×2+0.6×0.4××2)=0.18。答案 0.187.(2021·浙江高考)袋中有4个红球,m个黄球,n个绿球。现从中任取两个球,记取出的红球数为ξ,若取出的两个球都是红球的概率为,一红一黄的概率为,则m-n=________,E(ξ)=________。解析 由题意可得,P(ξ=2)===,化简得(m+n)2+7(m+n)-60=0,得m+n=5,取出的两个球一红一黄的概率为==,解得m=3,故n=2。所以m-n=1,易知ξ的所有可能取值为0,1,2,且P(ξ=2)=,P(ξ=1)==,P(ξ=0)==,所以E(ξ)=0×+1×+2×=。答案 1 增分专练(九) 统计与统计案例、概率A级 基础达标一、选择题1.(2021·东北三校联考)某口罩厂的三个车间在一个小时内共生产3 600个口罩,在出厂前要检查这批口罩的质量,现决定采用分层抽样的方法进行抽取。若从第一、二、三车间抽取的口罩个数分别为a,b,c,且a,b,c成等差数列,则第二车间生产的口罩个数为( )A.800 B.1 000 C.1 200 D.1 500解析 因为a,b,c成等差数列,所以a+c=2b,则第二车间生产的口罩个数为3 600×=3 600×=1 200。故选C。答案 C2.为了贯彻素质教育,培养各方面人才,使每位学生充分发挥各自的优势,实现卓越发展,某高校将其某一学院分为不同的特色专业,各专业人数比例相关数据统计如图,每位学生限修一门专业。若形体专业共300人,则下列说法错误的是( )A.智能专业共有630人B.该学院共有3 000人C.非文化类专业共有1 800人D.动漫专业共有800人解析 该学院共有=3 000(人),故B正确;由题意可知,文化类专业人数占该学院总人数的1-15%-18%-12%-10%-5%=40%,智能专业人数占该学院总人数的40%-3%-6%-10%=21%,所以智能专业共有3 000×21%=630(人),故A正确;非文化类专业共有3 000×(1-40%)=1 800(人),故C正确;动漫专业共有3 000×15%=450(人),故D错误。故选D。答案 D3.(2021·天津高考)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A.20 B.40C.64 D.80解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80。故选D。答案 D4.我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产。如图是某地连续11天复工、复产指数折线图,下列说法正确的是( )A.这11天复工指数和复产指数均逐日增加B.这11天复产指数的增量大于复工指数的增量C.第3天至第11天复工、复产指数均超过80%D.第9天至第11天复产指数的增量小于复工指数的增量解析 对于A项,从题图中可以看出,复工指数与复产指数均不是逐日增加的,故A错误;对于B项,由题图知,复工指数的增量大于复产指数的增量,故B错误;对于C项,从第3天开始,复工、复产指数均在80%以上,故C正确;对于D项,由题图可知,第9天至第11天复产指数的增量大于复工指数的增量,故D错误。综上可知,选C。答案 C5.(2021·唐山市二模)已知多项选择题的四个选项A,B,C,D中至少有两个选项正确,规定:如果选择了错误选项就不得分。若某题的正确答案是ABC,某考生随机选了两个选项,则其得分的概率为( )A. B.C. D.解析 根据古典概型的概率计算公式可得,所求概率为=,故选A。答案 A6.已知5道试题中有3道代数题和2道几何题,每次从中抽取一道题,抽取的题不再放回。在第1次抽到代数题的条件下,第2次抽到几何题的概率为( )A. B.C. D.解析 设事件A=“第1次抽到代数题”,事件B=“第2次抽到几何题”,则P(B|A)==。故选C。答案 C7.某地以“绿水青山就是金山银山”理念为引导,推进绿色发展,现要订购一批苗木,苗木长度与售价如下表:苗木长度x/厘米384858687888售价y/元16.818.820.822.82425.8由表可知,苗木长度x(厘米)与售价y(元)之间存在线性相关关系,回归方程为=0.2x+,则当苗木长度为150厘米时,售价大约为( )A.33.3元 B.35.5元C.38.9元 D.41.5元解析 由题意知,=×(16.8+18.8+20.8+22.8+24+25.8)=21.5,=×(38+48+58+68+78+88)=63,因为回归直线一定过样本点的中心(,),所以21.5=0.2×63+,解得=8.9,因此回归直线方程为=0.2x+8.9,所以当苗木长度为150厘米时,=0.2×150+8.9=38.9,故选C。答案 C8.(2021·南京市一模)某词汇研究机构为了解某城市人们使用流行语的情况,随机抽取了该市200人进行调查统计得如下2×2列联表。则根据列联表可知( ) 年轻人非年轻人总计经常用流行用语12525150不常用流行用语351550总计16040200A.有95%的把握认为“经常用流行用语”与“年轻人”有关系B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系C.有97.5%的把握认为“经常用流行用语”与“年轻人”有关系D.没有97.5%的把握认为“经常用流行用语”与“年轻人”有关系参考公式:K2=,其中n=a+b+c+d。下面的临界值表供参考:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解析 因为K2=≈4.167>3.841,所以有95%的把握认为“经常用流行用语”与“年轻人”有关系。答案 A9.(2021·新高考全国Ⅱ卷)某物理量的测量结果服从正态分布N(10,σ2),则下列结论中不正确的是( )A.σ越小,该物理量一次测量结果落在(9.9,10.1)内的概率越大B.σ越小,该物理量一次测量结果大于10的概率为0.5C.σ越小,该物理量一次测量结果大于10.01的概率与小于9.99的概率相等D.σ越小,该物理量一次测量结果落在(9.9,10.2)内的概率与落在(10,10.3)内的概率相等解析 对于A,σ越小,正态分布的图象越瘦高,总体分布越集中在对称轴附近,故A正确。对于B,C,由正态分布图象的对称轴为μ=10,得B,C正确。对于D,显然错误。故选D。答案 D10.(2021·福建省诊断性考试)某地举办“迎建党100周年”乒乓球团体赛,比赛采用新斯韦思林杯赛制(5场单打3胜制,即先胜3场者获胜,比赛结束)。现有两支球队进行比赛,前3场依次分别由甲、乙、丙和A、B、C出场比赛。若经过3场比赛未分出胜负,则第4场由甲和B进行比赛;若经过4场比赛仍未分出胜负,则第5场由乙和A进行比赛。假设甲与A或B比赛,甲每场获胜的概率均为0.6;乙与A或B比赛,乙每场获胜的概率均为0.5;丙与C比赛,丙每场获胜的概率均为0.5;各场比赛的结果互不影响。那么,恰好经过4场比赛分出胜负的概率为( )A.0.24 B.0.25C.0.38 D.0.5解析 记“恰好经过4场比赛分出胜负”“恰好经过4场比赛甲所在球队获胜”“恰好经过4场比赛A所在球队获胜”分别为事件D,E,F,则E,F互斥,且P(D)=P(E)+P(F)。若事件E发生,则第4场比赛甲获胜,且前3场比赛甲所在球队恰有一场比赛失利,由于甲与A或B比赛每场获胜的概率均为0.6,乙与A或B比赛每场获胜的概率均为0.5,丙与C比赛每场获胜的概率均为0.5,且各场比赛结果相互独立,所以甲所在球队恰好经过4场比赛获得胜利的概率P(E)=0.6×(0.4×0.5×0.5+0.6×C×0.5×0.5)=0.24。若事件F发生,则第4场比赛B获胜,且前3场比赛A所在球队恰有一场比赛失利,由于甲与A或B比赛每场获胜的概率均为0.6,乙与A或B比赛每场获胜的概率均为0.5,丙与C比赛每场获胜的概率均为0.5,且各场比赛结果相互独立,所以A所在球队恰好经过4场比赛获得胜利的概率P(F)=0.4×(0.6×0.5×0.5+0.4×C×0.5×0.5)=0.14,所以P(D)=P(E)+P(F)=0.38,故选C。答案 C二、填空题11.(2021·石家庄市质量检测)已知随机变量X服从正态分布N(10,σ2),若P(X<8)=0.23,则P(X≤12)=________。解析 因为随机变量X服从正态分布N(10,σ2),即μ=10,所以正态曲线关于直线x=10对称,即P(X≤10)=0.5,又P(X<8)=0.23,所以P(8≤X≤10)=0.5-0.23=0.27,由正态曲线的对称性可知P(10<X≤12)=0.27,所以P(X≤12)=P(X≤10)+P(10<X≤12)=0.5+0.27=0.77。答案 0.7712.若8件产品中包含6件一等品,在其中任取2件,则在已知取出的2件中有1件不是一等品的条件下,另1件是一等品的概率为________。解析 设事件A为“从8件产品中取出的2件产品中有1件不是一等品”,事件B为“从8件产品中取出的2件产品中有1件是一等品”,则P(A)==,P(AB)===,所以在已知取出的2件中有1件不是一等品的条件下另1件是一等品的概率为P(B|A)===。答案 13.已知甲、乙两球落入盒子的概率分别为和。假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为________;甲、乙两球至少有一个落入盒子的概率为________。解析 依题意得,甲、乙两球都落入盒子的概率为×=,甲、乙两球都不落入盒子的概率为×=,则甲、乙两球至少有一个落入盒子的概率为1-=。答案 14.勤洗手、常通风、戴口罩是切断新冠肺炎传播的有效手段。疫情期间某小区居民人人养成了出门戴口罩的好习惯,且选择佩戴一次性医用口罩的概率为p,每人是否选择佩戴一次性医用口罩是相互独立的。现随机抽取5位该小区居民,其中选择佩戴一次性医用口罩的人数为X,且P(X=2)<P(X=3),D(X)=1.2,则p的值为________。解析 显然X服从二项分布,因为D(X)=1.2,所以5p(1-p)=1.2,解得p=0.6或p=0.4,因为P(X=2)<P(X=3),所以Cp2(1-p)3<Cp3(1-p)2,解得p>0.5,所以p=0.6。答案 0.6B级 素养落实B级 素养落实15.(2021·唐山市二模)劳动力调查是一项抽样调查。2021年的劳动力调查以第七次人口普查的最新数据为基础抽取相关住户进入样本,并且采用样本轮换模式。劳动力调查的轮换是按照“2-10-2”模式进行,即一个住户连续2个月接受调查,在接下来的10个月中不接受调查,然后再接受连续2个月的调查,经历四次调查之后退出样本。调查进行时保持每月进入样本接受第一次调查的新住户数量相同,若从第k个月开始,每个月都有的样本接受第一次调查,的样本接受第二次调查,的样本接受第三次调查,的样本接受第四次调查,则k的值为( )A.12 B.13C.14 D.15解析 将第i个月新增的住户记作Ai,i=1,2,…,由题意可得第1个月接受调查的是A1;第2个月接受调查的是A2,A1;第3个月接受调查的是A3,A2;第4个月接受调查的是A4,A3;第5个月接受调查的是A5,A4;第6个月接受调查的是A6,A5;…;第11个月接受调查的是A11,A10;第12个月接受调查的是A12,A11;第13个月接受调查的是A13,A12,A1;第14个月接受调查的是A14,A13,A1,A2;第15个月接受调查的是A15,A14,A2,A3。所以k的值为14。故选C。答案 C16.已知随机变量ξ的分布列如下,则下列说法正确的是( )ξxyPyxA.存在x,y∈(0,1),E(ξ)>B.对任意x,y∈(0,1),E(ξ)≤C.对任意x,y∈(0,1),D(ξ)≤E(ξ)D.存在x,y∈(0,1),D(ξ)>解析 依题意可得E(ξ)=2xy,D(ξ)=(x-2xy)2y+(y-2xy)2x=(1-2y)2x2y+(1-2x)2y2x=[(1-2y)2x+(1-2x)2y]yx。因为x+y=1,所以2xy≤=,当且仅当x=y=时取等号,即E(ξ)≤,故A,B中说法错误;D(ξ)=[(2x-1)2x+(1-2x)2y]yx=(1-2x)2(x+y)yx=(1-2x)2yx,因为0<x<1,所以-1<1-2x<1,所以0≤(1-2x)2<1,所以D(ξ)<yx,即D(ξ)<E(ξ),故C中说法正确;因为D(ξ)=(1-2x)2yx<xy≤=,故D中说法错误。故选C。答案 C17.(2021·武汉市质量检测)在一次以“二项分布的性质”为主题的数学探究活动中,某中学高三一个小组的学生表现优异,发现的正确结论得到老师和同学的一致好评。设随机变量X~B(n,p),记pk=Cpk(1-p)n-k,k=0,1,2,…,n。在研究pk的最大值时,小组同学发现:若(n+1)p为正整数,则当k=(n+1)p时,pk=pk-1,此时这两项概率均为最大值;若(n+1)p为非整数,则当k取(n+1)p的整数部分时,pk是唯一的最大值。以此为理论基础,某同学重复投掷一枚质地均匀的骰子并实时记录点数1出现的次数。当投掷到第20次时,记录到此时点数1出现5次,若继续再进行80次投掷试验,则当投掷到第100次时,点数1总共出现的次数为________的概率最大。解析 当投掷到第20次时,点数1出现了5次,若再投掷80次,设出现点数1的次数为X,则X~B,因为(80+1)×=不是整数,且其整数部分是13,所以当再投掷80次时,点数1出现13次的概率最大,所以当投掷到第100次时,点数1总共出现的次数为13+5=18的概率最大。答案 18大题专项 概率与统计大题考向探究命|题|分|析概率部分解答题的考查重点是离散型随机变量的分布列和数学期望的计算、事件的独立性和n次独立重复试验模型的综合问题等;统计部分解答题应重点关注古典概型与频率分布直方图综合以及回归分析的相关命题。题型主要有:1.以相互独立事件、二项分布、超几何分布为背景求随机变量的分布列、期望与方差。2.回归分析与统计的综合问题。精析精研 重点攻关考 向 突 破考向一 互斥或相互独立事件的概率【例1】 已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16。现采用分层抽样的方法从中抽取7人进行睡眠时间的调查。(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽取的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查。①用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;②设事件A为“抽取的3人中,既有睡眠充足的员工,又有睡眠不足的员工”,求事件A发生的概率。解 (1)由已知得,甲、乙、丙三个部门的员工人数之比为3∶2∶2,因为采用分层抽样的方法从中抽取7人,所以应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人。(2)①随机变量X的所有可能取值为0,1,2,3,P(X=k)=(k=0,1,2,3),所以随机变量X的分布列为X0123P随机变量X的数学期望E(X)=0×+1×+2×+3×=。②设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”,事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥。由①知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=,所以事件A发生的概率为。方法悟通(1)对于一些相对复杂的概率题一般可以采用两种方法处理:一是将所求事件的概率转化成多个互斥事件的概率和,这时要注意事件是否互斥,是否具有完备性;二是先求出此事件的对立事件的概率,即正难则反的意识。另外,对于多数考题,独立事件与互斥事件是混和使用的,一般情况下是将多个独立事件分解成若干个互斥事件求解。(2)解题时要认真审题,找准关键字句,提高解题能力,知道“至少有一个发生”“至多有一个发生”“恰有一个发生”“都发生”“不都发生”等词语的意义以及它们的概率关系和计算公式。 【变式训练1】 甲、乙两名射击运动员进行射击训练。已知甲命中10环、9环、8环的概率分别是,,,乙命中10环、9环、8环的概率分别是,,,任意两次射击相互独立。(1)求甲运动员两次射击命中环数之和恰好为18的概率;(2)现在甲、乙两人进行射击比赛,每1轮比赛两人各射击一次,环数高于对方为胜,环数低于对方为负,环数相等为平局,规定连续胜利2轮的选手为最终的胜者,比赛结束,求恰好进行3轮射击后比赛结束的概率。解 (1)记X表示甲运动员两次射击命中环数之和,则X=18包含“第一次命中10环和第二次命中8环”“第一次命中8环和第二次命中10环”“第一次命中9环和第二次命中9环”这三种情况,所以甲运动员两次射击命中环数之和恰好为18的概率为C××+×=。(2)记Ai表示甲在第i轮获胜,Bi表示甲、乙在第i轮平局,Ci表示乙在第i轮获胜,i=1,2,3,…,则P(Ai)=×+×=,P(Bi)=×+×+×=,P(Ci)=。①当甲获得最终胜利时,第2轮、第3轮甲连续胜利,第1轮甲没有获得胜利,其概率P1=××=。②当乙获得最终胜利时,第2轮、第3轮乙连续胜利,第1轮乙没有获得胜利,其概率P2=××=。所以恰好进行3轮射击后比赛结束的概率P=P1+P2=+=。考向二 二项分布的期望与方差【例2】 (2021·河南洛阳联考)为提升销量,某电商在其网店首页设置了“勇闯关,赢红包”的游戏。其游戏规则如下:在网页上设置三个翻牌关卡,每个关卡翻牌结果只有通过与失败两种,若买家通过这三关,则认为闯关成功;若三关均未通过或只通过三关中的一关,则游戏失败;若三关中恰好通过两关,则允许参加复活环节,复活环节有两个翻牌关卡,若两关均通过,也认为闯关成功,否则认为闯关失败。假定买家每一关通过的概率均为,且各关卡之间是否通过相互独立。(1)求某买家参加这个游戏闯关成功的概率。(2)若闯关成功,则买家可赢得50元的购物红包;若闯关失败,则买家可获得10元的购物红包,红包可直接抵扣在该网店购物的货款。某日有8 100人参加了这个游戏且均在该网店使用红包消费。①求该日所有买家所获红包总金额X的数学期望;②假定该电商从未中奖的买家的购物中的平均获利为8元/人,从中奖的买家的购物中的平均获利为120元/人(均不含所发红包金额),试从数学期望的角度判断该电商该日通过游戏搞促销活动是否合算,并说明理由。解 (1)买家通过三关的概率为C×3=,买家参加复活环节并闯关成功的概率为C×2××C×2=,所以买家闯关成功的概率为P=+=。(2)①由(1)可知,买家闯关成功的概率为P=,设这8 100人中闯关成功的人数为Y,则X=50Y+10(8 100-Y)=40Y+81 000,且Y~B,所以Y的数学期望为E(Y)=8 100×=500,所以该日所有买家所获红包总金额X的数学期望为E(X)=E(40Y+81 000)=40E(Y)+81 000=101 000(元)。②设该电商该日剔除红包金额后盈利Z元,则E(Z)=8×(8 100-500)+120×500-E(X)=19 800(元),由此可见,该电商该日通过游戏搞促销活动盈利较多,很合算。方法悟通 本题的易错点有两处。一是将二项分布与超几何分布搞混,导致所求的期望出错,若能够断定X服从二项分布B(n,p),则E(X)=np。若能够断定X服从超几何分布H(N,M,n),则E(X)=。二是期望的性质与方差的性质搞混,导致结果出错,需明晰:若Y=aX+b(a,b为常数),则E(Y)=aE(X)+b,D(Y)=a2D(X)。 【变式训练2】 互联网正在改变着人们的生活方式,在日常消费中手机支付正逐渐取代现金支付从而成为人们首选的支付方式。某学生在暑期社会活动中针对人们生活中的支付方式进行了调查研究,采用问卷调查的方式对100名18岁以上的消费者进行研究,发现共有60人以手机支付作为首选支付方式,在仍以现金支付作为首选支付方式的人中,45岁及以上的有30人。(1)从以现金支付作为首选支付方式的40人中任意抽取3人,求这3人中至少有1人的年龄低于45岁的概率。(2)某商家为了鼓励人们使用手机支付,做出以下促销活动:凡是用手机支付的消费者,商品一律打八折。已知某商品原价为50元,以上述调查中支付方式的频率作为消费者购买该商品时支付方式的概率,设消费者的支付方式都是相互独立的,求销售10件该商品的销售额的数学期望。解 (1)设事件A表示“这3人中至少有1人的年龄低于45岁”,则P(A)=1-=。(2)由题意知,一名消费者以手机支付作为首选支付方式的概率为=。设X表示销售的10件商品中以手机支付作为首选支付方式的商品件数,则X~B,设销售10件商品的销售额为Y元,则Y=40X+50(10-X)=500-10X,所以Y的数学期望E(Y)=500-10E(X)=500-10×10×=440。考向三 回归分析的实际应用 【例3】 (2021·兰州市诊断考试)某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度变化的关系,他们收集了一只该种昆虫在温度x ℃时相对应产卵数y的8组数据,为了对数据进行分析,他们绘制了如下散点图:(1)根据散点图,甲、乙两位同学分别用=x+和=x+(其中z=ln y)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数R2更接近于1;(给出判断即可,不必说明理由)(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程;(方程表示为=f(x)的形式,数据计算结果保留两位小数)iyiizi26723.311 8717575 722(3)据测算,若一只该种昆虫的产卵数超过e4,则会发生虫害,研究性学习小组的同学通过查阅气象资料得知近期当地气温维持在25 ℃左右,试利用(2)中的回归方程预测近期当地是否会发生虫害。附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=u+的斜率和截距的最小二乘估计分别为=,=-。解 (1)乙同学选用的模型的相关指数R2更接近于1。(2)根据(1)的结论,应选择=x+作为回归方程,根据公式,得==≈0.22,=-≈3.3-0.22×26=-2.42,所以=0.22x-2.42,故y关于x的回归方程为=e0.22x-2.42。(3)当x=25时,=e3.08<e4,因此,近期当地不会发生虫害。方法悟通1.求回归直线方程的关键及实际应用(1)关键:正确理解,的计算公式和准确地计算。(2)实际应用:在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值。2.相关系数(1)当r>0时,表明两个变量正相关;当r<0时,两个变量负相关。(2)当|r|>0.75时,认为两个变量具有较强的线性相关关系。 【变式训练3】 (2021·西安五校联考)某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加。为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区,依据抽样数据计算得到相应的相关系数r=0.81;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据(xi,yi)(i=1,2,…,30),其中xi和yi分别表示第i个样本区的植物覆盖面积(单位:平方百米)和这种野生动物的数量,并计算得i=60,i=1 200,(xi-)2=90,(yi-)2=8 000,(xi-)(yi-)=800。(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样本区这种野生动物数量的平均值乘以地块数);(2)求方案二抽取的样本数据(xi,yi)(i=1,2,…,30)的相关系数(精确到0.01),并判定哪种抽样方法更能准确估计。附:相关系数r=,≈1.414;相关系数的绝对值|r|∈[0.75,1],则相关性很强,|r|的值越大,相关性越强。解 (1)由题意可得,样本区野生动物数量的平均值为i=×1 200=40,又地块数为300,所以该地区这种野生动物数量的估计值为300×40=12 000。(2)由题中数据可得,样本数据(xi,yi)(i=1,2,…,30)的相关系数r===≈0.94。因为方案一的相关系数r=0.81,明显小于方案二的相关系数r≈0.94,所以方案二的分层抽样方法更能准确估计。考向四 概率的综合应用【例4】 (2021·湖北省四地六校联考)在全球抗击新冠肺炎疫情期间,我国医疗物资生产企业加班加点生产口罩、防护服、消毒水等防疫物品,保障抗疫一线医疗物资的供应。我国某口罩生产厂商在加大生产的同时,狠抓质量管理,不定时抽查口罩质量,该厂质检人员从某日所生产的口罩中随机抽取了100个,将其质量指标值分成以下五组:[100,110),[110,120),[120,130),[130,140),[140,150],得到如图所示的频率分布直方图。(1)规定:口罩的质量指标值越高,说明该口罩质量越好,其中质量指标值在[100,130)内的为二级口罩,质量指标值不低于130的为一级口罩。现从样本口罩中利用分层抽样的方法随机抽取8个口罩,再从中抽取3个,记其中一级口罩的个数为X,求X的分布列及数学期望。(2)在2020年“五一”劳动节前,甲计划在某网络购物平台上参加A店的一个该型号口罩订单的“秒杀”抢购,同时乙计划在某网络购物平台上参加B店的一个该型号口罩订单的“秒杀”抢购,其中每个订单均由n(n≥2,n∈N*)个该型号口罩构成。假定甲、乙两人在A,B两店“秒杀”成功的概率均为,记甲、乙两人抢购成功的订单总数量、口罩总数量分别为Z,Y。①求Z的分布列及数学期望E(Z);②当Y的数学期望E(Y)取最大值时,求正整数n的值。解 (1)按分层抽样抽取8个口罩,则其中二级口罩、一级口罩的个数分别为6,2。X的所有可能取值为0,1,2。则P(X=0)==,P(X=1)==,P(X=2)==,所以X的分布列为X012P所以E(X)=0×+1×+2×=。(2)①由题意得,Z的所有可能取值为0,1,2,则P(Z=0)=2=,P(Z=1)=2·=,P(Z=2)=。所以Z的分布列为Z012P可得E(Z)=0×+1×+2×=。②因为Y=nZ,所以E(Y)=nE(Z)==≤,当且仅当n=2时取等号。所以E(Y)取最大值时,正整数n的值为2。方法悟通本题是函数与概率的综合问题。列出数学均值的表达式,运用基本不等式或函数的方法解决。 【变式训练4】 (2021·湖北十一校联考)2020年5月15日,习近平总书记主持召开中共中央政治局会议,讨论国务院拟提请第十三届全国人民代表大会第三次会议审议的《政府工作报告》稿。会议指出,要毫不放松常态化疫情防控,着力做好经济社会发展各项工作。某企业积极响应政府号召,努力做好复工复产工作,准备投产一批特殊型号的产品,已知该种产品的成本f(x)与产量x的函数关系式为f(x)=-3x2+20x+10(x>0)。该种产品的市场前景无法确定,有三种可能出现的情形,各种情形发生的概率及产品价格g(x)与产量x的函数关系式如下表所示:市场情形概率价格g(x)与产量x的函数关系式好0.4g(x)=164-3x中0.4g(x)=101-3x差0.2g(x)=70-3x设Q1(x),Q2(x),Q3(x)分别表示市场情形好、中、差时的利润,随机变量ξ表示当产量为x时而市场前景无法确定的利润。(1)分别求利润Q1(x),Q2(x),Q3(x)的函数关系式;(2)当产量x确定时,求期望E(ξ);(3)试问产量x取何值时,期望E(ξ)取得最大值。解 (1)根据所给的表格中的数据和题意得,Q1(x)=g(x)·x-f(x)=-+144x-10(x>0),Q2(x)=g(x)·x-f(x)=-+81x-10(x>0),Q3(x)=g(x)·x-f(x)=-+50x-10(x>0)。(2)由期望的定义可知E(ξ)=0.4Q1(x)+0.4Q2(x)+0.2Q3(x)=-+100x-10(x>0)。(3)由(2)可知E(ξ)是产量x的函数,设h(x)=-+100x-10(x>0),则h′(x)=-x2+100(x>0),令h′(x)=0,则x=10,所以h(x)在(0,10)上单调递增,在(10,+∞)上单调递减。由题意及问题的实际意义可知,当x=10时,h(x)取得最大值,即E(ξ)最大时的产量为10。练真题 明确考向回 味 高 考1.(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为s和s。(1)求,,s,s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高。解 (1)由表格中的数据易得:=+10.0=10.0,=+10.0=10.3,s=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,s=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04。(2)由(1)中数据可得-=10.3-10.0=0.3,而2==,显然有->2成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高。2.(2021·全国甲卷)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表: 一级品二级品合计甲机床15050200乙机床120802002合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:K2=,P(K2≥k)0.0500.0100.001k3.8416.63510.828。解 (1)根据题表中数据知,甲机床生产的产品中一级品的频率是=0.75,乙机床生产的产品中一级品的频率是=0.6。(2)根据题表中的数据可得K2==≈10.256。因为10.256>6.635,所以有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异。3.(2021·新高考全国Ⅰ卷)某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束。A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分。已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关。(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由。解 (1)由题意得,X的所有可能取值为0,20,100,P(X=0)=1-0.8=0.2,P(X=20)=0.8×(1-0.6)=0.32,P(X=100)=0.8×0.6=0.48,所以X的分布列为X020100P0.20.320.48(2)当小明先回答A类问题时,由(1)可得E(X)=0×0.2+20×0.32+100×0.48=54.4。当小明先回答B类问题时,记Y为小明的累计得分,则Y的所有可能取值为0,80,100,P(Y=0)=1-0.6=0.4,P(Y=80)=0.6×(1-0.8)=0.12,P(Y=100)=0.6×0.8=0.48,所以Y的分布列为Y080100P0.40.120.48E(Y)=0×0.4+80×0.12+100×0.48=57.6。因为57.6>54.4,即E(Y)>E(X),所以为使累计得分的期望最大,小明应选择先回答B类问题。4.(2020·全国Ⅰ卷)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束。经抽签,甲、乙首先比赛,丙轮空。设每场比赛双方获胜的概率都为。(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率。解 (1)甲连胜四场的概率为。(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛。比赛四场结束,共有三种情况:甲连胜四场的概率为;乙连胜四场的概率为;丙上场后连胜三场的概率为。所以需要进行第五场比赛的概率为1---=。(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为;比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为,,。因此丙最终获胜的概率为+++=。增分专练(十) 概率与统计大题考向探究 第一次作业 基础通关训练1.为了实现中华民族伟大复兴之梦,把我国建设成为富强、民主、文明、和谐、美丽的社会主义现代化强国,党和国家为劳动者开拓了宽广的创造性劳动的舞台。借此“东风”,某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动。该农场采用了延长光照时间和降低夜间温度两种不同方案。为比较两种方案下亩产量的区别,该农场选取了40间大棚(每间1亩),分成两组,每组20间进行试点。第一组采用延长光照时间的方案,第二组采用降低夜间温度的方案,同时种植该蔬菜一季,得到各间大棚亩产量数据信息如下图:(1)如果你是该农场的负责人,在只考虑亩产量的情况下,请根据图中的数据信息,对于下一季大棚蔬菜的种植,说出你的决策方案并说明理由。(2)已知种植该蔬菜每年固定的成本为6千元/亩。若采用延长光照时间的方案,光照设备每年的成本为0.22千元/亩;若采用降低夜间温度的方案,降温设备每年的成本为0.2千元/亩。已知该农场共有大棚100间(每间1亩),农场种植的该蔬菜每年产出两次,且该蔬菜市场的收购均价为1千元/千斤。根据题中所给数据,用样本估计总体,请计算在两种不同的方案下,种植该蔬菜一年的平均利润。解 (1)估计第一组数据的平均数为5.05×0.1+5.15×0.2+5.25×0.4+5.35×0.3=5.24,第二组数据的平均数为5.18×+5.20×+5.22×+5.24×+5.26×+5.28×=5.22,因为5.24>5.22,所以第一组方案较好,对于下一季大棚蔬菜的种植,可采用延长光照时间的方案。(2)若采用延长光照时间的方案,由(1)知,平均亩产量约为5.24千斤,所以估计该农场种植该蔬菜一年的平均利润为(5.24×2×1-6-0.22)×100=426(千元)。若采用降低夜间温度的方案,由(1)知,平均亩产量约为5.22千斤,所以估计该农场种植该蔬菜一年的平均利润为(5.22×2×1-6-0.2)×100=424(千元)。因此,该农场若采用延长光照时间的方案,预计种植该蔬菜一年的平均利润为426千元;若采用降低夜间温度的方案,预计种植该蔬菜一年的平均利润为424千元。2.(2021·郑州质量检测)2021年2月25日,在全国脱贫攻坚总结表彰大会上,习近平总书记庄严宣告:我国脱贫攻坚战取得了全面胜利。目前,河南省53个贫困县已经全部脱贫摘帽,退出贫困县序列。2016年起,我省某贫困地区创新开展产业扶贫,响应第三产业的扶贫攻坚政策,经济收入逐年增加。该地的经济收入变化及构成比例如下所示:年份20162017201820192020年份代号x12345经济收入y/万元5009001 4001 7002 000(1)根据以上图表,试分析:与2016年相比,2020年第三产业与种植业收入变化情况;(2)求该地区经济收入y关于x的线性回归方程,并预测2025年该地区的经济收入。参考公式:对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,…,n),其回归直线=x+的斜率和截距的最小二乘估计分别为==,=-。解 (1)①与2016年相比,2020年第三产业的收入占比大幅度增加;②2016年第三产业的收入为30万元,2020年第三产业的收入为600万元,收入大幅度增加;③与2016年相比,种植业收入占比减少,但种植业收入依然保持增长。(2)由表格数据可得=×(1+2+3+4+5)=3,=×(500+900+1 400+1 700+2 000)=1 300,=12+22+32+42+52=55,iyi=1×500+2×900+3×1 400+4×1 700+5×2 000=23 300,则====380,=-=160,则该地区经济收入y关于x的线性回归方程为=380x+160,当x=10时,=3 960,故2025年该地区的经济收入大约为3 960万元。3.(2021·武汉市质量检测)有关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用。2020年4月,“一盔一带”安全守护行动在全国各地开展。行动期间,公安交管部门加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔、汽车驾乘人员不使用安全带的行为,助推养成安全习惯。该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1 000名骑行人员中,记录其年龄(单位:岁)和是否佩戴头盔情况,得到如下的统计图:(1)估算该市电动自行车骑乘人员的平均年龄;(2)根据所给的数据,完成下面的列联表:年龄/岁是否佩戴头盔是否[20,40) [40,70] (3)根据(2)中的列联表,判断是否有99%的把握认为遵守佩戴安全头盔规则与年龄有关。附:K2=。P(K2≥k)0.0500.0100.001k3.8416.63510.828解 (1)该市电动自行车骑乘人员的平均年龄为25×0.25+35×0.35+45×0.2+55×0.15+65×0.05=39(岁)。(2)依题意,完成列联表如下:年龄/岁是否佩戴头盔是否[20,40)54060[40,70]34060(3)K2==≈5.682<6.635,所以没有99%的把握认为遵守佩戴安全头盔规则与年龄有关。4.(2021·福建省五校联盟联考)某蔬菜种植基地有一批蔬菜需要两天内采摘完毕,天气预报显示这两天每天是否有雨相互独立,无雨的概率都为0.8。现有两种方案可以选择,方案一:基地人员自己采摘,不额外聘请工人,需要两天完成,两天都无雨收益为2万元,只有一天有雨收益为1万元,两天都有雨收益为0.75万元;方案二:基地额外聘请工人,只要一天就可以完成采摘,当天无雨收益为2万元,有雨收益为1万元,额外聘请工人的成本为a万元。(1)若不额外聘请工人,写出基地收益X的分布列及基地的预期收益。(2)该基地是否应该外聘工人?请说明理由。解 (1)基地收益X的可能值为2,1,0.75,则P(X=2)=0.64,P(X=1)=0.32,P(X=0.75)=0.04,故X的分布列为X210.75P0.640.320.04则基地的预期收益E(X)=2×0.64+1×0.32+0.75×0.04=1.63(万元)。(2)设基地额外聘请工人时的收益为Y万元,则其预期收益E(Y)=2×0.8+1×0.2-a=1.8-a,E(Y)-E(X)=0.17-a。综上可得,当额外聘请工人的成本高于0.17万元时,不外聘工人;当成本低于0.17万元时,外聘工人;当成本恰为0.17万元时,是否外聘工人均可以。5.(2021·东北三校联考)据调查,目前对于已经近视的小学生,有两种佩戴眼镜的方式可供选择,一种是佩戴传统的框架眼镜;另一种是佩戴角膜塑形镜,这种眼镜是晚上睡觉时佩戴的一种特殊的隐形眼镜(因其在一定程度上可以减缓近视的发展速度,越来越多的小学生家长选择角膜塑形镜控制孩子的近视发展)。A市从当地小学生中随机抽取容量为100的样本,其中因近视佩戴眼镜的有24人(其中佩戴角膜塑形镜的有8人,2名是男生,6名是女生)。(1)若从样本中随机选取一名小学生,已知这名小学生佩戴眼镜,那么,他佩戴的是角膜塑形镜的概率是多大?(2)从这8名佩戴角膜塑形镜的小学生中,随机选出3人,求其中男生人数X的分布列;(3)若将样本的频率当成估计总体的概率,请问,从A市的小学生中,随机选出20名小学生,求佩戴角膜塑形镜的人数Y的期望和方差。解 (1)记“这名小学生佩戴眼镜”为事件A,“这名小学生佩戴的眼镜是角膜塑形镜”为事件B,则所求的概率为P(B|A)。P(B|A)===。所以若从样本中随机选取一名小学生,已知这名小学生佩戴眼镜,则他佩戴的是角膜塑形镜的概率是。(2)依题意,X的所有可能取值为0,1,2,则P(X=0)===;P(X=1)===;P(X=2)===。所以X的分布列为X012P(3)由已知可得,Y~B(20,0.08),则E(Y)=np=20×0.08=1.6,D(Y)=np(1-p)=20×0.08×0.92=1.472,所以佩戴角膜塑形镜的人数Y的期望是1.6,方差是1.472。第二次作业 能力增分训练1.(2021·太原市模拟考试)某地区为了实现产业的转型发展,利用当地旅游资源丰富多样的特点,决定大力发展旅游产业,一方面对现有旅游资源进行升级改造,另一方面不断提高旅游服务水平。为此该地区旅游部门对所推出的报团游和自助游项目进行了深入调查,下表是该部门从去年某月到该地区旅游的游客中,随机抽取的100位游客的满意度调查表。 老年人中年人青年人报团游自助游报团游自助游报团游自助游满意121184156一般2164412不满意116232(1)由上表中的数据分析,老年人、中年人和青年人这三类人群中,哪一类人群更倾向于选择报团游?(2)为了提高服务水平,该旅游部门要从上述样本里满意度为“不满意”的游客中,随机抽取3人征集整改建议,记X为这3人中老年人的人数,求X的分布列和期望。(3)若你朋友要到该地区旅游,根据上表中的数据,你会建议他选择哪种旅游项目?解 (1)由题表中数据可得老年人、中年人和青年人选择报团游的频率分别为p1==,p2==,p3==,因为p1>p2>p3,所以老年人更倾向于选择报团游。(2)由题意得X所有可能的取值为0,1,2,P(X=0)==,P(X=1)==,P(X=2)==,所以X的分布列为X012P所以E(X)=0×+1×+2×=。(3)由题表可知,报团游的满意率为p4==,自助游的满意率为p5==,因为p4>p5,故建议他选择报团游。(答案不唯一,言之有理即可)2.(2021·贵阳市四校联考)治疗某种慢性病的创新药研发成了当务之急。某药企加大了研发投入,市场上治疗一类慢性病的特效药品A的研发费用x(百万元)和销量y(万盒)的统计数据如下:研发费用x/百万元2361013151821销量y/万盒1122.53.53.54.56(1)求y与x的相关系数r(精确到0.01),并判断y与x的关系是否可用线性回归模型拟合。(规定:|r|≥0.75时,可用线性回归模型拟合)(2)该药企准备生产药品A的三类不同的剂型A1,A2,A3,并对其进行两次检测,当第一次检测合格后,才能进行第二次检测。第一次检测时,三类剂型A1,A2,A3合格的概率分别为,,,第二次检测时,三类剂型A1,A2,A3合格的概率分别为,,。两次检测过程相互独立,设经过两次检测后三类剂型A1,A2,A3合格的种类数为X,求X的数学期望。附:相关系数r=,iyi=347,=1 308,=93,≈42.25。解 (1)由题意可知==11,==3,由公式得r==≈0.98,因为|r|≈0.98>0.75,所以y与x之间的关系可以用线性回归模型拟合。(2)药品A的每类剂型经过两次检测后合格的概率分别为P(A1)=×=,P(A2)=×=,P(A3)=×=,由题意知X~B,所以E(X)=3×=。3.(2021·沈阳市质量监测)习近平总书记曾提出,“没有全民健康,就没有全面小康”。为响应总书记的号召,某社区开展了“健康身体,从我做起”社区健身活动,运动分为徒手运动和器械运动两大类。该社区对参与活动的1 200人进行了调查,其中男性650人,女性550人,所得统计数据(单位:人)如下表所示: 器械类徒手类合计男性590 女性 240 合计900 (1)请将题中表格补充完整,并判断能否有99%的把握认为“是否选择器械类与性别有关”?(2)为了检验活动效果,该社区组织了一次竞赛活动。竞赛包括三个项目,一个是器械类,两个是徒手类,规定参与者必须三个项目都参加。据以往经验,参赛者通过器械类竞赛的概率是,通过徒手类竞赛的概率都是,且各项目是否通过相互独立。用ξ表示某居民在这次竞赛中通过的项目个数,求随机变量ξ的分布列和数学期望。(参考数据:1 2302=1 512 900,65×55×9=32 175,1 512 900÷32 175≈47)附:K2=。P(K2≥k0)0.0500.0250.0100.005k03.8415.0246.6357.879解 (1)由题意可知,器械类人数为900,其中男性590人,可得女性310人,又总人数为1 200,所以徒手类人数为300,其中女性240人,可得男性60人。完成表格为 器械类徒手类合计男性59060650女性310240550合计9003001 200则K2===≈188>6.635,所以有99%的把握认为“是否选择器械类与性别有关”。(2)随机变量ξ的所有可能取值为0,1,2,3,则P(ξ=0)=×2=,P(ξ=1)=×2+×C××=,P(ξ=2)=×C××+×2=,P(ξ=3)=×2=,所以ξ的分布列为ξ0123P数学期望E(ξ)=0×+1×+2×+3×=。4.(2021·兰州市诊断考试)2020年1月15日教育部制定出台了《关于在部分高校开展基础学科招生改革试点工作的意见》(也称“强基计划”),《意见》宣布:2020年起不再组织开展高校自主招生工作,改为实行强基计划。强基计划主要选拔培养有志于服务国家重大战略需求且综合素质优秀或基础学科拔尖的学生。据悉强基计划的校考由试点高校自主命题,校考过程中通过笔试后才能进入面试环节,已知甲、乙两所大学的笔试环节都设有三门考试科目且每门科目是否通过相互独立,若某考生报考甲大学,每门科目通过的概率均为,该考生报考乙大学,每门科目通过的概率依次为,,m,其中0<m<1。(1)若m=,分别求出该考生报考甲、乙两所大学在笔试环节恰好通过一门科目的概率;(2)强基计划规定每名考生只能报考一所试点高校,若以笔试过程中通过科目数的数学期望为依据作出决策,当该考生更希望通过乙大学的笔试时,求m的取值范围。解 (1)设该考生报考甲大学恰好通过一门笔试科目为事件A,该考生报考乙大学恰好通过一门笔试科目为事件B,根据题意可得P(A)=C2=,P(B)=×2+×××2==。(2)设该考生报考甲大学通过的科目数为X,报考乙大学通过的科目数为Y,根据题意可知,X~B,则E(X)=3×=,P(Y=0)=×(1-m)=(1-m),P(Y=1)=×(1-m)+×(1-m)+×m=-m,P(Y=2)=×(1-m)+×m+×m=+m,P(Y=3)=×m=m。则随机变量Y的分布列为Y0123P(1-m)-m+mmE(Y)=-m++m+m=+m,若E(Y)>E(X),则+m>,故<m<1,即m的取值范围是。5.(2021·新高考全国Ⅱ卷)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代,…,该微生物每代繁殖的个数是相互独立的且具有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3)。(1)已知p0=0.4,p1=0.3,p2=0.2,p3=0.1,求E(X);(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1时,p<1;(3)根据你的理解说明(2)问结论的实际含义。解 (1)E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1。(2)证明:证法一:(常规求导法)p0+p1x+p2x2+p3x3-x=0(x>0),令f(x)=p0+p1x+p2x2+p3x3-x,则f′(x)=p1+2p2x+3p3x2-1,f″(x)=2p2+6p3x≥0,所以f′(x)在(0,+∞)上单调递增。当E(X)=p1+2p2+3p3≤1时,注意到x∈(0,1]时,f′(x)≤f′(1)=p1+2p2+3p3-1≤0,所以f(x)在(0,1]上单调递减,注意到f(1)=0,所以x=1,即p=1。当E(X)=p1+2p2+3p3>1时,注意到f′(0)=p1-1<0,f′(1)=p1+2p2+3p3-1>0,所以存在唯一的x0∈(0,1)使f′(x0)=0,且当0<x<x0时,f′(x)<0,f(x)单调递减;当x0<x<1时,f′(x)>0,f(x)单调递增,注意到f(0)=p0>0,f(1)=0,所以f(x0)<f(1)=0,所以f(x)在(0,x0)上有一个零点x1,另一个零点为1,所以p=x1<1。证法二:(因式分解法)由题意知p0+p1+p2+p3=1,E(X)=p1+2p2+3p3。由p0+p1x+p2x2+p3x3=x⇒p0+p2x2+p3x3-(1-p1)x=0,所以p0+p2x2+p3x3-(p0+p2+p3)x=0⇒p0(1-x)+p2x(x-1)+p3x(x-1)(x+1)=0,(x-1)[p3x2+(p2+p3)x-p0]=0,显然1是方程的一个正实根。令f(x)=p3x2+(p2+p3)x-p0,f(x)的对称轴为x=-<0,注意到f(0)=-p0<0,f(1)=2p3+p2-p0=p1+2p2+3p3-1=E(X)-1。当E(X)≤1时,f(1)≤0,f(x)的正实根x0≥1,所以原方程的最小正实根p=1;当E(X)>1时,f(1)>0,f(x)的正实根x0<1,所以原方程的最小正实根p=x0<1。(3)第(2)问结论的实际含义是:当1个微生物个体繁殖下一代的个数的数学期望不超过1时,该种微生物临近灭绝;当1个微生物个体繁殖下一代的个数的数学期望超过1时,该种微生物能够生存下去。