所属成套资源:2025年高考数学一轮复习知识清单(全国通用)
专题26 统计、概率与分布列大题-2025年高考数学一轮复习知识清单(全国通用)
展开
这是一份专题26 统计、概率与分布列大题-2025年高考数学一轮复习知识清单(全国通用),文件包含专题26统计概率与分布列大题-2025年高考数学一轮复习知识清单全国通用原卷版docx、专题26统计概率与分布列大题-2025年高考数学一轮复习知识清单全国通用解析版docx等2份学案配套教学资源,其中学案共97页, 欢迎下载使用。
目录
TOC \ "1-1" \h \u \l "_Tc12129" 题型一: 非线性回归型 PAGEREF _Tc12129 \h 1
\l "_Tc15437" 题型二:数据调整型 PAGEREF _Tc15437 \h 3
\l "_Tc15852" 题型三:残差型 PAGEREF _Tc15852 \h 5
\l "_Tc31812" 题型四:相关系数型 PAGEREF _Tc31812 \h 7
\l "_Tc1815" 题型五:二项分布型 PAGEREF _Tc1815 \h 10
\l "_Tc28011" 题型六:超几何分布 PAGEREF _Tc28011 \h 11
\l "_Tc11270" 题型七:正态分布型 PAGEREF _Tc11270 \h 13
\l "_Tc24741" 题型八:下棋与比赛型分布列 PAGEREF _Tc24741 \h 16
\l "_Tc18554" 题型九:数列递推型:马尔科夫链 PAGEREF _Tc18554 \h 17
\l "_Tc21802" 题型十:数列递推型:传球模式 PAGEREF _Tc21802 \h 19
\l "_Tc20861" 题型十一:多线程多人比赛型 PAGEREF _Tc20861 \h 20
\l "_Tc26765" 题型十二:跳棋模式分布列 PAGEREF _Tc26765 \h 21
\l "_Tc26040" 题型十三:分布列导数计算求最值 PAGEREF _Tc26040 \h 23
\l "_Tc13269" 题型十四:新高考分布列型第19题 PAGEREF _Tc13269 \h 24
\l "_Tc4757" 题型十五:分布列综合 PAGEREF _Tc4757 \h 26
题型一: 非线性回归型
非线性回归,可以通过换元转化为线性回归。比较常见的有反比例型换元,一元二次型换元,指数型换元,对数型换元,对于指数型,也可以通过取对数换元转化为线性回归。
1.(24-25高三上·四川眉山·阶段练习)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得:
现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.
(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?
2.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:
根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:
其中
(1)请根据表中数据,建立y关于x的回归方程;
(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.
3.(24-25高三上·福建泉州·阶段练习)一只药用昆虫的产卵数与一定范围内的温度有关,现收集了该种药用昆虫的6组观测数据如下表:
经计算得:线性回归模型的残差平方和,其中分别为观测数据中的温差和产卵数,.
(1)若用线性回归方程,求关于的回归方程(精确到0.1);
(2)若用非线性回归模型求得关于回归方程为,且相关指数0.9522.
(i)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为时该种药用昆虫的产卵数(结果取整数).
附:一组数据,其回归直线的斜率和截距的最小二乘估计为;相关指数.
4.(2023·四川·模拟预测)下表是某工厂记录的一个反应器投料后,连续8天每天某种气体的生成量(L):
为了分析该气体生成量变化趋势、工厂分别用两种模型:①,②对变量x和y的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下:
注:残差:经计算得,,,,其中,
(1)根据残差图、比较模型①,模型②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)若在第8天要根据(2)问求出的回归方程来对该气体生成量做出预测,那么估计第9天该气体生成量是多少?(精确到个位)
附:回归直线的斜率和截距的最小二乘估计公式分别为:,.
题型二:数据调整型
1.(24-25高二上·陕西·开学考试)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本为30的样本,并观测样本的指标价(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据;
记抽取的第i个女生的身高为(,2,3,…,10),样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值;
(3)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差.
2.(23-24高一下·福建南平·期末)某校高一年级有男生200人,女生100人.为了解该校全体高一学生的身高信息,按性别比例进行分层随机抽样,抽取总样本量为30的样本,并观测样本的指标值(单位:cm),计算得男生样本的身高平均数为169,方差为39.下表是抽取的女生样本的数据:
记抽取的第i个女生的身高为,样本平均数,方差.
参考数据:,,.
(1)若用女生样本的身高频率分布情况代替该校高一女生总体的身高频率分布情况,试估计该校高一女生身高在范围内的人数;
(2)如果女生样本数据在之外的数据称为离群值,试剔除离群值后,计算剩余女生样本身高的平均数与方差;
(3)用总样本的平均数和标准差分别估计该校高一学生总体身高的平均数和标准差,求,的值.
3.(22-23高二·全国·课后作业)为了监控某种零件的一条生产线的生产过程,检验员每隔从该生产线上随机抽取一个零件,并测量其尺寸(单位:)做好记录.下表是检验员在一天内依次抽取的个零件的尺寸:
经计算得,,,,其中为抽取的第个零件的尺寸().
(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);
(2)一天内抽检的零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
①从这一天抽检的结果看,是否需对当天的生产过程进行检查?
②在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到)
4.(20-21高二上·山东德州·期末)某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表:
(1)求投资额关于满意度的相关系数(精确到);
(2)约定:投资额关于满意度的相关系数的绝对值在以上(含)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额关于满意度的线性回归方程(精确到).
参考数据:,,,,,,.
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.线性相关系数.
题型三:残差型
残差:观测值减去—预估值称为残差
1.(23-24高三上·湖南衡阳·阶段练习)为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1∼10分别对应年份2013∼2022.
根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
表中,.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型?并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大?
附:对于一组数据x1,y1,x2,y2,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
2.(22-23高三下·广西防城港·阶段练习)某互联网公司为了确定下季度的前期广告投人计划,收集了近6个月广告投入量(单位:万元)和收益(单位:万元)的数据如表:
他们用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量时,(1)中所选模型收益的预报值是多少?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
3.(20-21高二下·湖北孝感·期末)“金山银山不如绿水青山;绿水青山就是金山银山”.复兴村借力“乡村振兴”国策,依托得天独厚的自然资源开展乡村旅游.乡村旅游事业蓬勃发展.复兴村旅游协会记录了近八年的游客人数,见下表.
为了分析复兴村未来的游客人数变化趋势,公司总监分别用两种模型对变量和进行拟合,得到了相应的回归方程,绘制了残差图.残差图如下(注:残差):
模型①;模型②.
(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)根据(2)问求出的回归方程来预测2021年的游客人数.
参考数据见下表:其中:,
附:回归直线的斜率和截距的最小二乘估计公式分别为:,
4.(2023全国·模拟)(本小题满分12分)
为了研究黏虫孵化的平均温度(单位: )与孵化天数之间的关系,某课外兴趣小组通过试验得到如下6组数据:
他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图:
经计算得,
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(2)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立关于的线性回归方程.(精确到0.1)
,.
题型四:相关系数型
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
相关系数r的性质:
①当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为_;
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
1.(2023·重庆沙坪坝·模拟预测)党的二十大报告提出:“必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势.”某数字化公司为加快推进企业数字化进程,决定对其核心系统DAP,采取逐年增加研发人员的办法以提升企业整体研发和创新能力.现对2018~2022年的研发人数作了相关统计(年份代码1~5分别对应2018~2022年)如下折线图:
(1)根据折线统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;
(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数(结果取整数).
参考数据:当认为两个变量间的相关性较强
参考公式相关系数,
回归方程中的斜率和截距的最小二乘法估计公式分别为,.
2.(22-23高三上·河南·期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:
2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)
(1)根据条形统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;
(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)
参考数据:,.参考公式:相关系数.线性回归方程的斜率,截距.附:
3.(2021·云南·模拟预测)西尼罗河病毒(WNV)是一种脑炎病毒,WNV通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV脑炎流行.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x(千克)和利巴韦林含片产量y(百盒)的统计数据如下:
由相关系数可以反映两个变量相关性的强弱,,认为变量相关性很强;,认为变量相关性一般;,认为变量相关性较弱.
(1)计算相关系数r,并判断变量x、y相关性强弱;
(2)根据上表中的数据,建立y关于x的线性回归方程;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林?
参考数据:.
参考公式:相关系数,线性回归方程中,.
4.(2022高二·全国·专题练习)某数学小组从气象局和医院分别获得了年月至年月每月日的昼夜温差(单位:℃,)和患感冒人数的数据,并根据所得数据画出如图所示的折线图.
(1)求与之间的相关系数,并判断与的相关性的强弱(时,认为与高度相关,即认为与的相关性很强);
(2)建立关于的回归直线方程(回归系数的结果精确到),并预测昼夜温差为时患感冒的人数.
参考数据:,,,.
参考公式:相关系数.在回归直线方程,,.
题型五:二项分布型
若在一次实验中事件发生的概率为,则在次独立重复实验中恰好发生次概率 ,称服从参数为的二项分布,记作 ,=,.
1.(24-25高三上·云南昆明·期中)一项没有平局的对抗赛分为两个阶段,参赛者在第一阶段中共参加2场比赛,若至少有一场获胜,则进入第二阶段比赛,否则被淘汰,比赛结束;进入第二阶段比赛的参赛者共参加3场比赛.在两个阶段的每场比赛中,获胜方记1分,负方记0分,参赛者参赛总分是两个阶段得分的总和,若甲在第一阶段比赛中每场获胜的概率都为,在第二阶段比赛中每场获胜的概率都为,每场比赛是否获胜相互独立.已知甲参赛总分为2分的概率为.(1)求;
(2)求甲参赛总分X的分布列和数学期望.
2.(中学生标准学术能力诊断性测试2024-2025学年高三上学期10月测试数学试卷)乒乓球比赛有两种赛制,其中就有“5局3胜制”和“7局4胜制”,“5局3胜制”指5局中胜3局的一方取得胜利,“7局4胜制”指7局中胜4局的一方取得胜利.
(1)甲、乙两人进行乒乓球比赛,若采用5局3胜制,比赛结束算一场比赛,甲获胜的概率为0.8;若采用7局4胜制,比赛结束算一场比赛,甲获胜的概率为0.9.已知甲、乙两人共进行了场比赛,请根据小概率值的独立性检验,来推断赛制是否对甲获胜的场数有影响.
(2)若甲、乙两人采用5局3胜制比赛,设甲每局比赛的胜率均为p,没有平局.记事件“甲只要取得3局比赛的胜利比赛结束且甲获胜”为A,事件“两人赛满5局,甲至少取得3局比赛胜利且甲获胜”为B,试证明:.
(3)甲、乙两人进行乒乓球比赛,每局比赛甲的胜率都是,没有平局.若采用“赛满局,胜方至少取得n局胜利”的赛制,甲获胜的概率记为.若采用“赛满局,胜方至少取得局胜利”的赛制,甲获胜的概率记为,试比较与的大小.
附:,其中.
3.(2024·广东广州·模拟预测)在某地区进行高中学生每周户外运动调查,随机调查了名高中学生户外运动的时间(单位:小时),得到如下样本数据的频率分布直方图.
(1)求的值,估计该地区高中学生每周户外运动的平均时间;(同一组数据用该区间的中点值作代表)
(2)为进一步了解这名高中学生户外运动的时间分配,在,两组内的学生中,采用分层抽样的方法抽取了人,现从这人中随机抽取人进行访谈,记在内的人数为,求的分布列和期望;
(3)以频率估计概率,从该地区的高中学生中随机抽取名学生,用“”表示这名学生中恰有名学生户外运动时间在内的概率,当最大时,求的值.
4.(24-25高二上·黑龙江哈尔滨·阶段练习)如图,在研究某种粒子的实验装置中,粒子从腔室出发,到达腔室,粒子从室经过号门进入室后,等可能的变为上旋或下旋状态,粒子从室经过号门进入室后,粒子的旋转状态发生改变的概率为.粒子间的旋转状态相互独立.现有两个粒子从室出发.
(1)求两粒子进入室都为上旋状态的概率;
(2)若实验装置出现故障,两个粒子进入室后,共裂变为个粒子,裂变后的每个粒子再经过号门返回室的概率为,各粒子返回室相互独立.
①时,写出返回室的粒子个数的分布列、期望、方差;
②时,记有个粒子返回室的概率为,则为何值时,取最大值.
题型六:超几何分布
总数为的两类物品,其中一类为件,从中取件恰含中的件, ,其中为与的较小者,,称 服从参数为的超几何分布,记作 ,此时有公式。
一般地,假设一批产品共有N件,其中有M件次品. 从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为,,,,,. 其中n,N,,,,,. 如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布_..
1.(24-25高二下·全国·课后作业)第十四届全国人民代表大会第一次会议于2023年3月5日上午召开.某社区为了调查社区居民对该会议的关注度,随机抽取了60名社区居民进行调查,并将结果绘制成如图所示的频率分布直方图.
(1)以频率估计概率,若社区计划从60名社区居民中,再次随机抽取三人进行回访,求至少有两人的年龄在区间内的概率;
(2)若和年龄段的所有居民对该会议的关注度都很高,社区准备从中抽取3人谈谈对该会议的感受,设表示年龄段在的人数,求.
2.(22-23高三下·山东济宁·开学考试)某市为进行学科能力竞赛表彰,其中数学组、物理组获奖情况如下表,组委会为使活动有序进行,活跃会场气氛,活动中穿插抽奖活动.并用分层抽样的方法从两个学科组抽取15人在前排就座,其中物理组有5人.
(1)求数学组中女生的人数;
(2)若从前排就座的物理组5人中任选2人上台领奖,设女生的人数为,求女生人数的分布列和数学期望.
3.(24-25高二下·全国·课后作业)某校为了了解学情,对各学科的学习兴趣作了问卷调查,经过数据整理得到下表:
假设每份调查问卷只调查一科,各类调查是否达到良好的标准相互独立.
(1)从收集的答卷中随机选取一份,求这份试卷的调查结果是英语兴趣良好的概率;
(2)从该校任选一位同学,试估计他在语文兴趣良好、数学兴趣良好、生物兴趣良好方面,至少具有两科兴趣良好的概率;
(3)按分层抽样的方法从参与物理兴趣和化学兴趣调查的同学中抽取7人,再从这7人中抽取3人,记3人中来自化学兴趣的人数为,求的分布列和期望.
4.(24-25高三上·四川成都·阶段练习)2024年7月26日,第33届夏季奥林匹克运动会在法国巴黎正式开幕.人们在观看奥运比赛的同时,开始投入健身的行列.某兴趣小组为了解成都市不同年龄段的市民每周锻炼时长情况,随机从抽取200人进行调查,得到如下列联表:
(1)试根据的独立性检验,分析周平均锻炼时长是否与年龄有关?精确到0.001;
(2)现从50岁以下的样本中按周平均锻炼时间是否少于4小时,用分层随机抽样法抽取5人做进一步访谈,再从这5人中随机抽取3人填写调查问卷.记抽取3人中周平均锻炼时间不少于4小时的人数为,求的分布列和数学期望.
参考公式及数据:,其中.
题型七:正态分布型
(1)若是正态随机变量,其概率密度曲线的函数表达式为 , (其中是参数,且,)。
其图像如图13-7所示,有以下性质:
= 1 \* GB3 ①曲线在轴上方,并且关于直线对称;
= 2 \* GB3 ②曲线在处处于最高点,并且此处向左右两边延伸时,逐渐降低,呈现“中间高,两边低”的形状;
= 3 \* GB3 ③曲线的形状由确定,越大,曲线越“矮胖”,越小,曲线越“高瘦”;
= 4 \* GB3 ④图像与轴之间的面积为1.
(2)= ,= ,记作 .
当时, 服从标准正态分布,记作 .
(3) ,则在, ,上取值的概率分别为68.3%,95.4%,99.7%,这叫做正态分布的原则。
1.(2024·山西长治·模拟预测)某汽车公司最新研发了一款新能源汽车,并在出厂前对100辆汽车进行了单次最大续航里程(理论上是指新能源汽车所装载的燃料或电池所能够提供给车行驶的最远里程)的测试.现对测试数据进行整理,得到如下的频率分布直方图:
(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代表);
(2)由频率分布直方图计算得样本标准差s的近似值为49.75.根据大量的汽车测试数据,可以认为这款汽车的单次最大续航里程X近似地服从正态分布,其中μ近似为样本平均数,σ近似为样本标准差S.
(ⅰ)利用该正态分布,求;
(ⅱ)假设某企业从该汽车公司购买了20辆该款新能源汽车,记Z表示这20辆新能源汽车中单次最大续航里程位于区间(250.25,399.5)的车辆数,求E(Z);
参考数据:若随机变量ξ服从正态分布,则,.
(3)某汽车销售公司为推广此款新能源汽车,现面向意向客户推出“玩游戏,送大奖”活动,客户可根据抛掷硬币的结果,操控微型遥控车在x轴上从原点O出发向右运动,已知硬币出现正、反面的概率都,客户每掷一次硬币,遥控车向右移动一次,若掷出正面,则遥控车向移动一个单位,若掷出反面,则遥控车向右移动两个单位,直到遥控车移到点(59,0)(胜利大本营)或点(60,0)(失败大本营)时,游戏结束,若遥控车最终停在“胜利大本营”,则可获得购车优惠券.设遥控车移到点的概率为,试证明数列是等比数列,求出数列的通项公式,并比较和的大小.
2.(24-25高三上·广西贵港·开学考试)为了研究学生的性别和是否喜欢跳绳的关联性,随机调查了某中学的100名学生,整理得到如下列联表:
(1)依据的独立性检验,能否认为学生的性别和是否喜欢跳绳有关联?
(2)已知该校学生每分钟的跳绳个数,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟的跳绳个数都增加10,该校有1000名学生,预估经过训练后该校每分钟的跳绳个数在内的人数(结果精确到整数).
附:,其中.
若,则,.
3.(2024·辽宁·模拟预测)某工厂为了提高精度,采购了一批新型机器,现对这批机器的生产效能进行测试,对其生产的第一批零件的内径进行测量,统计绘制了如下图所示的频率分布直方图.
(1)求a的值以及这批零件内径的平均值和方差(同一组中的数据用该组区间的中点值作代表);
(2)以频率估计概率,若在这批零件中随机抽取4个,记内径在区间内的零件个数为,求的分布列以及数学期望;
(3)已知这批零件的内径(单位:mm)服从正态分布,现以频率分布直方图中的平均数作为的估计值,频率分布直方图中的标准差作为的估计值,则在这批零件中随机抽取200个,记内径在区间上的零件个数为,求的方差.
参考数据:,若,则,,.
4.(2024·福建龙岩·三模)某企业对某品牌芯片开发了一条生产线进行试产.其芯片质量按等级划分为五个层级,分别对应如下五组质量指标值:.根据长期检测结果,得到芯片的质量指标值服从正态分布,并把质量指标值不小于80的产品称为等品,其它产品称为等品. 现从该品牌芯片的生产线中随机抽取100件作为样本,统计得到如图所示的频率分布直方图.
(1)根据长期检测结果,该芯片质量指标值的标准差的近似值为11,用样本平均数作为的近似值,用样本标准差作为的估计值. 若从生产线中任取一件芯片,试估计该芯片为等品的概率(保留小数点后面两位有效数字);
(①同一组中的数据用该组区间的中点值代表;②参考数据:若随机变量服从正态分布,则,. )
(2)(i)从样本的质量指标值在和[85,95]的芯片中随机抽取3件,记其中质量指标值在[85,95]的芯片件数为,求的分布列和数学期望;
(ii)该企业为节省检测成本,采用随机混装的方式将所有的芯片按100件一箱包装. 已知一件等品芯片的利润是元,一件等品芯片的利润是元,根据(1)的计算结果,试求的值,使得每箱产品的利润最大.
题型八:下棋与比赛型分布列
多人比赛或者传球模型,一般情况下涉及到独立事件与互斥事件的识别,及概率运算,离散型随机变量的分布列和期望,如果符合常见的二项分布,超几何分布等等分布,直接用概率公式进行运算。如果限制条件较多,可以进行罗列方式进行分类讨论计算
1.(22-23·湖南邵阳·模拟)第19届亚运会将于2023年9月23日至10月8日举办,本届亚运会共设40个竞赛大项.其中首次增设了电子竞技项目.与传统的淘汰赛不同,近年来一个新型的赛制“双败赛制”赢得了许多赛事的青睐.传统的淘汰赛失败一场就丧失了冠军争夺的权利,而在双败赛制下,每人或者每个队伍只有失败了两场才会淘汰出局,因此更有容错率.假设最终进入到半决赛有四支队伍,淘汰赛制下会将他们四支队伍两两分组进行比赛,胜者进入到总决赛,总决赛的胜者即为最终的冠军.双败赛制下,两两分组,胜者进入到胜者组,败者进入到败者组,胜者组两个队伍对决的胜者将进入到总决赛,败者进入到败者组.之前进入到败者组的两个队伍对决的败者将直接淘汰,胜者将跟胜者组的败者对决,其中的胜者进入总决赛,最后总决赛的胜者即为冠军,双败赛制下会发现一个有意思的事情,在胜者组中的胜者只要输一场比赛即总决赛就无法拿到冠军,但是其它的队伍却有一次失败的机会,近年来从败者组杀上来拿到冠军的不在少数,因此很多人戏谑这个赛制对强者不公平,是否真的如此呢?
这里我们简单研究一下两个赛制,假设四支队伍分别为A、B、C、D,其中A对阵其他三个队伍获胜概率均为p,另外三支队伍彼此之间对阵时获胜概率均为.最初分组时AB同组,CD同组.
(1)若,在淘汰赛赛制下,A、C获得冠军的概率分别为多少?
(2)分别计算两种赛制下A获得冠军的概率(用表示),并据此简单分析一下双败赛制下对队伍的影响,是否如很多人质疑的“对强者不公平”?
2.(2021·河北石家庄·一模)“T2钻石联赛”是世界乒联推出一种新型乒乓球赛事,其赛制如下:采用七局四胜制,比赛过程中可能出现两种模式:“常规模式”和“FAST5模式”.在前24分钟内进行的常规模式中,每小局比赛均为11分制,率先拿满11分的选手赢得该局;如果两名球员在24分钟内都没有人赢得4局比赛,那么将进入“FAST5”模式,“FAST5”模式为5分制的小局比赛,率先拿满5分的选手赢得该局.24分钟计时后开始的所有小局均采用“FAST5”模式.某位选手率先在7局比赛中拿下4局,比赛结束.现有甲、乙两位选手进行比赛,经统计分析甲、乙之间以往比赛数据发现,24分钟内甲、乙可以完整打满2局或3局,且在11分制比赛中,每局甲获胜的概率为,乙获胜的概率为;在“FAST5”模式,每局比赛双方获胜的概率都为,每局比赛结果相互独立.
(Ⅰ)求4局比赛决出胜负的概率;
(Ⅱ)设在24分钟内,甲、乙比赛了3局,比赛结束时,甲乙总共进行的局数记为,求的分布列及数学期望.
3.(23-24高三下·浙江·开学考试)甲、乙、丙三位同学进行乒乓球比赛,约定赛制如下:每场比赛胜者积2分,负者积0分;比赛前根据相关规则决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空;积分首先累计到4分者获得比赛胜利,比赛结束.已知甲与乙比赛时,甲获胜的概率为,甲与丙比赛时,甲获胜的概率为,乙与丙比赛时,乙获胜的概率为.
(1)若,求比赛结束时,三人总积分的分布列与期望;
(2)若,假设乙获得了指定首次比赛选手的权利,为获得比赛的胜利,试分析乙的最优指定策略.
4.(20-21高三下·安徽·阶段练习)“博弈”原指下棋,出自我国《论语·阳货》篇,现在多指一种决策行为,即一些个人、团队或组织,在一定规则约束下,同时或先后,一次或多次,在各自允许选择的策略下进行选择和实施,并从中各自取得相应结果或收益的过程.生活中有很多游戏都蕴含着博弈,比如现在有两个人玩“亮”硬币的游戏,甲、乙约定若同时亮出正面,则甲付给乙3元,若同时亮出反面,则甲付给乙1元,若亮出结果是一正一反,则乙付给甲2元.
(1)若两人各自随机“亮”出正反面,求乙收益的期望.
(2)因为各自“亮”出正反面,而不是抛出正反面,所以可以控制“亮”出正面或反面的频率(假设进行多次游戏,频率可以代替概率),因此双方就面临竞争策略的博弈.甲、乙可以根据对手出正面的概率调整自己出正面的概率,进而增加自己赢得收益的期望,以收益的期望为决策依据,甲、乙各自应该如何选择“亮”出正面的概率,才能让结果对自己最有利?并分析游戏规则是否公平.
题型九:数列递推型:马尔科夫链
1.(24-25高三上·江西·开学考试)马尔科夫链是概率统计中的一个重要模型,其过程具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,即第n+1次状态的概率分布只与第n次的状态有关,与第,…次的状态无关,即.已知甲盒中装有1个白球和2个黑球,乙盒中装有2个白球,现从甲、乙两个盒中各任取1个球交换放入对方的盒中,重复n次()这样的操作,记此时甲盒中白球的个数为,甲盒中恰有2个白球的概率为,恰有1个白球的概率为.
(1)求和.
(2)证明:为等比数列.
(3)求的数学期望(用n表示).
2.(23-24高二下·辽宁·阶段练习)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是……,…,那么时刻的状态的条件概率仅依赖前一状态,即.
现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.
假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:记赌徒的本金为一种是赌金达到预期的B元,赌徒停止赌博;另一种是赌徒输光本金后,赌徒可以向赌场借钱,最多借A元,再次输光后赌场不再借钱给赌徒.赌博过程如图的数轴所示.
当赌徒手中有n元时,最终欠债A元(可以记为该赌徒手中有元)概率为,请回答下列问题:
(1)请直接写出与的数值.
(2)证明是一个等差数列,并写出公差d.
(3)当时,分别计算时,的数值,论述当B持续增大时,的统计含义.
3.(24-25高三上·广东·开学考试)马尔科夫链因俄国数学家安德烈・马尔科夫得名,其过程具备“无记忆”的性质,即第次状态的概率分布只跟第次的状态有关,与第次状态无关.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.现有两个盒子,各装有2个黑球和1个红球,现从两个盒子中各任取一个球交换放入另一个盒子,重复进行次这样的操作后,记盒子中红球的个数为,恰有1个红球的概率为.
(1)求的值;
(2)求的值(用表示);
(3)求证:的数学期望为定值.
4.(2024高三·全国·专题练习)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,为状态空间中经过从一个状态到另一个状态的转换的随机过程.该过程要求具备“无记忆”的性质:下一状态的概率分布只能由当前状态决定,在时间序列中它前面的事件均与之无关.甲、乙两口袋中各装有1个黑球和2个白球,现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复进行次这样的操作,记口袋甲中黑球的个数为,恰有1个黑球的概率为.
(1)求的值;
(2)求的值(用表示);
(3)求证:的数学期望为定值.
题型十:数列递推型:传球模式
1.(2024·山东泰安·模拟预测)在足球比赛中,有时需通过点球决定胜负.
(1)扑点球的难度一般比较大,假设罚点球的球员会等可能地随机选择球门的左、中、右三个方向射门,门将(也称为守门员)也会等可能地随机选择球门的左、中、右三个方向来扑点球,而且门将即使方向判断正确也有的可能性扑不到球.不考虑其它因素,在一次点球大战中,求门将在前三次扑到点球的个数的分布列和期望;
(2)好成绩的取得离不开平时的努力训练,甲、乙、丙三名前锋队员在某次传接球的训练中,球从甲脚下开始,等可能地随机传向另外人中的 人,接球者接到球后再等可能地随机传向另外人中的人,如此不停地传下去,假设传出的球都能接住.记第次传球之前球在甲脚下的概率为,易知.
① 试证明:为等比数列;
② 设第次传球之前球在乙脚下的概率为,比较与的大小.
2.(2023·河北·模拟预测)某排球教练带领甲、乙两名排球主力运动员训练排球的接球与传球,首先由教练第一次传球给甲、乙中的某位运动员,然后该运动员再传回教练.每次教练接球后按下列规律传球:若教练上一次是传给某运动员,则这次有的概率再传给该运动员,有的概率传给另一位运动员.已知教练第一次传给了甲运动员,且教练第次传球传给甲运动员的概率为.
(1)求,;
(2)求的表达式;
(3)设,证明:.
3.(23-24高三上·山东青岛·开学考试)某篮球赛事采取四人制形式.在一次战术训练中,甲、乙、丙、丁四名队员进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外三人中的任何一人.次传球后,记事件“乙、丙、丁三人均接过传出来的球”发生的概率为.
(1)求;
(2)当时,记乙、丙、丁三人中接过传出来的球的人数为,求随机变量的分布列及数学期望;
(3)当时,证明:.
4.(22-23高三上·广东·阶段练习)足球是一项大众喜爱的运动.2022卡塔尔世界杯揭幕战将在2022年11月21日打响,决赛定于12月18日晚进行,全程为期28天.
(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名观众进行调查,得到22列联表如下:
依据小概率值a=0.001的独立性检验,能否认为喜爱足球运动与性别有关?
(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第1次触球者,第次触球者是甲的概率记为,即.
(i)求(直接写出结果即可);(ii)证明:数列为等比数列,并判断第19次与第20次触球者是甲的概率的大小.
题型十一:多线程多人比赛型
比赛模式,要考虑:
比赛几局?
“谁赢了”;
有没有平局
赢了的必赢最后一局;
比赛为啥结束?
1.(2024·安徽·模拟预测)“友谊杯”围棋擂台赛采取淘汰制,现有名选手报名参加比赛(含甲、乙两名选手),规则如下:第一轮将所有报名选手任意两两配对对弈,输者淘汰出局,然后将剩下的名胜者再任意两两配对对弈,同样输者淘汰出局……如此下去,直至第轮比赛决出一名冠军.假定每名选手在各轮比赛中获胜的概率均为0.5.
(1)当时,求甲、乙两人相遇对弈的概率;
(2)当时,求甲、乙两人相遇对弈的概率;
(3)已知当擂台赛报名选手人数分别为时,甲、乙两人相遇对弈的次数依次是,记,若随机变量服从两点分布,且,,求.
2.(2024·浙江杭州·模拟预测)现有个编号为的小球,随机将它们分成甲、乙两组,每组个. 设甲组中小球的最小编号为,最大编号为;乙组中小球的最小编号为,最大编号为 记,
(1)当时,求的分布列和数学期望;
(2)令表示“事件与的取值恰好相等”.
①求事件发生的概率;
②证明:
3.(2024·全国·模拟预测)中国女排是中国各体育团队中成绩突出的体育团队之一,曾是世界上第一个“五连冠”得主,并十度成为世界冠军,2023年在杭州第19届亚运会上女排再度获得冠军.她们那种团结协作、顽强拼搏的精神极大地激发了中国人的自豪、自尊和自信,为我们在新征程上奋进提供了强大的精神力量.如今,女排精神广为传颂,家喻户晓,各行各业的人们在女排精神的激励下,为中华民族的腾飞顽强拼搏.某中学也因此掀起了排球运动的热潮,在一次排球训练课上,体育老师安排4人一组进行传接球训练,其中甲、乙、丙、丁四人刚好围成一个矩形(如图),已知当某人控球时,传给其相邻同学的概率为,传给对角线上的同学的概率为,由甲开始传球.
(1)求第3次传球是由乙传给甲的概率;
(2)求第次传球后排球传到丙手中的概率;
(3)若随机变量服从两点分布,且,,,…,,则,记前次(即从第1次到第次传球)中排球传到乙手中的次数为,求.
4.(2024·黑龙江·二模)一座小桥自左向右全长100米,桥头到桥尾对应数轴上的坐标为0至100,桥上有若干士兵,一阵爆炸声后士兵们发生混乱,每个士兵爬起来后都有一个初始方向(向左或向右),所有士兵的速度都为1米每秒,中途不会主动改变方向,但小桥十分狭窄,只能容纳1人通过,假如两个士兵面对面相遇,他们无法绕过对方,此时士兵则分别转身后继续前进(不计转身时间).
(1)在坐标为10,40,80处各有一个士兵,计算初始方向不同的所有情况中,3个士兵全部离开桥面的最长时间(提示:两个士兵面对面相遇并转身等价于两个士兵互相穿过且编号互换);
(2)在坐标为10、20、30、……、90处各有一个士兵,初始方向向右的概率为,设最后一个士兵离开独木桥的时间为秒,求的分布列和期望;
(3)若初始状态共个士兵,初始方向向右的概率为,计算自左向右的第个士兵(命名为指挥官)从他的初始方向离开小桥的概率,以及当取得最大值时取值.
题型十二:跳棋模式分布列
1.(2020·河北张家口·二模)某校为了解该校学生“停课不停学”的网络学习效率,随机抽查了高一年级100位学生的某次数学成绩(单位:分),得到如下所示的频率分布直方图:
(1)估计这100位学生的数学成绩的平均值;(同一组中的数据用该组区间的中点值代表)
(2)根据整个年级的数学成绩可以认为学生的数学成绩近似地服从正态分布,经计算,(1)中样本的标准差s的近似值为10,用样本平均数作为的近似值,用样本标准差s作为的估计值,现任抽取一位学生,求他的数学成绩恰在64分到94分之间的概率;(若随机变量,则,,)
(3)该年级1班的数学老师为了能每天督促学生的网络学习,提高学生每天的作业质量及学习数学的积极性,特意在微信上设计了一个每日作业小程序,每当学生提交的作业获得优秀时,就有机会参与一次小程序中”玩游戏,得奖励积分”的活动,开学后可根据获得积分的多少向老师领取相应的小奖品.小程序页面上有一列方格,共15格,刚开始有只小兔子在第1格,每点一下游戏的开始按钮,小兔子就沿着方格跳一下,每次跳1格或跳2格,概率均为,依次点击游戏的开始按钮,直到小兔子跳到第14格(奖励0分)或第15格(奖励5分)时,游戏结束,每天的积分自动累加,设小兔子跳到第格的概率为,试证明是等比数列,并求小兔子获胜的概率.
2.(23-24高二下·湖北武汉·期末)Catalan数列(卡特兰数列)最早由我国清代数学家明安图(1692-1765)在研究三角函数幂级数的推导过程中发现,成果发表于1774年出版的《割圜密率捷法》中,后由比利时数学家卡特兰(Catalan,1814-1894)的名字来命名,该数列的通项被称为第个Catalan数,其通项公式为.在组合数学中,有如下结论:由个和个构成的所有数列,中,满足“对任意,都有”的数列的个数等于.
已知在数轴上,有一个粒子从原点出发,每秒向左或向右移动一个单位,且向左移动和向右移动的概率均为.(1)设粒子第3秒末所处的位置为随机变量(若粒子第一秒末向左移一个单位,则位置为;若粒子第一秒末向右移一个单位,则位置为1),求的分布列和数学期望;
(2)记第秒末粒子回到原点的概率为.
(i)求及;
(ii)设粒子在第秒末第一次回到原点的概率为,求.
3.(2024·山东济南·二模)随机游走在空气中的烟雾扩散、股票市场的价格波动等动态随机现象中有重要应用.在平面直角坐标系中,粒子从原点出发,每秒向左、向右、向上或向下移动一个单位,且向四个方向移动的概率均为 例如在1秒末,粒子会等可能地出现在四点处.
(1)设粒子在第2秒末移动到点,记的取值为随机变量 ,求 的分布列和数学期望;
(2)记第秒末粒子回到原点的概率为.
(i)已知 求 以及;
(ii)令,记为数列的前项和,若对任意实数,存在,使得,则称粒子是常返的.已知 证明:该粒子是常返的.
4.(22-23高三下·江苏苏州·开学考试)设数轴上有一只兔子,从坐标开始,每秒以的概率向正方向跳一个单位,以的概率向反方向跳一个单位,记兔子第n秒时的位置为.
(1)证明:;
(2)记是表达式的最大值,证明:.
题型十三:分布列导数计算求最值
1.(20-21高三上·重庆沙坪坝·阶段练习)某制药公司研制了一款针对某种病毒的新疫苗.该病毒一般通过病鼠与白鼠之间的接触传染,现有只白鼠,每只白鼠在接触病鼠后被感染的概率为,被感染的白鼠数用随机变量表示,假设每只白鼠是否被感染之间相互独立.
(1)若,求数学期望;
(2)接种疫苗后的白鼠被病鼠感染的概率为,现有两个不同的研究团队理论研究发现概率与参数的取值有关.团队提出函数模型为,团队提出函数模型为.现将白鼠分成10组,每组10只,进行实验,随机变量表示第组被感染的白鼠数,现将随机变量的实验结果绘制成频数分布图,如图所示.假设每组白鼠是否被感染之间相互独立.
①试写出事件“”发生的概率表达式(用表示,组合数不必计算);
②在统计学中,若参数时使得概率最大,称是的最大似然估计.根据这一原理和团队 ,提出的函数模型,判断哪个团队的函数模型可以求出的最大似然估计,并求出估计值.
参考数据:.
2.(2021·全国·模拟预测)某中医药研究所研制出一种新型抗过敏药物,服用后需要检验血液抗体是否为阳性,现有n(n∈N*)份血液样本,每个样本取到的可能性均等,有以下两种检验方式:①逐份检验,需要检验n次;②混合检验,将其中k(k∈N*,2≤k≤n)份血液样本分别取样混合在一起检验,若结果为阴性,则这k份的血液全为阴性,因而这k份血液样本只需检验一次就够了,若检验结果为阳性,为了明确这k份血液究竟哪份为阳性,就需要对这k份再逐份检验,此时这k份血液的检验次数总共为k+1次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性的概率为p(0<p<1).
(1)假设有5份血液样本,其中只有两份样本为阳性,若采取逐份检验的方式,求恰好经过3次检验就能把阳性样本全部检验出来的概率.
(2)现取其中的k(k∈N*,2≤k≤n)份血液样本,采用逐份检验的方式,样本需要检验的次数记为ξ1;采用混合检验的方式,样本需要检验的总次数记为ξ2.
(i)若k=4,且,试运用概率与统计的知识,求p的值;
(ii)若,证明:.
3.(2020·河南开封·二模)某中医药研究所研制出一种新型抗癌药物,服用后需要检验血液是否为阳性,现有份血液样本每个样本取到的可能性均等,有以下两种检验方式:(1)逐份检验,则需要检验次;(2)混合检验,将其中份血液样本分别取样混合在一起检验,若结果为阴性,则这份的血液全为阴性,因而这份血液样本只需检验一次就够了;若检验结果为阳性,为了明确这份血液究竟哪份为阳性,就需要对这份再逐份检验,此时这份血液的检验次数总共为次假设在接受检验的血液样本中,每份样本的检验结果总阳性还是阴性都是相互独立的,且每份样本是阳性的概率为.
(1)假设有6份血液样本,其中只有两份样本为阳性,若采取逐份检验的方式,求恰好经过两次检验就能把阳性样本全部检验出来的概率.
(2)现取其中的份血液样本,记采用逐份检验的方式,样本需要检验的次数为;采用混合检验的方式,样本简要检验的总次数为;
(ⅰ)若,试运用概率与统计的知识,求关于的函数关系,
(ⅱ)若,采用混合检验的方式需要检验的总次数的期望比逐份检验的总次数的期望少,求的最大值(,,,,,)
4.(21-22高二下·安徽芜湖·期中)某单位为患病员工集体筛查新型流感病毒,需要去某医院检验血液是否为阳性,现有份血液样本,有以下两种检验方案,方案一:逐份检验,则需要检验k次;方案二:混合检验,将k份血液样本分别取样混合在一起检验一次,若检验结果为阴性,则k份血液样本均为阴性,若检验结果为阳性,为了确定k份血液中的阳性血液样本,则对k份血液样本再逐一检验逐份检验和混合检验中的每一次检验费用都是元,且k份血液样本混合检验一次需要额外收元的材料费和服务费.假设在接受检验的血液样本中,每份样本是否为阳性是相互独立的,且据统计每份血液样本是阳性的概率为.
(1)假设有5份血液样本,其中只有2份样本为阳性,若采用逐份检验的方式,求恰好经过3次检验就能把阳性样本全部检验出来的概率.
(2)若份血液样本采用混合检验方案,需要检验的总次数为X,求X分布列及数学期望;
(3)①若,以检验总费用为决策依据,试说明该单位选择方案二的合理性;
②若,采用方案二总费用的数学期望低于方案一,求k的最大值.
参考数据:
题型十四:新高考分布列型第19题
数列型分布列,涉及到数列递推公式
递推公式求解通项公式,根据递推公式的特点选择合适的方法,
(1)若,采用累加法;
(2)若,采用累乘法;
(3)若,可利用构造进行求解;
求离散型随机变量的分布列及期望的一般步骤:
(1)根据题中条件确定随机变量的可能取值;
(2)求出随机变量所有可能取值对应的概率,即可得出分布列;
(3)根据期望的概念,结合分布列,即可得出期望(在计算时,要注意随机变量是否服从特殊的分布,如超几何分布或二项分布等,可结合其对应的概率计算公式及期望计算公式,简化计算)
1.(2020·山东德州·一模)医院为筛查某种疾病,需要血检,现有份血液样本,有以下两种检验方式:
方式一:逐份检验,需要检验次;
方式二:混合检验,把每个人的血样分成两份,取个人的血样各一份混在一起进行检验,如果结果是阴性,那么对这个人只作一次检验就够了;如果结果是阳性,那么再对这个人的另一份血样逐份检验,此时这份血液的检验次数总共为次.
(1)假设有6份血液样本,其中只有2份样本为阳性,若采用逐份检验的方式,求恰好经过3次检验就能把阳性样本全部检验出来的概率;
(2)假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性结果的概率为.现取其中(且)份血液样本,记采用逐份检验方式,样本需要检验的总次数为,采用混合检验方式,样本需要检验的总次数为.
①运用概率统计的知识,若,试求关于的函数关系式;
②若,且采用混合检验方式可以使得样本需要检验的总次数的期望值比逐份检验的总次数期望值更少,求的最大值.
参考数据:,,.
2.(2020·湖南湘潭·三模)冠状病毒是一个大型病毒家族,已知可引起感冒以及中东呼吸综合征和严重急性呼吸综合征等较严重疾病.而今年初出现并在全球蔓延的新型冠状病毒是以前从未在人体中发现的冠状病毒新毒株.人感染了新型冠状病毒后常见体征有呼吸道症状、发热、咳嗽、气促和呼吸困难等.在较严重病例中感染可导致肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡.
某药物研究所为筛查该种病毒,需要检验血液是否为阳性,现有(,且)份血液样本,每个样本取到的可能性相等,有以下两种检验方式:
方式一:逐份检验则需要检验次;
方式二:混合检验,将份血液样本分别取样混合在一起检验,若检验结果为阴性,则这份的血液全为阴性,因而这份血液样本只要检验一次就够了;如果检验结果为阳性,为了明确这份血液究竟哪几份为阳性,就要对这份再逐份检验,此时这份血液的检验次数总共为次.假设在接受检验的血液样本中,每份样本的检验结果是阳性还是阴性都是独立的,且每份样本是阳性结果的概率为.
(1)假设有6份血液样本,其中只有2份样本为阳性,从中任取3份样本进行医学研究,求至少有1份为阳性样本的概率;
(2)假设将(且)份血液样本进行检验,记采用逐份检验方式,样本需要检验的总次数为,采用混合检验方式,样本需要检验的总次数为;
①运用概率统计的知识,若,试求关于的函数关系式;
②若与干扰素计量相关,其中数列满足,当时,试讨论采用何种检验方式更好?
参考数据:.
3.(2024·湖北·模拟预测)如图:一张的棋盘,横行编号:竖排编号.一颗棋子目前位于棋盘的处,它的移动规则是:每次移动到与自身所在格不相邻的异色格中.例如该棋子第一次移动可以从移动到或.棋子每次移动到不同目的地间的概率均为.
(1)①列举两次移动后,该棋子所有可能的位置.
②假设棋子两次移动后,最终停留到第1,2,3行时,分别能获得分,设得分为,求的分布列和数学期望.
(2)现在于棋盘左下角处加入一颗棋子,他们运动规则相同,并且每次移动同时行动.移动次后,两棋子位于同一格的概率为,求的通项公式.
4.(2024·江西新余·模拟预测)生命的诞生与流逝是一个永恒的话题,就某种细胞而言,由该种细胞的一个个体进行分裂,分裂后成为新细胞而原细胞不复存在,多次分裂后,由该个细胞繁殖而来的全部细胞均死亡,我们称该细胞“灭绝”.现已知某种细胞有的概率分裂为个细胞(即死亡),...,有的概率分裂为个细胞.记事件:细胞最终灭绝,:细胞第一次分裂为个细胞.记该细胞第一次分裂后有个个体(分裂后的细胞互不影响),在概率论中,我们用的数学期望作为衡量生物灭绝可能性的依据,如果,则在理论上细胞就不会灭绝;相反,如果,则理论上我们认为细胞在足够多代的繁殖后会灭绝,而这两种情况在生物界中都是普遍存在的.
(1)直接写出的数学期望.
(2)用只含和的概率式表示并证明该细胞灭绝的概率为关于方程:的最小正实根.
(3)若某种细胞发生基因突变,当时.
(ⅰ)若当其分裂为两个细胞后,有一个细胞具有与原细胞相同的活力,而另一细胞则在此后丧失分裂为两个的能力(即只有可能分裂成个或个),求证:该细胞的灭绝是必然事件.
(ⅱ)受某种辐射污染,若当其分裂为两个细胞后分裂生成的两个细胞此后均丧失分裂为个的能力,并等可能分裂为个或个细胞.我们称为“泛滥型细胞”,已知:,求出一个该种泛滥型细胞经过次分裂,得到个细胞的概率.
题型十五:分布列综合
1.(24-25高三上·云南昆明·阶段练习)设,数对按如下方式生成:,抛掷一枚均匀的硬币,当硬币的正面朝上时,若,则,否则;当硬币的反面朝上时,若,则,否则.抛掷n次硬币后,记的概率为.
(1)写出的所有可能情况,并求;
(2)证明:是等比数列,并求;
(3)设抛掷n次硬币后的期望为,求.
2.(24-25高三上·福建福州·开学考试)有2n朵花围绕在一个圆形花圃周围,现要将其两两配对绑上缎带作为装饰,缎带之间互不交叉,例如:时,共有4朵花,以1、2、3、4表示,绑上缎带的两朵用一条线连接,共有2种方式,如图1、2所示.
(1)当时,求满足要求的绑缎带方法总数;
(2)已知满足要求的每一种绑法出现的概率都相等,如时,出现图1和图2所示方法的概率均为.记一次绑法中,共有Y对相邻的两朵花绑在一起,
(i)当时,求Y的分布列和期望;
(ii)已知:对任意随机变量(,2,…,m,),有.记满足条件的绑缎带方法总数为,Y的期望为.求(用n和表示).
3.(23-24高二下·湖南郴州·期末)材料一:在伯努利试验中,记每次试验中事件发生的概率为,试验进行到事件第一次发生时停止,此时所进行的试验次数为,其分布列为,我们称服从几何分布,记为.
材料二:求无穷数列的所有项的和,如求,没有办法把所有项真的加完,可以先求数列前项和,再求时的极限:
根据以上材料,我们重复抛掷一颗均匀的骰子,直到第一次出现“6点”时停止.设停止时抛掷骰子的次数为随机变量.
(1)证明:;
(2)求随机变量的数学期望;
(3)求随机变量的方差.
4.(2024·湖北武汉·模拟预测)泊松分布是一种重要的离散型分布,用于描述稀有事件的发生情况.如果随机变量的所有可能取值为0,1,2…,且,其中,则称服从泊松分布,记作.
(1)设,且,求;
(2)已知当,时,可以用泊松分布近似二项分布,即对于,,当不太大时,有.
(ⅰ)已知甲地区共有100000户居民,每户居民每天有0.00010的概率需要一名水电工.试估计某天需要至少2名水电工的概率;
(ⅱ)在(ⅰ)的基础上,已知乙地区共有200000户居民,每户居民每天有0.00004的概率需要一名水电工.试估计某天两个地区一起至少需要3名水电工的概率.
44
4.8
10
40.3
1.612
19.5
8.06
直播周期数x
1
2
3
4
5
产品销售额y(千元)
3
7
15
30
40
3.7
55
382
65
978
101
温度
21
23
24
27
29
32
产卵数个
6
11
20
27
57
77
日期代码x
1
2
3
4
5
6
7
8
生成的气体y(L)
4
8
16
31
51
71
97
122
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
抽取次序
1
2
3
4
5
6
7
8
9
10
身高
155
158
156
157
160
161
159
162
169
163
抽取次序
零件尺寸()
抽取次序
9
10
11
12
13
14
15
16
零件尺寸()
企业
满意度(%)
21
33
24
20
25
21
24
23
25
12
投资额(万元)
79
86
89
78
76
72
65
62
59
44
75
2.25
82.5
4.5
120
28.35
月份
1
2
3
4
5
6
广告投入量
2
4
6
8
10
12
收益
14.21
20.31
31.8
31.18
37.83
44.67
7
30
1464.24
364
年份
2013年
2014年
2015年
2016年
2017年
2018年
2019年
2020年
年份代码
1
2
3
4
5
6
7
8
游客人数(百人)
4
8
16
32
51
71
97
122
组号
1
2
3
4
5
6
平均温度
15.3
16.8
17.4
18
19.5
21
孵化天数
16.7
14.8
13.9
13.5
8.4
6.2
相关性
弱
一般
强
投入量x(千克)
1
2
3
4
5
产量y(百盒)
16
20
23
25
26
0.05
0.025
0.010
3.841
5.024
6.635
数学组
物理组
男生
30
20
女生
30
语文兴趣
数学兴趣
英语兴趣
物理兴趣
化学兴趣
生物兴趣
答卷份数
350
470
380
400
300
500
兴趣良好频率
0.7
0.95
0.8
0.75
0.85
0.86
年龄
周平均锻炼时长
合计
周平均锻炼时间少于4小时
周平均锻炼时间不少于4小时
50岁以下
40
60
100
50岁以上(含50)
25
75
100
合计
65
135
200
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
男学生
女学生
合计
喜欢跳绳
35
35
70
不喜欢跳绳
10
20
30
合计
45
55
100
0.1
0.05
0.01
2.706
3.841
6.635
喜爱足球运动
不喜爱足球运动
合计
男性
60
40
100
女性
20
80
100
合计
80
120
200
相关学案
这是一份专题24 圆锥曲线综合大题归类 -2025年高考数学一轮复习知识清单(全国通用),文件包含专题24圆锥曲线综合大题归类-2025年高考数学一轮复习知识清单全国通用原卷版docx、专题24圆锥曲线综合大题归类-2025年高考数学一轮复习知识清单全国通用解析版docx等2份学案配套教学资源,其中学案共73页, 欢迎下载使用。
这是一份专题23 圆锥曲线离心率归类 -2025年高考数学一轮复习知识清单(全国通用),文件包含专题23圆锥曲线离心率归类-2025年高考数学一轮复习知识清单全国通用原卷版docx、专题23圆锥曲线离心率归类-2025年高考数学一轮复习知识清单全国通用解析版docx等2份学案配套教学资源,其中学案共63页, 欢迎下载使用。
这是一份专题21圆与直线综合-2025年高考数学一轮复习知识清单(全国通用),文件包含专题21圆与直线综合-2025年高考数学一轮复习知识清单全国通用原卷版docx、专题21圆与直线综合-2025年高考数学一轮复习知识清单全国通用解析版docx等2份学案配套教学资源,其中学案共64页, 欢迎下载使用。