新高考数学二轮复习考点归纳与演练专题10-2 概率统计(解答题)(含解析)
展开专题10-2概率统计(解答题)
目录
专题10-2概率统计(解答题) 1
1
题型一:回归直线方程 1
题型二:非线性回归 8
题型三:独立性检验 18
题型四:超几何分布 25
题型五:二项分布 35
题型六:正态分布 45
题型七:概率综合 55
题型八:概率统计与数列 61
题型九:概率统计与导数 70
题型一:回归直线方程
【典例分析】
例题1.(2022春·全国·高三校联考阶段练习)已知某绿豆新品种发芽的适宜温度在6℃~22℃之间,一农学实验室研究人员为研究温度(℃)与绿豆新品种发芽数(颗)之间的关系,每组选取了成熟种子50颗,分别在对应的8℃~14℃的温度环境下进行实验,得到如下散点图:
(1)由折线统计图看出,可用线性回归模型拟合与的关系,请用相关系数加以说明;
(2)建立关于的回归方程,并预测在19℃的温度下,种子发芽的颗数.
参考数据:,,,.
参考公式:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为
,.
【答案】(1)答案见解析;
(2)44.
【详解】(1)由题意可知:.
.又,所以相关系数.
因为相关系数,所以与的线性相关性较高,可以利用线性回归模型拟合与的关系.
(2)由(1)知,,,.
所以,
所以.
所以与的回归直线为.
当时,.即在19℃的温度下,种子发芽的颗数为44.
例题2.(2022春·陕西·高三陕西省榆林中学校联考阶段练习)随着人民生活水平的日益提高,汽车普遍进入千家万户,尤其在近几年,新能源汽车涌入市场,越来越受到人们喜爱.某新能源汽车销售企业在2017年至2021年的销售量(单位:万辆)数据如下表:
年份
2017年
2018年
2019年
2020年
2021年
年份代号
1
2
3
4
5
销售量(万辆)
75
84
93
98
100
(1)请用相关系数判断关于的线性相关程度(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确到小数点后两位);
(2)求出关于的线性回归方程,并预计2022年该新能源汽车企业的销售量为多少万辆?
参考数据:,,
附:相关系数,回归直线方程的斜率,截距
【答案】(1)与有很强的线性相关性;
(2),109.2万辆.
【详解】(1)解:由表中数据可得,,∴,
又,,
∴,
所以与有很强的线性相关性;
(2)解:由表中数据可得,
则,
∴,
又2022年对应的代号为6,故,
由此预计2022年该新能源汽车企业的销售量为109.2万辆.
【提分秘籍】
回归直线方程过样本点的中心,是回归直线方程最常用的一个特征;
我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线。这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计,其中称为回归系数,它实际上也就是经验回归直线的斜率,为截距.
其中
【变式演练】
1.(2022·青海西宁·湟川中学校考一模)某电子产品生产商经理从众多平板电脑中随机抽取6台,检测它们充满电后的工作时长(单位:分钟),相关数据如下表所示.
平板电脑序号
1
2
3
4
5
6
工作时长/分
220
180
210
220
200
230
(1)从被抽中的6台平板电脑中随机抽出2台,设抽出的2台平板电脑充满电后工作时长小于210分钟的台数为,求随机变量的分布列及数学期望;
(2)下表是一台平板电脑的使用次数与当次充满电后工作时长的相关数据.求该平板电脑工作时长与使用次数之间的回归直线方程,并估计该平板电脑使用第200次时充满电后的工作时长.
使用次数/次
20
40
60
80
100
120
140
工作时长/分
210
206
202
196
191
188
186
附:,,.
【答案】(1)分布列见解析,数学期望为
(2),估计该平板电脑使用第200次时充满电后的工作时长为171.5分钟
【详解】(1)(1)由题意可知,X可能取值为0,1,2,则
,,.
则随机变量X的分布列为
X
0
1
2
P
数学期望为.
(2),
,,故,
所以线性回归方程为,
当时,,
所以估计该平板电脑使用第200次时充满电后的工作时长为171.5分钟.
2.(2022春·河南·高三信阳高中校联考期末)随着电池充电技术的逐渐成熟,以锂电池为动力的新一代无绳类电动工具以其轻巧便携、工作效率高、环保、可适应多种应用场景下的工作等优势,被广泛使用.在消费者便携无绳化需求与技术发展的双重驱动下,锂电类无绳电动工具及配套充电器市场有望持续扩大.某公司为适应市场并增强市场竞争力,逐年增加研发人员,使得整体研发创新能力持续提升,现对2017~2021年的研发人数作了相关统计,如下图:
2017~2021年公司的研发人数情况(年份代码1~5分别对应2017~2021年)
(1)根据条形统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;
(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数.(结果取整数)
参考数据:,.参考公式:相关系数.线性回归方程的斜率,截距.
附:
相关性
弱
一般
强
【答案】(1),与具有很强的线性相关关系
(2),预测2023年该公司的研发人数约为613人
【详解】(1)由条形统计图,得,
,
所以
,
.
所以.
因为相关系数,所以与具有很强的线性相关关系,且为正相关.
(2),
所以,
所以.
由题意知,2023年对应的年份代码,
当时,,
故预测2023年该公司的研发人数约为613人.
题型二:非线性回归
【典例分析】
例题1.(2022·黑龙江哈尔滨·哈师大附中校考三模)为了构筑“绿色长城”,我国开展广泛的全民义务植树活动,有力推动了生态状况的改善.森林植被状况的改善,不仅美化了家园,减轻了水土流失和风沙对农田的危害,而且还有效提高了森林生态系统的储碳能力.某地区统计了2011年到2020年十年中每年人工植树成活数(,2,3,…,10)(单位:千棵),用年份代码(,2,3,…,10)表示2011年,2012年,2013年,…,2020年,得到下面的散点图:
对数据进行回归分析发现,有两个不同的回归模型可以选择,模型一:,模型二;,其中是自然对数的底数.
(1)根据散点图,判断所给哪个模型更适宜作为每年人工植树成活数与年份代码相关关系的回归分析模型(给出判断即可,不必说明理由);
(2)根据(1)中选定的模型,求出关于的回归方程;
(3)利用(2)中所求回归方程,预测从哪一年开始每年人工植树成活棵数能够超过5万棵?
附:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,.参考数据:,,,设(,2,3,…,10),,,,.
【答案】(1)模型二
(2)
(3)年
(1)
根据散点图可知,呈指数式增长,故应选模型二,其中是自然对数的底数;
(2)
由已知得,两边同时取对数可得,
令,则,
由,,,可知,
,
,
∴,∴;
(3)
令,即,
解得,预测从年开始人工植树成活棵树能超过万棵.
例题2.(2022·安徽·安徽省含山中学校联考三模)2020年新冠肺炎疫情突如其来,在党中央的号召下,应对疫情,我国采取特殊的就业政策、经济政策很好地稳住了经济社会发展大局.在全世界范围内,我国疫情控制效果最好,经济复苏最快.某汽车销售公司2021年经济收入在短期内逐月攀升,该公司在第1月份至6月份的销售收入(单位:百万元)关于月份的数据如表:
时间(月份)
1
2
3
4
5
6
收入(百万元)
6.6
8.6
16.1
21.6
33.0
41.0
根据以上数据绘制散点图,如图所示.
(1)根据散点图判断,与(,,,均为常数)哪一个适宜作为该公司销售收入关于月份的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的结果及表中数据,求出关于的回归方程,并预测该公司8月份的销售收入.(结果近似到小数点后第二位)
参考数据:
3.50
21.15
2.85
17.50
125.35
6.73
其中设
参考公式和数据:对于一组具有线性相关关系的数据,其回归直线的解率和截距的最小二乘法估计公式分别为:,.
【答案】(1)用表示更合适
(2),95.58百万元
(1)
解: ,散点图中点的分布不是一条直线,相邻两点在y轴上差距是增大的趋势,故用表示更合适;
(2)
解:由,得,
设,
∴,
∵,,
∴,
,
∴,
即,则回归方程为,
预测该公司8月份的销售收入百万元.
【提分秘籍】
非线性回归最重要的方法就是通过换元,将非线性问题,转化为线性问题求解;
换元后注意代入数据不要出错。
【变式演练】
1.(2022春·湖北襄阳·高三襄阳五中校考阶段练习)多年来,清华大学电子工程系黄翔东教授团队致力于光谱成像芯片的研究,2022年6月研制出国际首款实时超光谱成像芯片,相比已有光谱检测技术,实现了从单点光谱仪到超光谱成像芯片的跨越,为制定下一年的研发投入计划,该研发团队为需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量x,和年销售额,的数据(,2,,12),该团队建立了两个函数模型:①②,其中均为常数,e为自然对数的底数,经对历史数据的初步处理,得到散点图如图,令,计算得如下数据:
20
66
770
200
14
460
3125000
21500
(1)设和的相关系数为和的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)(i)根据(1)的选择及表中数据,建立关于的回归方程(系数精确到0.01);
(ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量是多少亿元?
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为:,;
②参考数据:.
【答案】(1)模型的拟合程度更好
(2)(i)(ii)预测下一年的研发资金投入量是亿元
【详解】(1)由题意进行数据分析:
则,因此从相关系数的角度,模型的拟合程度更好
(2)(i)先建立关于的线性回归方程.
由,得,即.
由于
所以关于的线性回归方程为,
所以,则.
(ii)下一年销售额需达到80亿元,即,代入得,,
又
所以,解得,
所以预测下一年的研发资金投入量是亿元
2.(2022春·福建三明·高三三明一中校考期中)近年来,美国方面滥用国家力量,不择手段打压中国高科技企业,随着贸易战的不断升级,中国某科技公司为了不让外国“卡脖子”,决定在企业预算中减少宣传广告预算,增加对技术研究和人才培养的投入,下表是的连续7年研发投入x和公司年利润y的观测数据,根据绘制的散点图决定用回归模型:来进行拟合.
表I
研发投入(亿元)
20
22
25
27
29
31
35
年利润(亿元)
7
11
21
24
65
114
325
表II(注:表中)
189
567
162
78106
3040
(1)请借助表II中的数据,求出回归模型的方程;(精确到0.01)
(2)试求研发投入为20亿元时年利润的残差.
参考数据:,附:回归方程中和,残差
【答案】(1)
(2)
【详解】(1)由得,令,得,
由表II数据可得:
,.
所以回归方程为:.
(2)在时的残差:.
3.(2022·全国·高三专题练习)某生物研究所为研究某种昆虫的产卵数和温度的关系,经过一段时间观察,收集到如下数据:
产卵数
以该种昆虫的产卵数和温度为变量,作出如图所示的散点图,现分别用模型①与模型②进行分析.
(1)请利用模型②建立两个变量之间的函数关系式(系数保留两位小数);
(2)已知模型①的回归直线方程为,模型②的样本相关系数,请根据相关系数判断哪个模型的拟合效果更好;
(3)该种昆虫的防治以喷洒杀虫剂为主,其防治成本与温度和产卵数的关系为,用(2)中得出的拟合效果最好的模型计算,当温度(取整数)为何值时,昆虫的防治成本的预估值最小?
附:对于一组数据、、…、,其回归直线的斜率和截距的最小二乘估计分别为,,样本相关系数.
参考数据:,,设,则,.
【答案】(1)
(2)模型②的拟合效果更好
(3)
(1)
解:已知,则,,
则,,
所以,模型②的回归方程为.
(2)
解:已知模型①的回归直线方程为,
则,
所以,,
所以,模型①的样本相关系数,
所以,模型②的拟合效果更好.
(3)
解:该种昆虫的防治成本:
,
当时,防治成本的预估值最小.
题型三:独立性检验
【典例分析】
例题1.(2022春·安徽·高三校联考阶段练习)近年来中年人的亚健康问题日趋严重,引起了政府部门和社会各界的高度关切.一研究机构为了解亚健康与锻炼时间的关系,对某地区的中年人随机调查了人,得到如下数据:
平均每天锻炼时间
不足半小时
半小时到小时(含半小时)
小时及以上
亚健康
无亚健康
(1)从这些中年人中任选人,记“该中年人亚健康”,“该中年人平均每天锻炼时间不足半小时”,分别求和;
(2)完成下面的列联表,根据小概率值的独立性检验,能否认为亚健康与锻炼时间有关联?
平均每天锻炼时间
不足小时
小时及以上
合计
亚健康
无亚健康
合计
附:,.
【答案】(1),
(2)列联表见解析;可以认为亚健康与锻炼时间有关联
【详解】(1)由题意知:中年人亚健康且平均每天锻炼时间不足半小时的人数为人,则;
中年人无亚健康且平均每天锻炼时间超过半小时(含半小时)的人数为人,平均每天锻炼时间超过半小时(含半小时)的人数为人,
,,.
(2)由已知数据可得列联表如下:
平均每天锻炼时间
不足小时
小时及以上
合计
亚健康
无亚健康
合计
零假设:亚健康与锻炼时间无关,
,
依据小概率值的独立性检验,我们推断不成立,即可以认为亚健康与锻炼时间有关联,该推断犯错误的概率不超过.
例题2.(2022春·江苏徐州·高三期末)某棉纺厂为了解一批棉花的质量,在该批棉花中随机抽取了容量为120的样本,测量每个样本棉花的纤维长度(单位:mm,纤维长度是棉花质量的重要指标),所得数据均在区间内,将其按组距为2分组,制作成如图所示的频率分布直方图,其中纤维长度不小于28mm的棉花为优质棉.
(1)求频率分布直方图中的值;
(2)已知抽取的容量为120的样本棉花产自于,两个试验区,部分数据如下2×2列联表:
试验区
试验区
合计
优质棉
10
非优质棉
30
合计
120
将2×2列联表补充完整,并判断是否有99.9%的把握认为优质棉与,两个试验区有关系;
注:①独立性检验的临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
②,其中.
【答案】(1)
(2)列联表见解析,没有99.9%的把握认为优质棉与A,B两个试验区有关系;
【详解】(1)由,解得
(2)抽取的优质棉样本数为
则非优质棉样本数为90,
则2×2列联表如下:
A试验区
B试验区
合计
优质棉
10
20
30
非优质棉
60
30
90
合计
70
50
120
则没有99.9%的把握认为优质棉与A,B两个试验区有关系.
【变式演练】
1.(2022·陕西汉中·统考一模)某企业为响应国家在《“十四五”工业绿色发展规划》中提出的“推动绿色发展,促进人与自然和谐共生”的号召,推进产业结构高端化转型,决定开始投入生产某新能源配件.该企业初步用甲、乙两种工艺进行试产,为了解两种工艺生产新能源配件的质量情况,从两种工艺生产的产品中分别随机抽取了件进行质量检测,得到下图所示的频率分布直方图,规定质量等级包含合格和优等两个等级,综合得分在的是合格品,得分在的是优等品.
(1)从这100件甲工艺所生产的新能源配件中按质量等级分层抽样抽取5件,再从这5件中随机抽取2件做进一步研究,求恰有1件质量等级为优等品的概率;
(2)根据频率分布直方图完成下面的列联表,并判断是否有的把握认为新能源配件的质量等级与生产工艺有关?该企业计划大规模生产这种新能源配件,若你是该企业的决策者,你会如何安排生产,为什么?
合格品
优等品
合计
甲生产工艺
乙生产工艺
总计
附:,其中.
【答案】(1)
(2)列联表答案见解析,有的把握认为配件的质量和生产工艺有关,选择甲工艺生产新能源配件,理由见解析
【详解】(1)由甲工艺频率分布直方图可知,合格品、优等品出现的频率分别为和,
所以按分层抽样抽取的5个配件中,有合格品2个、优等品3个,
所以从5个中随机抽取2个,恰有1个质量等级为优等品的概率为:
.
(2)甲生产工艺生产的合格品有件,优等品有件,
乙生产工艺生产的合格品有件,优等品有件,
所以列联表为:
合格品
优等品
总计
甲生产工艺
40
60
100
乙生产工艺
55
45
100
总计
95
105
200
所以
由于,所以有的把握认为配件的质量和生产工艺有关.
应该选择甲工艺生产新能源配件,因为甲的优等品率为,乙的优等品率仅为.
2.(2022·四川广安·广安二中校考模拟预测)第24届冬季奥运会将于2022年2月4日在北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为,统计得到以下2×2列联表,经过计算可得.
男生
女生
合计
了解
不了解
合计
(1)求的值,并判断有多大的把握认为该校学生对冬季奥运会项目的了解情况与性别有关;
(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取6人,再从这6人中抽取2人进行面对面交流,“至少抽到一名男生”的概率;
附表:
0.10
0.05
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
附:
【答案】(1),有99%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关.
(2)
【详解】(1)解:由题知:2×2列联表完善如下:
男生
女生
合计
了解
不了解
合计
所以,,解得,
所以,,有99%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关.
(2)解:由题知,,抽样比为,
所以,不了解学生中,男生应抽取人,分别记为;女生应抽取人,分别记为;
所以,这6人中抽取2人进行面对面交流,可能的情况有:,共15种,
其中,至少抽到一名男生的情况有共9种情况,
所以,“至少抽到一名男生”的概率为
题型四:超几何分布
【典例分析】
例题1.(2022春·河北衡水·高三校联考阶段练习)随着人们生活水平的提高,国家倡导绿色安全消费,菜篮子工程从数量保障型转向质量效益型.为了测试甲、乙两种不同有机肥料的使用效果,某科研单位用西红柿做了对比实验,分别在两片实验区各摘取100个,对其质量的某项指标值进行检测,质量指数值达到35及以上的为“质量优等”,由测量结果绘成如下频率分布直方图.其中质量指数值分组区间是:,,,,.
(1)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“质量优等”与使用不同的肥料有关;
甲有机肥料
乙有机肥料
合计
质量优等
质量非优等
合计
(2)在摘取的用乙种有机肥料的西红柿中,从“质量优等”中随机选取2个,记区间中含有的个数为,求的分布列及数学期望.
附:.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,有99.9%的把握认为,“质量优等”与使用不同的肥料有关
(2)分布列见解析,
(1)
解:由题意可得列联表为:
甲有机肥料
乙有机肥料
合计
质量优等
60
30
90
质量非优等
40
70
110
合计
100
100
200
则.
所以有99.9%的把握认为“质量优等”与使用不同的肥料有关.
(2)
由频率分布直方图可得“质量优等”有30个,区间中含有10个,
随机变量的可能取值有0,1,2,
,,,
随机变量的分布列如下:
0
1
2
.
例题2.(2022春·江苏镇江·高三校考开学考试)为了研究高三年级学生的性别与体重是否超过55kg的关联性,某机构调查了某中学所有高三年级的学生,整理得到如下列联表.
性别
体重
合计
超过55kg
不超过kg
男
180
120
300
女
90
110
200
合计
270
230
500
参考公式和数据:
,
(1)依据小概率值的独立性检验,能否认为该中学高三年级学生的性别与体重有关联?
(2)按性别采用分层随机抽样的方式在该中学高三年级体重超过55kg的学生中抽取9人,再从这9人中任意选取3人,记选中的女生数为,求的分布列与期望.
【答案】(1)认为该中学高三年级学生的性别与体重有关联,此推断犯错误的概率不大于0.001
(2)分布列见解析;期望为1
(1)
假设为:该中学高三年级学生的性别与体重无关联,
根据列联表中的数据,经计算得到
,
根据小概率值的独立性检验,推断不成立,即认为该中学高三年级学生的性别与体重有关联,此推断犯错误的概率不大于0.001.
(2)
依题意,抽取的9人中,男生有人,女生有人,
从中任意选取3人,X的取值可能为0,1,2,3,
且,,,.
则X的分布列为
X
0
1
2
3
P
故.
【提分秘籍】
一般地,假设一批产品共有件,其中有件次品,从件产品中随机抽取件(不放回),用表示抽取的件产品中的次品数,则的分布列为,.
其中,,,,.
如果随机变量的分布列具有上式的形式,那么称随机变量服从超几何分布.
【变式演练】
1.(2022春·江苏苏州·高三苏州中学校联考阶段练习)文化月活动中,某班级在宣传栏贴出标语“学好数学好”,可以不同断句产生不同意思,“学/好数学/好”指要学好的数学,“学好/数学/好”强调数学学习的重要性,假设一段时间后,随机有个字脱落.
(1)若,用随机变量表示脱落的字中“学”的个数,求随机变量的分布列及期望;
(2)若,假设某同学检起后随机贴回,求标语恢复原样的概率.
【答案】(1)分布列见解析,
(2)0.6
【详解】(1)方法一:
随机变量X的可能取值为0,1,2,
,,,
随机变量X的分布列如下表:
X
0
1
2
P
随机变量X的期望为
法二:
随机变量X服从超几何分布,所以.
(2)设脱落一个“学”为事件,脱落一个“好”为事件,脱落一个“数”为事件,
事件为脱落两个字,
,,
,,,
所以某同学捡起后随机贴回,标语恢复原样的概率为
,
法二:
掉下的两个字不同的概率为,
所以标语恢复原样的概率为.
2.(2022春·福建福州·高三福建省福州第一中学校考阶段练习)班主任为了对本班学生的考试成绩进行分析,决定从本班名女同学,名男同学中随机抽取一个容量为的样本进行分析.
(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)
(2)如果随机抽取的名同学的数学,物理成绩(单位:分)对应如下表:
学生序号i
1
2
3
4
5
6
7
数学成绩
60
65
70
75
85
87
90
物理成绩
70
77
80
85
90
86
93
(i)若规定分以上(包括分)为优秀,从这名同学中抽取名同学,记名同学中数学和物理成绩均为优秀的人数为,求的分布列和数学期望;(结果用最简分数表示)
(ii)根据上表数据,求物理成绩关于数学成绩的线性回归方程(系数精确到);若班上某位同学的数学成绩为分,预测该同学的物理成绩为多少分?
附:线性回归方程,
其中,.
76
83
812
526
【答案】(1)
(2)(i)分布列见解析,期望为;(ii),.
(1)
依据分层抽样的方法,24名女同学中应抽取的人数为名,
18名男同学中应抽取的人数为名,
故不同的样本的个数为.
(2)
(ⅰ)名同学中数学和物理成绩均为优秀的人数为3名,
的取值为0,1,2,3.
,,,,
的分布列为
0
1
2
3
.
(ⅱ)解:,.
线性回归方程为
当时,.
可预测该同学的物理成绩为96分.
3.(2022春·四川内江·高三威远中学校校考阶段练习)已知某校高三进行第一次摸底考试,从全校选考地理的高三学生中,随机抽取 100 名学生的地理成绩制成如图所示的频率分布直方图,满分为 100 分,其中 80 分及以上为优秀,其他为一般.已知成绩优秀的学生中男生有 10 名,成绩一般的学生中男生有 40 名,得到如下的列联表.
性别
考试成绩
合计
优秀
一般
男生
10
40
女生
合计
(1)根据上述数据,完成上面列联表,并依据小概率值的独立性检验,分析“考试成绩优秀”与 “性别” 是否有关?
(2)从考试成绩在中,利用分层随机抽样抽取7名学生进行学习方法经验介绍,从抽取的学生中,再确定3名学生做学习经验的介绍,则抽取的3名学生中,考试成绩在的学生数为,求的分布列与数学期望.
参考公式:,(其中)
0.10
0.05
0.010
0.001
2.706
3.841
6.635
10.828
【答案】(1)列联表见解析,“考试成绩优秀”与 “性别”无关
(2)分布列见解析,
(1)
根据频率分布直方图可得考试成绩优秀的总人数为,
其中女生的人数为18,考试成绩一般的人数为72,其中女生的人数为,
则列联表为
性别
考试成绩
合计
优秀
一般
男生
10
40
50
女生
18
32
50
合计
28
72
100
零假设:考试成绩优秀与性别无关.
,
根据小概率值的独立性检验,没有充分证据推断不成立,
即认为“考试成绩优秀”与“性别”无关.
(2)
根据频率分布直方图可得考试成绩在的学生人数分别为20,8,
利用分层随机抽样抽取7名学生中的成绩在的人数分别为5,2,
则的所有可能取值为0,1,2,
则,
则的分布列为
0
1
2
P
∴.
题型五:二项分布
【典例分析】
例题1.(2022·云南昆明·高三昆明一中校考阶段练习)2022年,某省启动高考综合改革,改革后,不再分文理科,改为采用是“”模式,“3”是语文、外语、数学三科必考,“1”是在物理与历史两科中选择一科,“2”是在化学,生物,政治,地理四科中选择两科作为高考科目,某学校为做好选课走班教学,给出三种可供选择的组合进行模拟选课,其中组合:物理、化学、生物,组合:历史、政治、地理,组合:物理、化学、地理.根据选课数据得到,选择组合的概率为,选择组合的概率为,选择组合的概率为,甲、乙、丙三位同学每人选课是相互独立的.
(1)求这三位同学恰好有两位同学选择相同组合的概率.
(2)记表示这三人中选择含地理的组合的人数,求的分布列及数学期望.
【答案】(1)
(2)分布列见解析,.
【详解】(1)解:用表示第i位同学选择A组合,用表示第i位同学选择B组合,用表示第i位同学选择C组合,.
由题意可知,互相独立,
且.
故三位同学恰好有两位同学选择组合的概率为.
三位同学恰好有两位同学选择组合的概率为.
三位同学恰好有两位同学选择组合的概率为
所以这三位同学恰好有两位同学选择相同组合的概率为:.
(2)选择含地理的组合的概率为,
由题意知的所有可能取值为0,1,2,3,
且,
所以,
,
,
,
所以的分布列为
0
1
2
3
P
所以.
例题2.(2022春·重庆沙坪坝·高三重庆市凤鸣山中学校考期中)伴随经济的飞速发展,中国全民健身赛事活动日益丰富,公共服务体系日趋完善.据相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.健身之于个人是一种自然而然的习惯,之于国家与民族,则是全民健康的基础柱石之一,某市一健身连锁机构对去年的参与了该连锁机构健身的会员进行了统计,制作成如下两个统计图,图1为该健身连锁机构会员年龄等级分布图,图2为一个月内会员到健身连锁机构频数分布扇形图
若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类,将一月内来健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有是“年轻人”.
(1)现从该健身连锁机构会员中随机抽取一个容量为100人的样本,根据上图的数据,补全下方列联表,并判断依据小概率值的独立性检验,能否认为是否为“健身达人”与年龄有关;
类别
年轻人
非年轻人
合计
健身达人
健身爱好者
合计
100
临界值表:
(2)将(1)中的频率作为概率,连锁机构随机选取会员进行回访,抽取3人回访.
①若选到的3人中2人为“年轻人”,1人为“非年轻人”,再从这3人中随机选取的1人,了解到该会员是“健身达人”,求该人为非年轻人的概率;
②设3人中既是“年轻人”又是“健身达人”的人数为随机变量,求的分布列和期望值.
【答案】(1)列联表答案见解析,不能认为“健身达人”与年龄有关
(2)①;②分布列答案见解析,数学期望:
【详解】(1)根据年轻人标准结合图1可得年轻人占比为80%,则年轻人人数为,则非年轻人为20人,根据图2表格得健身达人所占比60%,所以其人数为,根据其中年轻人占比,所以健身达人中年轻人人数为,则非年轻人为10人;
健身爱好者人数为,再通过总共年轻人合计为80人,则健身爱好者中年轻人人数为,3根据非年轻人总共为20人,则健身爱好者中非年轻人人数为,具体表格填写如下.
列联表为
类别
年轻人
非年轻人
合计
健身达人
50
10
60
健身爱好者
30
10
40
合计
80
20
100
零假设,是否为“健身达人”与年龄无关.
所以,依据的独立性检验,不能认为“健身达人”与年龄有关;
(2)①设事件为:该人为年轻人,事件为:该人为健身达人,故此人为“非年轻人”的概率为则
②由(1)知,既是年轻人又是健身达人的概率为,
,
故X的分布列:
0
1
2
3
的数学期望值
.
【提分秘籍】
一般地,在重伯努利试验中,设每次试验中事件发生的概率为(),用表示事件发生的次数,则的分布列为,.
如果随机变量的分布列具有上式的形式,则称随机变量服从二项分布,记作.
【变式演练】
1.(2022·江苏苏州·苏州中学校考模拟预测)随着人脸识别技术的发展,“刷脸支付”成为了一种便捷的支付方式,但是这种支付方式也带来了一些安全性问题.为了调查不同年龄层的人对“刷脸支付”所持的态度,研究人员随机抽取了300人,并将所得结果统计如下表所示.
年龄
频数
30
75
105
60
30
持支持态度
24
66
90
42
18
(1)完成下列2×2列联表,并判断是否有99.9%的把握认为年龄与所持态度具有相关性;
年龄在50周岁以上(含50周岁)
年龄在50周岁以下
总计
持支持态度
不持支持态度
总计
(2)以(1)中的频率估计概率,若在该地区所有年龄在50周岁以上(含50周岁)的人中随机抽取4人,记X为4人中持支持态度的人数,求X的分布列以及数学期望;
(3)已知某地区“万嘉”连锁超市在安装了“刷脸支付”仪器后,使用“刷脸支付”的人数y与第x天之间的关系统计如下表所示,且数据的散点图呈现出很强的线性相关的特征,请根据表中的数据用最小二乘法求y与x的回归直线方程.
i
1
2
3
4
5
6
7
第天
2
4
8
12
22
26
38
使用人数
参考数据:,.
0.050
0.010
0.001
k
3.841
6.635
10.828
参考公式:,,.
【答案】(1)表格见解析,有
(2)分布列见解析,
(3).
【详解】(1)完成列联表如下:
年龄在50周岁以上(含50周岁)
年龄在50周岁以下
总计
持支持态度
60
180
240
不持支持态度
30
30
60
总计
90
210
300
故本次实验中的观测值,
故有99.9%的把握认为年龄与所持态度具有相关性;
(2)依题意,,
故,,
,,
;
故X的分布列为:
X
0
1
2
3
4
P
故;
(3)依题意,,,由得,
,
所以.
故y关于x的线性回归方程是.
2.(2022春·湖南湘潭·高三湘潭一中校考期中)年月日是中国传统二十四节气“立秋”,该日,“秋天的第一杯奶茶”再度出圈,据此,学校社会实践小组随机调查了该地区位奶茶爱好者的年龄,得到如下样本数据频率分布直方图.
(1)估计奶茶爱好者的平均年龄;(同一组数据用该区间的中点值作代表)
(2)估计奶茶爱好者年龄位于区间的概率;
(3)以频率替代概率进行计算,若从该地区所有奶茶爱好者中任选人,求人中年龄在岁以下的人数的分布列和期望.
【答案】(1)岁
(2)
(3)分布列见解析,数学期望为
【详解】(1)由频率分布直方图估计奶茶爱好者的平均年龄为:
(岁).
(2)由频率分布直方图得:奶茶爱好者年龄位于区间的频率为,
由频率估计概率可知:奶茶爱好者年龄位于区间的概率为.
(3)由频率分布直方图得:从该地区所有奶茶爱好者中任选人,年龄在岁以下的概率为,;
则所有可能的取值为,
;;;;
的分布列为:
则数学期望.
3.(2022春·甘肃兰州·高三兰州西北中学校考期中)为丰富学生的校园生活,提升学生的实践能力和综合素质能力,培养学生的兴趣爱好,某校计划借课后托管服务平台开设书法兴趣班.为了解学生对这个兴趣班的喜欢情况,该校随机抽取了本校100名学生,调查他们对这个兴趣班的喜欢情况,得到数据如下:
喜爱
不喜爱
合计
男
40
20
60
女
30
10
40
合计
70
30
100
以调查得到的男、女学生喜欢书法兴趣班的频率代替概率.
(1)从该校随机抽取1名男学生和1名女学生,求这2名学生中恰有1人喜欢书法兴趣班的概率;
(2)从该校随机抽取4名女学生,记X为喜欢书法兴趣班的女生人数,求X的分布列与期望.
【答案】(1)
(2)分布列见解析,期望为3.
【详解】(1)从男生中抽取1名学生,喜欢书法兴趣班的概率为,从女生中抽取1名学生,喜欢书法兴趣班的概率为,
恰有一人喜欢书法兴趣班分为男生喜欢女生不喜欢和男生不喜欢女生喜欢两类,
所以所求概率为;
(2)从女生中抽取1名学生,喜欢书法兴趣班的概率为,
由题意的值分别为0,1,2,3,4,,
,,
,,
,
的分布列为:
0
1
2
3
4
.
题型六:正态分布
【典例分析】
例题1.(2022·全国·高三专题练习)十九大以来,某贫困地区扶贫办积极贯彻落实国家精准扶贫的政策要求,带领广大农村地区人民群众脱贫奔小康,经过不懈的奋力拼搏,新农村建设取得巨大进步,农民年收入也逐年增加,为了制定提升农民收入力争早日脱贫的工作计划,该地扶贫办统计了年位农民的年收入并制成如下频率分布直方图:
(1)根据频率分布直方图,估计位农民的年平均收入(单位:千元)(同一组数据用该组数据区间的中点值表示);
(2)由频率分布直方图,可以认为该贫困地区农民收入服从正态分布,其中近似为年平均收入,近似为样本方差,经计算得,利用该正态分布,求:
①在扶贫攻坚工作中,若使该地区约有的农民的年收入不低于扶贫办制定的最低年收入标准,则最低年收入大约为多少千元?
②为了调研“精准扶贫,不落一人”的政策要求落实情况,扶贫办随机走访了位农民.若每位农民的年收入互相独立,这位农民中的年收入不少于千元的人数为,求.
附参考数据:①,②若随机变量服从正态分布,则,.
【答案】(1)
(2)①千元;②
(1)
解:由频率分布直方图可知,位农民的年平均收入为
(千元).
(2)
解:由题意知,
①,
所以时,满足题意,即最低年收入大约为千元;
②由,
则,
每个农民的年收入不少于千元的事件的概率为,
则,.
例题2.(2022·全国·高三专题练习)某收费APP(手机应用程序)自上架以来,凭借简洁的界面设计、方便的操作方式和实用的强大功能深得用户喜爱.为回馈市场并扩大用户量,该APP在2022年以竞价形式做出优惠活动,活动规则如下:①每月1到15日,大家可通过官网提交自己的报价(报价低于原价),但在报价时间截止之前无法得知其他人的报价和当月参与活动的总人数;②当月竞价时间截止后的第二天,系统将根据当期优惠名额,按出价从高到低的顺序给相应人员分配优惠名额,获得优惠名额的人的最低出价即为该APP在当月的下载优惠价,出价不低于优惠价的人将获得数额为原价减去优惠价的优惠券,并可在当月下载该APP时使用.小明拟参加2022年7月份的优惠活动,为了预测最低成交价,他根据网站的公告统计了今年2到6月参与活动的人数,如下表所示:
时间(月)
2
3
4
5
6
参与活动的人数(万人)
0.5
0.6
1
1.4
1.7
(1)若可用线性回归模型拟合参与活动的人数(单位:万人)与时间t(单位:月)之间的关系,请用最小二乘法求关于的回归方程,并预测今年7月参与活动的人数;
(2)某自媒体对200位拟参加今年7月份活动的人进行了一个抽样调查,得到如表所示的频数表:
报价(单位:元)
频数
20
60
60
30
20
10
①求这200人的报价X(单位:元)的平均值和方差(同一区间的报价用该价格区间的中点值代替);
②假设所有参与活动的人的报价X(单位:元)可视为服从正态分布,且与可分别由①中所求的样本平均数及估计,若2022年7月计划发放优惠名额数量为3173,请你合理预测该在当月的下载优惠价,并说明理由.
参考公式及数据:①回归方程,,;②,,;③若随机变量X服从正态分布,则,,.
【答案】(1),预计今年7月参与活动的人数为万人;
(2)①,;②元.
(1)
解:由题意可得,
,
又因为,,
所以,
,
所以回归直线方程为:,
当时,可得(万人),
故预计今年7月参与活动的人数为万人;
(2)
解:①依题意可得这200人的报价(单位:元)的平均值,
方差
;
②由①可知,依题意发放的优惠名额为张,预测参加的人数为人,
所以能够得到优惠名额的概率,设下载优惠价为,则
又,,因为,
所以,
则,
所以预测该APP在当月的下载优惠价为元.
【提分秘籍】
正态变量的取值范围是,但在一次试验中,的值几乎总是落在区间内,而在此区间以外取值的概率大约只有0.0027,通常认为这种情况几乎不可能发生.
在实际应用中,通常认为服从于正态分布的随机变量只取中的值,这在统计学中称为原则.
【变式演练】
1.(2022春·广东·高三统考阶段练习)某市宣传部门开展了线上新冠肺炎世界防控现状及防控知识竞赛,现从全市的参与者中随机抽取了1000名幸运者的成绩进行分析,把他们的得分(满分100分)分成以下7组:,,,,,,,统计得各组的频率之比为1∶6:8:10:9:4:2.同一组数据用该区间中点值代替.
(1)求这1000名幸运者成绩的第75百分位数和平均值(结果保留整数)﹔
(2)若此次知识竞赛得分,为感谢市民的积极参与,对参与者制定如下奖励方案:得分不超过79分的可获得1次抽奖机会,得分超过79分不超过93分的可获得2次抽奖机会,超过93分的有3次抽奖机会,试估计任意一名幸运者获得抽奖次数的数学期望.
参考数据:
,,.
【答案】(1)第75百分位数约为76分,平均值为65分
(2)数学期望为1.1814次.
【详解】(1)这1000名幸运者成绩的第75百分位数为x,则
所以,解得(分),
(分).
所以这1000名幸运者成绩的第75百分位数约为76分,平均值为65分;
(2)设随机变量Y表示任意一名幸运者的抽奖次数,则Y的可能取值为1,2,3,
由已知及(1)得,,
,
,
,
其分布列为
Y
1
2
3
P
0.84135
0.1359
0.02275
所以.
所以可以估计任意一名幸运者获得抽奖次数的数学期望为1.1814次.
2.(2022·全国·高三专题练习)我国是全球制造业大国,制造业增加值自2010年起连续12年位居世界第一,主要产品产量稳居世界前列,为深入推进传统制造业改造提升,全面提高传统制造业核心竞争力,某设备生产企业对现有生产设备进行技术攻坚突破.设备生产的零件的直径为(单位:nm).
(1)现有旧设备生产的零件共7个,其中直径大于10nm的有4个.现从这7个零件中随机抽取3个.记表示取出的零件中直径大于10nm的零件的个数,求的分布列及数学期望;
(2)技术攻坚突破后设备生产的零件的合格率为,每个零件是否合格相互独立.现任取6个零件进行检测,若合格的零件数超过半数,则可认为技术攻坚成功.求技术攻坚成功的概率及的方差;
(3)若技术攻坚后新设备生产的零件直径,从生产的零件中随机取出10个,求至少有一个零件直径大于9.4nm的概率.
参考数据:若,则,,,,.
【答案】(1)分布列见解析,
(2),
(3)
【详解】(1)由题意,可知可取0,,1,2,3,.则有
,,
,.
故的分布列为:
0
1
2
3
从而的数学期望.
(2)可取的值为0,1,2,3,4,5,6,则有
;
;
.
所以技术攻坚成功的概率,
因于,所以的方差.
(3)由,则可知,
由于,则,
所以,
所以,
则,
记“从生产的零件中随机取出10个,至少有一个零件直径大于9.4nm”为事件,
则.
故至少有一个零件直径大于9.4nm的概率为.
3.(2022·全国·高三专题练习)盐水选种是古代劳动人民的智慧结晶,其原理是借助盐水估测种子的密度,进而判断其优良.现对一批某品种种子的密度(单位:)进行测定,认为密度不小于的种子为优种,小于的为良种.自然情况下,优种和良种的萌发率分别为和.
(1)若将这批种子的密度测定结果整理成频率分布直方图,如图所示,据图估计这批种子密度的平均值;(同一组中的数据用该组区间的中点值为代表)
(2)在(1)的条件下,用频率估计概率,从这批种子(总数远大于2)中选取2粒在自然情况下种植,设萌发的种子数为,求随机变量的分布列和数学期望(各种子的萌发互相独立);
(3)若该品种种子的密度,任取该品种种子20000粒,估计其中优种的数目.附:假设随机变量,则.
【答案】(1)1.24
(2)分布列见解析,期望1.44;
(3)粒.
(1)
种子密度的平均值为:()
(2)
由频率分布直方图知优种占比为,
任选一粒种子萌发的概率,
因为为这批种子总数远大于2,所以,
,,
,
所以布列为:
0
期望.
(3)
因为该品种种子的密度,
所以,,即,
所以20000粒种子中约有优种(粒)
即估计其中优种的数目为粒.
题型七:概率综合
【典例分析】
例题1.(2022·全国·高三专题练习)“学习强国”学习平台是由中宣部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员,面向全社会的优质平台.该平台首次实现了“有组织,有管理,有指导,有服务”的学习,极大地满足了广大党员干部和人民群众多样化、自主化、便捷化的学习需求,日益成为老百姓了解国家动态,紧跟时代脉搏的热门APP.某市宣传部门为了解市民利用“学习强国”学习国家政策的情况,从全市抽取1000人进行调查,统计市民每周利用“学习强国”的时长,下图是根据调查结果绘制的频率分布直方图.
(1)估计该市市民每周利用“学习强国”时长在区间内的概率;
(2)估计该市市民每周利用“学习强国”的平均时长;
(3)若宣传部为了解市民每周利用“学习强国”的具体情况,准备采用分层抽样的方法从和组中抽取7人了解情况,从这7人中随机选取2人参加座谈会,求所选取的2人来自不同的组的概率.
【答案】(1)0.3
(2)6.8小时
(3).
(1)
由题意知,该市市民每周利用“学习强国”时长在内的频率为,
所以估计该市市民每周利用“学习强国”时长在内的概率为0.3.
(2)
由题意知各组的频率分别为0.05,0.1,0.25,0.3,0.15,0.1,0.05,
所以,
所以估计该市市民每周利用“学习强国”的平均时长在6.8小时.
(3)
由(2)知,利用“学习强国”时长在和的频率分别为0.25,0.1,故两组人数分别为250,100,
采用分层抽样的方法从组抽取人数为,记作a,b,c,d,e;从组抽取人数为,记作A,B;
从7人中抽取2人的基本事件有,共21个,来自不同组的基本事件有,共10个,
故所求概率.
例题2.(2022·全国·高三专题练习)《中华人民共和国未成年人保护法》是为保护未成年人身心健康,保障未成年人合法权益,根据宪法制定的法律.某中学为宣传未成年人保护法,特举行一次未成年人保护法知识竞赛.竞赛规则是:两人一组,每一轮竞赛中,小组两人分别选答两题,两人答题互不影响.若答对题数合计不少于3题,则称这个小组为“优秀小组”.已知甲、乙两位同学组成一组,且甲、乙同学答对每道题的概率分别为.
(1)若,则在第一轮竞赛中,求该组获“优秀小组”的概率;
(2)当时,求该组在每轮竞赛中获得“优秀小组”的概率的最大值.
【答案】(1);
(2).
【详解】(1)记他们获得“优秀小组”的事件为事件,则事件包含三种情况:
甲答对两题,乙答对一题的事件B;甲答对一题,乙答对两题的事件C,甲、乙都答对两题的事件D,
事件B、C、D互斥,又因为甲乙两人答题相互独立,
,
所以该组获“优秀小组”的概率.
(2)由(1)知甲、乙小组每轮比赛获“优秀小组”的概率为:
,
又,则, 当且仅当时,等号成立,
而 ,,于是有 ,因此,
令 ,则,当且仅当时等号成立,
所以该组在每轮竞赛中获得“优秀小组”的概率的最大值为.
【变式演练】
1.(2022·全国·高三专题练习)甲乙两人玩卡片游戏:他们手里都拿着分别标有数字1,2,3,4,5,6的6张卡片,各自从自己的卡片中随机抽出1张,规定两人谁抽出的卡片上的数字大,谁就获胜,数字相同则为平局.
(1)求甲获胜的概率.
(2)现已知他们都抽出了标有数字6的卡片,为了分出胜负,他们决定从手里剩下的卡片中再各自随机抽出1张,若他们这次抽出的卡片上数字之和为偶数,则甲获胜,否则乙获胜.请问:这个规则公平吗,为什么 ?
【答案】(1);(2)见解析
【详解】(1)两人各自从自己的卡片中随机抽出一张,所有可能的结果为:
,,
,共36种,
其中事件“甲获胜”包含的结果为:
,
有15种.
所以甲获胜的概率为.
(2)两人各自从于里剩下的卡片中随机抽出一张,所有可能的结果为:
,共25种.
其中卡片上的数字之和为偶数的结果为:
,共13种.
根据规则,甲获胜的概率为,则乙获胜的概率为,所以这个规则不公平.
2.(2022春·内蒙古呼和浩特·高三呼市二中校考阶段练习)设随机变量,若,且,则,其中,.某工厂对一批零件进行抽样检测,根据经验可知每个零件是次品的概率均为.
(1)若从这批零件中抽取2个进行检测,求其中次品数的分布列及数学期望;
(2)现对这批零件抽取100个进行检测,若其中次品数多于3个,则这批零件为不合格产品.估算这批零件为不合格产品的概率(精确到.
【答案】(1)答案见解析
(2)0.14
【详解】(1)根据题意可知,
则,
,
,
所以的分布列为:
0
1
2
的数学期望为.
(2)设为次品的数量,则,且,
所以,
根据题意可知,其中,
当时,这批零件为不合格产品,
则这批零件为不合格产品的概率为,
即,
综上,这批产品为不合格产品的概率约为.
3.(2022春·湖北·高三校联考阶段练习)某学校为了迎接党的二十大召开,增进全体教职工对党史知识的了解,组织开展党史知识竞赛活动并以支部为单位参加比赛.现有两组党史题目放在甲、乙两个纸箱中,甲箱有5个选择题和3个填空题,乙箱中有4个选择题和3个填空题,比赛中要求每个支部在甲或乙两个纸箱中随机抽取两题作答.每个支部先抽取一题作答,答完后题目不放回纸箱中,再抽取第二题作答,两题答题结束后,再将这两个题目放回原纸箱中.
(1)如果第一支部从乙箱中抽取了2个题目,求第2题抽到的是填空题的概率;
(2)若第二支部从甲箱中抽取了2个题目,答题结束后错将题目放入了乙箱中,接着第三支部答题,第三支部抽取第一题时,从乙箱中抽取了题目.已知第三支部从乙箱中取出的这个题目是选择题,求第二支部从甲箱中取出的是2个选择题的概率.
【答案】(1)
(2)
【详解】(1)设表示“第次从乙箱中取到填空题”,,2,
,,
由全概率公式得:第2次抽到填空题的概率为:
;
(2)设事件 为“第三支部从乙箱中抽1个选择题”,
事件为“第二支部从甲箱中取出2个题都是选择题”,
事件为“第二支部从甲箱中取出1个选择题1个填空题”,
事件为“第二支部从甲箱中取出2个题都是填空题”,
则、、彼此互斥,且,
,
,
,
,
,
,
所求概率即是发生的条件下发生的概率:.
题型八:概率统计与数列
【典例分析】
例题1.(2022·全国·高三专题练习)某商场拟在年末进行促销活动,为吸引消费者,特别推出“玩游戏,送礼券“的活动,游戏规则如下:每轮游戏都抛掷一枚质地均匀的骰子(形状为正方体,六个面的点数分别为1,2,3,4,5,6),若向上点数不超2点,获得1分,否则获得2分,进行若干轮游戏,若累计得分为19分,则游戏结束,可得到200元礼券,若累计得分为20分,则游戏结束,可得到纪念品一份,最多进行20轮游戏.
(1)当进行完3轮游戏时,总分为,求的期望;
(2)若累计得分为的概率为,(初始得分为0分,).
①证明数列,(i=1,2,…,19)是等比数列;
②求活动参与者得到纪念品的概率.
【答案】(1)5;(2)①证明见解析;②.
【详解】(1)由题意可知每轮游戏获得1分的概率为,获得2分的概率为,设进行完3轮游戏时,得1分的次数为,所以,,而,即随机变量X可能取值为3,4,5,6,
,,
,.
∴X的分布列为:
X
3
4
5
6
P
E(X)==5.
(2)①证明:n=1,即累计得分为1分,是第1次掷骰子,向上点数不超过2点,,则,累计得分为i分的情况有两种:
(Ⅰ)i=(i﹣2)+2,即累计得i﹣2分,又掷骰子点数超过2点,其概率为,
(Ⅱ)累计得分为i﹣1分,又掷骰子点数没超过2点,得1分,其概率为,
∴,∴,(i=2,3,•••,19),∴数列,(i=1,2,…,19)是首项为﹣,公比为﹣的等比数列.
②∵数列,(i=1,2,…,19)是首项为﹣,公比为﹣的等比数列,
∴,
∴,,•••,,
各式相加,得:,
∴,(i=1,2,•••,19),
∴活动参与者得到纪念品的概率为:
.
例题2.(2022·全国·高三专题练习)为落实《关于全面加强和改进新时代学校体育工作的意见》,完善学校体育“健康知识+基本运动技能+专项运动技能”教学模式,建立“校内竞赛-校级联赛-选拔性竞赛-国际交流比赛”为一体的竞赛体系,构建校、县(区)、地(市)、省、国家五级学校体育竞赛制度.某校开展“阳光体育节”活动,其中传统项目“定点踢足球”深受同学们喜爱.其间甲、乙两人轮流进行足球定点踢球比赛(每人各踢一次为一轮),在相同的条件下,每轮甲、乙两人在同一位置,甲先踢,每人踢一次球,两人有1人命中,命中者得1分,未命中者得分;两人都命中或都未命中,两人均得0分,设甲每次踢球命中的概率为,乙每次踢球命中的概率为,且各次踢球互不影响.
(1)经过1轮踢球,记甲的得分为,求的数学期望;
(2)若经过轮踢球,用表示经过第轮踢球累计得分后甲得分高于乙得分的概率.
①求,,;
②规定,且有,请根据①中,,的值求出、,并求出数列的通项公式.
【答案】(1);(2)①,,;②,.
【详解】(1)记一轮踢球,甲命中为事件,乙命中为事件,,相互独立.
由题意,,甲的得分的可能取值为,0,1.
,
.
,
∴的分布列为:
0
1
.
(2)①由(1),
.
经过三轮踢球,甲累计得分高于乙有四种情况:甲3轮各得1分;甲3轮中有2轮各得1分,1轮得0分;甲3轮中有1轮得1分,2轮各得0分;甲3轮中有2轮各得1分,1轮得分.
∴,
②∵规定,且有,
∴代入得:,
∴,∴数列是等比数列,
公比为,首项为,∴.
∴
【提分秘籍】
借助数列的地推关系式,求出概率或统计量之间的关系,这是高考的重要考点,递推关系作为重要的工具,为解决概率统计中的问题提供了便利.
【变式演练】
1.(2022·全国·模拟预测)某学校开展投篮活动,活动规则是:每名选手投篮次(,),每次投篮,若投进,则下一次站在三分线处投篮;若没有投进,则下一次站在两分线处投篮.规定每名选手第一次站在两分线处投篮.站在两分线处投进得2分,否则得0分;站在三分线处投进得3分,否则得0分.已知小明站在两分线处投篮投进的概率为0.7,站在三分线处投篮投进的概率为0.5,且每次投篮相互独立.
(1)记小明前2次投篮累计得分为,求的分布列和数学期望;
(2)记第次投篮时,小明站在三分线处投篮的概率为,,2,…,,求的表达式.
【答案】(1)分布列见解析,
(2)
(1)
依题意,的所有可能取值为,,.
记“小明第次投篮站在两分线处并且投进”为事件,,,
“小明第2次投篮站在三分线处并且投进”为事件.
;
;
.
所以的分布列为
所以.
(2)
由题意知,.
当时,分两种情形:
①若小明第次投篮站在三分线处,这种情形下小明第次投篮站在三分线处的概率为;
②若小明第次投篮站在两分线处,这种情形下小明第次投篮站在三分线处的概率为.
所以,
所以,
由题易知,
当时,也成立,
所以是以为首项,为公比的等比数列.
所以,即.
2.(2022·江苏连云港·江苏省赣榆高级中学校考模拟预测)某超市开展购物抽奖送积分活动,每位顾客可以参加(,且)次抽奖,每次中奖的概率为,不中奖的概率为,且各次抽奖相互独立.规定第1次抽奖时,若中奖则得10分,否则得5分.第2次抽奖,从以下两个方案中任选一个;
方案① :若中奖则得30分,否则得0分;
方案② :若中奖则获得上一次抽奖得分的两倍,否则得5分.
第3次开始执行第2次抽奖所选方案,直到抽奖结束.
(1)如果,以抽奖的累计积分的期望值为决策依据,顾客甲应该选择哪一个方案?并说明理由;
(2)记顾客甲第i次获得的分数为,并且选择方案②.请直接写出与的递推关系式,并求的值.(精确到0.1,参考数据:.)
【答案】(1)应选择方案① ,理由见解析;
(2),
(1)
若甲第2次抽奖选方案①,两次抽奖累计积分为,则的可能取值为40,35,10,5.
,,
,,
所以.
若甲第2次抽奖选方案②,两次抽奖累计积分为,则的可能取值为30,15,10,
则,,,,
因为,所以应选择方案①.
(2)
依题意得,
的可能取值为10,5其分布列为
10
5
P
所以,则,
由得,
所以为等比数列.其中首项为,公比为.
所以,故.
3.(2022·全国·高三专题练习)安庆市某学校高三年级开学之初增加晚自习,晚饭在校食堂就餐人数增多,为了缓解就餐压力,学校在原有一个餐厅的基础上增加了一个餐厅,分别记做餐厅甲和餐厅乙,经过一周左右统计调研分析:前一天选择餐厅甲就餐第二天选择餐厅甲就餐的概率是25%、选择餐厅乙就餐的概率为75%,前一天选择餐厅乙就餐第二天选择餐厅乙就餐的概率是50%、选择餐厅甲就餐的概率也为50%,如此往复.假设学生第一天选择餐厅甲就餐的概率是,择餐厅乙就餐的概率是,记某同学第n天选择甲餐厅就餐的概率为.
(1)记某班级的3位同学第二天选择餐厅甲的人数为X,求X的分布列,并求E(X);
(2)请写出与的递推关系;
(3)求数列的通项公式并帮助学校解决以下问题:为提高学生服务意识和团队合作精神,学校每天从20个班级中每班抽调一名学生志愿者为全体学生提供就餐服务工作,根据上述数据,如何合理分配到餐厅甲和餐厅乙志愿者人数?请说明理由.
【答案】(1)分布列答案见解析,;
(2);
(3)分配到餐厅甲和餐厅乙志愿者人数8人和12人,理由见解析.
【详解】(1)某同学第二天选择餐厅甲就餐的概率,
某同学第二天选择餐厅乙就餐的概率,
位同学第二天选择餐厅甲就餐的人数为,则.
,
的分布列为
0
1
2
3
故.
(2)依题意,,即.
(3)由(2)知,则当时,可得,
数列是首项为公比为的等比数列.
,即.
,
所以,分配到餐厅甲的志愿者人数为,分配到餐厅乙的志愿者人数为.
题型九:概率统计与导数
【典例分析】
例题1.(2022·全国·高三专题练习)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设表示1个微生物个体繁殖下一代的个数,.
(1)已知,求;
(2)设表示该种微生物经过多代繁殖后临近灭绝的概率,是关于的方程:的一个最小正实根,求证:当时,,当时,;
(3)根据你的理解说明(2)问结论的实际含义.
【答案】(1)1;(2)见解析;(3)见解析.
【详解】(1).
(2)设,
因为,故,
若,则,故.
,
因为,,
故有两个不同零点,且,
且时,;时,;
故在,上为增函数,在上为减函数,
若,因为在为增函数且,
而当时,因为在上为减函数,故,
故为的一个最小正实根,
若,因为且在上为减函数,故1为的一个最小正实根,
综上,若,则.
若,则,故.
此时,,
故有两个不同零点,且,
且时,;时,;
故在,上为增函数,在上为减函数,
而,故,
又,故在存在一个零点,且.
所以为的一个最小正实根,此时,
故当时,.
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.
例题2.(2022·全国·高三专题练习)某篮球队为提高队员的训练积极性,进行小组投篮游戏,每个小组由两名队员组成,队员甲与队员乙组成了一个小组.游戏规则:每个小组的两名队员在每轮游戏中分别投篮两次,每小组投进的次数之和不少于3次的称为“神投小组”,已知甲乙两名队员投进篮球的概率为别为,.
(1)若,,则在第一轮游戏他们获“神投小组”的概率;
(2)若,则在游戏中,甲乙两名队员想要获得“神投小组”的称号16次,则理论上他们小组要进行多少轮游戏才行?并求此时,的值.
【答案】(1);(2)理论上至少要进行轮游戏,.
【详解】(1)由题可知,所以可能的情况有:①甲投中1次,乙投中2次;②甲投中2次,乙投中1次;③甲投中2次,乙投中2次.故所求概率:
.
(2)他们在一轮游戏中获“神投小组”的概率为:
,
因为,所以,
因为,,,所以,,
又,所以,
令,以,则,
当时,,
他们小组在轮游戏中获“神投小组”次数满足,
由,则,所以理论上至少要进行轮游戏.
此时,,.
【提分秘籍】
概率统计中的最值问题常用工具有:
①基本不等式
②求导
【变式演练】
1.(2022春·山东·高三校联考阶段练习)某公司在一种传染病毒的检测试剂品上加大了研发投入,其研发的检验试剂品分为两类不同剂型和.现对其进行两次检测,第一次检测时两类试剂和合格的概率分别为和,第二次检测时两类试剂和合格的概率分别为和.已知两次检测过程相互独立,两次检测均合格,试剂品才算合格.
(1)设经过两次检测后两类试剂和合格的种类数为,求的分布列和数学期望;
(2)若地区排查期间,一户4口之家被确认为“与确诊患者的密切接触者”,这种情况下医护人员要对其家庭成员逐一使用试剂品进行检测,如果有一人检测呈阳性,则检测结束,并确定该家庭为“感染高危户”.设该家庭每个成员检测呈阳性的概率均为且相互独立,该家庭至少检测了3个人才确定为“感染高危户”的概率为,若当时,最大,求的值.
【答案】(1)分布列见解析,1
(2).
【详解】(1)剂型合格的概率为:;
剂型合格的概率为:.
由题意知X的所有可能取值为0,1,2.
则,
,
,
则X的分布列为
X
0
1
2
P
数学期望.
(2)检测3人确定“感染高危户”的概率为,
检测4人确定“感染高危户”的概率为,
则.
令,因为,所以,
原函数可化为.
因为,
当且仅当,即时,等号成立.
此时,所以.
2.(2022春·上海黄浦·高三上海市光明中学校考期中)汽车尾气排放超标是全球变暖、海平面上升的重要因素.我国近几年着重强调可持续发展,加大在新能源项目的支持力度,积极推动新能源汽车产业发展,某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到下面的统计表:
年份t
2017
2018
2019
2020
2021
年份代码x()
1
2
3
4
5
销量y/万辆
10
12
17
20
26
(1)统计表明销量y与年份代码x有较强的线性相关关系,利用计算器求y关于x的线性回归方程,并预测该地区新能源汽车的销量最早在哪一年能突破50万辆;
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业随机调查了该地区200位购车车主的购车情况作为样本,其中男性车主中购置传统燃油汽车的有w名,购置新能源汽车的有45名,女性车主中有20名购置传统燃油汽车.
①若,将样本中购置新能源汽车的性别占比作为概率,以样本估计总体,试用(1)中的线性回归方程预测该地区2023年购置新能源汽车的女性车主的人数(假设每位车主只购买一辆汽车,结果精确到千人);
②设男性车主中购置新能源汽车的概率为p,将样本中的频率视为概率,从被调查的所有男性车主中随机抽取5人,记恰有3人购置新能源汽车的概率为,求当w为何值时,最大.
【答案】(1);2028年
(2)① 15.5万人 ② 30
【详解】(1)(1)解:由题意得,
,
,.
所以,.
所以关于的线性回归方程为,
令,得,
所以最小的整数为12,,
所以该地区新能源汽车的销量最早在2028年能突破50万辆.
(2)解:①由题意知,该地区200名购车者中女性有名,
故其中购置新能源汽车的女性车主的有名.
所购置新能源汽车的车主中,女性车主所占的比例为.
所以该地区购置新能源汽车的车主中女性车主的概率为.
当时,,
所以预测该地区2023年购置新能源汽车的销量为33万辆,
因此预测该地区2020年购置新能源汽车的女性车主的人数为万人
②由题意知,,
则,
,
当时,知所以函数单调递增,
当时,知所以函数单调递减
所以当取得最大值.
此时,解得,
所以当时,取得最大值.
1.(2022·陕西宝鸡·统考一模)甲、乙两个代表队各有3名选手参加对抗赛.比赛规定:甲队的1,2,3号选手与乙队的1,2,3号选手按编号顺序各比赛一场,某队连赢3场,则获胜,否则由甲队的1号对乙队的2号,甲队的2号对乙队的1号加赛两场,胜场多者最后获胜(每场比赛只有胜或负两种结果).已知甲队的1号对乙队的1,2号选手的胜率分别是0.5,0.6,甲队的2号对乙队的1,2号选手的胜率都是0.5,甲队的3号对乙队的3号选手的胜率也是0.5,假设每场比赛结果相互独立.
(1)求甲队仅比赛3场获胜的概率;
(2)已知每场比赛胜者可获得200个积分,求甲队队员获得的积分数之和的分布列及期望.
【答案】(1)0.125;
(2)分布列见解析,期望为465.
【详解】(1)甲队1,2,3号选手与乙队1,2,3号选手比赛获胜的概率分别为,,
甲队比赛3场获胜的概率为=;
(2)X所以可能取得值为;
,
,
,
,
.
即
X
0
200
400
600
800
P
0.125
0.075
0.2625
0.425
0.1125
所以.
2.(2022·广东广州·统考一模)世界卫生组织建议成人每周进行至5小时的中等强度运动.已知社区有的居民每周运动总时间超过5小时,社区有的居民每周运动总时间超过5小时,社区有的居民每周运动总时间超过5小时,且三个社区的居民人数之比为.
(1)从这三个社区中随机抽取1名居民,求该居民每周运动总时间超过5小时的概率;
(2)假设这三个社区每名居民每周运动总时间为随机变量(单位:小时),且.现从这三个社区中随机抽取3名居民,求至少有两名居民每周运动总时间为5至6小时的概率.
【答案】(1)
(2)
【详解】(1)因为三个社区的居民人数之比为,
设三个社区的居民人数为,
所以社区每周运动总时间超过5小时的人数为:,
社区每周运动总时间超过5小时的人数为:,
社区每周运动总时间超过5小时的人数为:,
该居民每周运动总时间超过5小时的概率.
(2)因为这三个社区每名居民每周运动总时间为随机变量(单位:小时),且,
所以,由(1)知,,
所以,
因为随机变量服从正态分布,且关于对称,
所以,
所以从这三个社区中随机抽取3名居民,求至少有两名居民每周运动总时间为5至6小时的概率为:
.
3.(2022·全国·模拟预测)某校课题组选取高一两个班级开展对“数学问题链深度设计”的研究,其中A班为常规教学班,B班为课改研究班.在一次期末考试后,对A,B两班学生的数学成绩(单位:分)进行分析,满分150分,规定:小于120分为不优秀,大于或等于120分为优秀.已知A,B两班学生的数学成绩的频数分布统计表如下:
A班:
分组
100分以下
频数
4
8
10
12
12
4
B班:
分组
100分以下
频数
6
12
14
10
6
2
(1)由以上统计数据填写下面的2×2列联表,并根据小概率值的独立性检验,能否计数成绩是否优秀与课改研究有关?
A班
B班
总计
优秀
不优秀
总计
(2)从A,B两班里成绩在100分以下的学生中任意选取2人,记X为2人中B班的人数,求X的分布列及数学期望.
附:,,
α
0.1
0.05
0.025
0.01
2.706
3.841
5.024
6.635
【答案】(1)列联表见解析,能;
(2)分布列见解析,.
【详解】(1)填写完整2×2列联表如表所示:
A班
B班
总计
优秀
22
32
54
不优秀
28
18
46
总计
50
50
100
,
所以根据小概率值的独立性检验,我们推断不成立,即认为成绩是否优秀与课改研究有关,此推断犯错误的概率不大于0.05;
(2)由(1)可知:
A,B两班里成绩在100分以下的学生中,A班有4人,B班有2人,
所以X的所有可能取值为0,1,2,
则,,,
则随机变量X的分布为
X
0
1
2
P
数学期望.
4.(2022·全国·模拟预测)从《唐宫夜宴》火爆破圈开始,河南电视台推出的“中国节日”系列节目被年轻人列入必看节目之一.从某平台“中国节日”系列节目的粉丝与游客(未注册的访客)中各随机抽取200人,统计他们的年龄(单位:岁,年龄都在内),并按照,,,,分组,得到粉丝年龄频率分布直方图及游客年龄频数分布表如下所示.
年龄/岁
频数
10
60
50
45
35
(1)估计粉丝年龄的平均数及游客年龄的中位数(同一组中的数据用该组区间的中点值为代表);
(2)以频率估计概率,从该平台“中国节日”系列节目的所有粉丝与游客中各随机抽取2人,记这4人中年龄在内的人数为,求的分布列与期望.
【答案】(1),
(2)分布列见解析,数学期望
【详解】(1)由粉丝年龄频率分布直方图知,
由游客年龄频数分布表知,
所以,解得.
(2)从该平台“中国节日”系列节目的所有粉丝中随机抽取1人,该粉丝年龄在内的概率为,
从该平台“中国节日”系列节目的所有游客中随机抽取1人,该游客年龄在内的概率为,
由题可得的所有可能取值为0,1,2,3,4,
且,
,
,
,
,
所以的分布列为
0
1
2
3
4
.
5.(2022·河南新乡·统考一模)乒乓球被称为中国的“国球”.甲、乙两位乒乓球爱好者决定进行一场友谊赛,制定如下比赛规则:比赛分两天进行,每天实行三局两胜制,即先赢两局者获得该天的胜利.若两天比赛中一方连续胜利,则该方获得胜利;若两天比赛中双方各胜一天,则第三天加赛一局,一局定胜负.设每局比赛甲获胜的概率为,各局比赛相互独立,没有平局.
(1)当时,求第一天比赛甲获胜的概率;
(2)记比赛结束时的总局数为,当时,求随机变量的分布列和数学期望.
【答案】(1);
(2)分布列见解析,数学期望为.
【详解】(1)第一天比赛甲可能以或获胜,
因为,,
所以第一天甲获胜的概率;
(2)因为,
所以第一天和第二天甲以获胜的概率为,此时乙以负,
第一天和第二天甲以获胜的概率为,此时乙以负,
即第一天和第二天甲、乙各自以和获胜的概率都是,
同样以和负的概率都是,
所以的所有可能取值为4,5,6,7,
,
,
,
,
所以随机变量Y的分布列为
4
5
6
7
所以.
6.(2022·湖南·模拟预测)某学校在50年校庆到来之际,举行了一次趣味运动项目比赛,比赛由传统运动项目和新增运动项目组成,每位参赛运动员共需要完成3个运动项目.对于每一个传统运动项目,若没有完成,得0分,若完成了,得30分.对于新增运动项目,若没有完成,得0分,若只完成了1个,得40分,若完成了2个,得90分.最后得分越多者,获得的资金越多.现有两种参赛的方案供运动员选择.方案一:只参加3个传统运动项目.方案二:先参加1个传统运动项目,再参加2个新增运动项目.已知甲、乙两位运动员能完成每个传统项目的概率为,能完成每个新增运动项目的概率均为,且甲、乙参加的每个运动项目是否能完成相互独立.
(1)若运动员甲选择方案一,求甲得分不低于60分的概率.
(2)若以最后得分的数学期望为依据,请问运动员乙应该选择方案一还是方案二?说明你的理由.
【答案】(1)
(2)运动员乙应该选择方案一;理由见解析
【详解】(1)运动员甲选择方案一,若甲得分不低于60分,则甲至少要完成2项传统运动项目,故甲得分不低于60分的概率.
(2)若乙选择方案一,则乙完成的运动项目的个数,
所以乙最后得分的数学期望为.
若乙选择方案二,则乙得分Y的可能为取值为0,30,40,70,90,120,
,
,
,
,
,
.
所以Y的数学期,
因为,所以运动员乙应该选择方案一.
7.(2022·河南·马店第一高级中学校联考模拟预测)在高考结束后,程浩同学回初中母校看望数学老师,顺便帮老师整理初三年级学生期中考试的数学成绩,并进行统计分析,在整个年级中随机抽取了200名学生的数学成绩,将成绩分为,,,,,,共6组,得到如图所示的频率分布直方图,记分数不低于90分为优秀.
(1)从样本中随机选取一名学生,已知这名学生的分数不低于70分,问这名学生数学成绩为优秀的概率;
(2)在样本中,采取分层抽样的方法从成绩在内的学生中抽取13名,再从这13名学生中随机抽取3名,记这3名学生中成绩为优秀的人数为X,求X的分布列与数学期望.
【答案】(1)
(2)分布列见解析;
【详解】(1)依题意,得,解得,
则不低于70分的人数为,
成绩在内的,即优秀的人数为;
故这名学生成绩是优秀的概率为;
(2)成绩在内的有(人);
成绩在内的有(人);成绩在内的有人;
故采用分层抽样抽取的13名学生中,成绩在内的有6人,在内的有5人,在内的有2人,
所以由题可知,X的可能取值为0,1,2,
则,,,
所以X的分布列为:
X
0
1
2
P
故.
8.(2022·陕西西安·西安中学校考模拟预测)2022年北京冬奥会后,由一名高山滑雪运动员甲组成的专业队,与两名高山滑雪爱好者乙、丙组成的业余队进行友谊赛.约定赛制如下:业余队中的两名队员轮流与甲进行比赛,若甲连续赢两场则专业队获胜;若甲连续输两场则业余队获胜:若比赛三场还没有决出胜负,则视为平局,比赛结束.已知各场比赛相互独立,每场比赛都分出胜负,且甲与乙比赛,乙赢概率为;甲与丙比赛,丙赢的概率为p,其中.
(1)若第一场比赛,业余队可以安排乙与甲进行比赛,也可以安排丙与甲进行比赛.请分别计算两种安排下业余队获胜的概率;若以获胜概率大为最优决策,问:业余队第一场应该安排乙还是丙与甲进行比赛?
(2)为了激励专业队和业余队,赛事组织规定:比赛结束时,胜队获奖金3万元,负队获奖金1.5万元;若平局,两队各获奖金1.8万元.在比赛前,已知业余队采用了(1)中的最优决策与甲进行比赛,设赛事组织预备支付的奖金金额共计X万元,求X的数学期望的取值范围.
【答案】(1)业余队第一场应该安排乙与甲进行比赛
(2)的取值范围为:(单位:万元).
【详解】(1)第一场比赛,业余队安排乙与甲进行比赛,业余队获胜的概率为:
;
第一场比赛,业余队安排丙与甲进行比赛,业余队获胜的概率为:
,
因为,所以,所以.
所以,业余队第一场应该安排乙与甲进行比赛.
(2)由已知万元或万元.
由(1)知,业余队最优决策是第一场应该安排乙与甲进行比赛.
此时,业余队获胜的概率为,
专业队获胜的概率为,
所以,非平局的概率为,
平局的概率为.
的分布列为:
的数学期望为(万元)
而,所以的取值范围为:(单位:万元).
9.(2022·全国·模拟预测)某校开展了“学党史”知识竞赛活动,竞赛试题由若干选择题和填空题两种题型构成,每位选手共需要回答三个问题.对于每一个问题,若回答错误得0分;若回答正确,填空题得30分,选择题得20分.现设置了两种活动方案供选手选择.方案一:只回答填空题;方案二:先回答填空题,后续选题按如下规则:若上一题回答正确,则下一次选择填空题;若上题回答错误,则下一次选择选择题.已知甲、乙两位同学能正确回答填空题的概率均为,能正确回答选择题的概率均为,且能正确回答问题的概率与回答次序无关.
(1)若甲同学采用方案一答题,求甲得分不低于60分的概率;
(2)乙同学应该选择何种方案参加比赛更加有利?并说明理由.
【答案】(1);
(2)乙同学选择方案二参加比赛更加有利,理由见解析.
(1)
甲同学采用方案一答题,得分不低于60分的情况为至少答对两道填空题,
∴其概率;
(2)
乙同学选择方案二参加比赛更加有利,理由如下:
若采用方案一,则其得分X的可能取值为0,30,60,90,
∴;;
;,
∴X的分布列为
X
0
30
60
90
P
∴X的数学期望;
若采用方案二,则其得分Y的可能为取值为0,20,30,50,60,90,
∴;;
;;
;,
∴Y的分布列为
Y
0
20
30
50
60
90
P
∴Y的数学期望,
∵,
∴乙同学选择方案二参加比赛更加有利.
10.(2022·四川成都·成都七中校考模拟预测)某企业研发了一种新药,为评估药物对目标适应症患者的治疗作用和安全性,需要开展临床用药试验,检测显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.随机征集了一部分志愿者作为样本参加临床用药试验,并得到了一组数据,,其中表示连续用药i天,表示相应的临床疗效评价指标A的数值.根据临床经验,刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.经计算得到如下一些统计量的值:,,,,,其中.
(1)试判断与哪一个适宜作为y关于x的回归方程类型?并建立y关于x的回归方程;
(2)新药经过临床试验后,企业决定通过两条不同的生产线每天8小时批量生产该商品,其中第1条生产线的生产效率是第2条生产线的两倍.若第1条生产线出现不合格药品的概率为0.012,第2条生产线出现不合格药品约概率为0.009,两条生产线是否出现不合格药品相互独立.
(i)随机抽取一件该企业生产的药品,求该药品不合格的概率;
(ii)若在抽查中发现不合格药品,求该药品来自第1条生产线的概率.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1)适宜,
(2)(i);(ii)
(1)
刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓,故适宜作为y关于x的回归方程类型.
令,得,于是,
因为,,所以,,
所以,,即;
(2)
(i)设“随机抽取一件该企业生产的药品为不合格”,
“随机抽取一件药品为第1条生生产线生产”,
“随机抽取一件药品为第2条生生产线生产”,
则,,
又,,于是
.
(ii).
11.(2022·辽宁大连·育明高中校考一模)2020年12月16日至18日,中央经济工作会议在北京召开,会议确定,2021年要抓好八个重点任务,其中第五点就是:保障粮食安全,关键在于落实藏粮于地、藏粮于技战略.要加强种质资源保护和利用,加强种子库建设.要尊重科学、严格监管,有序推进生物育种产业化应用.某“种子银行”对某种珍稀名贵植物种子采取“活态保存”方法进行保存,即对种子实行定期更换和种植.通过以往的相关数据表明,该植物种子的出芽率为,每颗种子是否发芽相互独立.现任取该植物种子颗进行种植,若种子的出芽数超过半数,则可认为种植成功().
(1)当,时,求种植成功的概率及的数学期望;
(2)现拟加种两颗该植物种子,试分析能否提高种植成功率?
【答案】(1)概率为,;(2)答案见解析.
【详解】(1)由题意可知,服从二项分布,
故,
故种植成功的概率为,
;
(2)设种植颗种子时,种植成功的概率为,
拟加种两颗该植物种子时,种植成功的概率为,
当种植颗种子时,考虑前颗种子出芽数,
为了种植成功,前颗种子中至少要有颗种子出芽,
①前颗种子中恰有颗出芽,它的概率为,
此时后两颗种子必须都要出芽,
所以这种情况下种植成功的概率为;
②前颗种子恰有颗出芽,它的概率为,
此时后两颗种子至少有一颗出芽即可,
所以这种情况下种植成功的概率为;
③前颗种子至少有颗出芽,
它的概率为,此时种植一定成功.
所以,
故,
,
因为,
所以,
所以当时,,种植成功率会降低;
当时,,种植成功率不变;
当时,,种植成功率会提高.
12.(2022·湖北·荆门市龙泉中学校联考二模)高尔顿板是英国生物统计学家高尔顿设计用来研究随机现象的模型,在一块木板上钉着若干排相互平行但相互错开的圆柱形小木块,小木块之间留有适当的空隙作为通道,前面挡有一块玻璃,让一个小球从高尔顿板上方的通道口落下,小球在下落的过程中与层层小木块碰撞,且等可能向左或向右滚下,最后掉入高尔顿板下方的某一球槽内.如图1所示的高尔顿板有7层小木块,小球从通道口落下,第一次与第2层中间的小木块碰撞,以的概率向左或向右滚下,依次经过6次与小木块碰撞,最后掉入编号为1,2,…,7的球槽内.例如小球要掉入3号球槽,则在6次碰撞中有2次向右4次向左滚下.
(1)如图1,进行一次高尔顿板试验,求小球落入5号球槽的概率;
(2)小红、小明同学在研究了高尔顿板后,利用高尔顿板来到社团文化节上进行盈利性“抽奖”活动.小红使用图1所示的高尔顿板,付费6元可以玩一次游戏,小球掉入m号球槽得到的奖金为元,其中.小明改进了高尔顿板(如图2),首先将小木块减少成5层,然后使小球在下落的过程中与小木块碰撞时,有的概率向左,的概率向右滚下,最后掉入编号为1,2,……,5的球槽内,改进高尔顿板后只需付费4元就可以玩一次游戏,小球掉入n号球槽得到的奖金为元,其中.两位同学的高尔顿板游戏火爆进行,很多同学参加了游戏,你觉得小红和小明同学谁的盈利多?请说明理由.
【答案】(1);(2)小明的盈利多,理由见解析.
【详解】(1)设这个小球掉入5号球槽为事件,掉入5号球槽,需要向右4次向左2次,所以,
所以这个小球掉入5号球槽的概率为.
(2)小红的收益计算如下:每一次游戏中,的可能取值为0,4,8,12.
,
,
,
.
0
4
8
12
一次游戏付出的奖金,则小红的收益为.
小明的收益计算如下:每一次游戏中,的可能取值为0,1,4,9.
,
,
,
.
0
1
4
9
一次游戏付出的奖金,则小明的收益为.
显然,,所以小明的盈利多.
13.(2022·湖北黄石·校考模拟预测)第13届女排世界杯于2019年9月14日在日本举行,共有12支参赛队伍.本次比赛启用了新的排球用球MIKSA-V200W ,已知这种球的质量指标ξ (单位:g )服从正态分布N (270, ).比赛赛制采取单循环方式,即每支球队进行11场比赛(采取5局3胜制),最后靠积分选出最后冠军积分规则如下:比赛中以3:0或3:1取胜的球队积3分,负队积0分;而在比赛中以3:2取胜的球队积2分,负队积1分.已知第10轮中国队对抗塞尔维亚队,设每局比赛中国队取胜的概率为p(0 (1)如果比赛准备了1000个排球,估计质量指标在(260,265]内的排球个数(计算结果取整数).
(2)第10轮比赛中,记中国队3:1取胜的概率为.
(i)求出f(p)的最大值点;
(ii)若以作为p的值记第10轮比赛中,中国队所得积分为X,求X的分布列.
参考数据:ζ ~N(u,),则p(μ-σ
【详解】(1)因为ξ服从正态分布N (270, ),所以,
所以质量指标在(260,265]内的排球个数为个;
(2)(i),
令,得,
当时,, 在上单调递增;
当时,, 在上单调递减;
所以的最大值点;
(ii)的可能取值为0,1,2,3.
; ;
; ;
所以的分布列为
0
1
2
3
P
14.(2022·安徽芜湖·安徽师范大学附属中学校考模拟预测)随着智能手机的普及,手机计步软件迅速流行开来,这类软件能自动记载每个人每日健步的步数,从而为科学健身提供一定的帮助.某市工会为了解该市市民每日健步走的情况,从本市市民中随机抽取了2000名市民(其中不超过40岁的市民恰好有1000名),利用手机计步软件统计了他们某天健步的步数,并将样本数据分为,,,,,,,,九组(单位:千步),将抽取的不超过40岁的市民的样本数据绘制成频率分布直方图如右,将40岁以上的市民的样本数据绘制成频数分布表如下,并利用该样本的频率分布估计总体的概率分布.
分组
(单位:千步)
频数
10
20
20
30
400
200
200
100
20
(1)现规定,日健步步数不低于13000步的为“健步达人”,填写下面列联表,并根据列联表判断能否有%的把握认为是否为“健步达人”与年龄有关;
健步达人
非健步达人
总计
40岁以上的市民
不超过40岁的市民
总计
(2)(ⅰ)利用样本平均数和中位数估计该市不超过40岁的市民日健步步数(单位:千步)的平均数和中位数;
(ⅱ)由频率分布直方图可以认为,不超过40岁的市民日健步步数(单位:千步)近似地服从正态分布,其中近似为样本平均数(每组数据取区间的中点值),的值已求出约为.现从该市不超过40岁的市民中随机抽取5人,记其中日健步步数位于的人数为,求的数学期望.
参考公式:,其中.
参考数据:
若,则,.
【答案】(1)填表见解析;有%的把握认为是否为“健步达人”与年龄有关(2)(ⅰ)平均数为,中位数为(ⅱ)
【详解】(1)列联表为
健步达人
非健步达人
总计
40岁以上的市民
520
480
1000
不超过40岁的市民
400
600
1000
总计
920
1080
2000
,
所以有%的把握认为是否为“健步达人”与年龄有关.
(2)(ⅰ)样本平均数为
由前4组的频率之和为,
前5组的频率之和为,
知样本中位数落在第5组,设样本中位数为,则,∴.
故可以估计:该市不超过40岁的市民日健步步数的平均数为,中位数为.
(ⅱ),
而
,
∴,
∴的数学期望为.
新高考数学二轮复习考点归纳与演练专题10-1 概率统计(选填)(含解析): 这是一份新高考数学二轮复习考点归纳与演练专题10-1 概率统计(选填)(含解析),共62页。
新高考数学二轮复习考点归纳与演练专题3-10 导数与数列,导数与概率统计(含解析): 这是一份新高考数学二轮复习考点归纳与演练专题3-10 导数与数列,导数与概率统计(含解析),共36页。
新高考数学二轮复习考点归纳与演练专题3-4 构造函数解不等式(选填)(含解析): 这是一份新高考数学二轮复习考点归纳与演练专题3-4 构造函数解不等式(选填)(含解析),共42页。