(新高考)高考数学一轮复习课件第10章§10.9《概率与统计的综合问题》(含解析)
展开频率分布直方图与分布列的综合问题
例1 (2022·湖北九师联盟模拟)某校高三年级举行了高校强基计划模拟考试(满分100分),将不低于50分的考生的成绩分为5组,即[50,60),[60,70),[70,80),[80,90),[90,100],并绘制频率分布直方图如图所示,其中在[90,100]内的人数为3.
(1)求a的值,并估计不低于50分考生的平均成绩(同一组中的数据用该组区间的中点值代替);
由题意,得(0.005+0.01+0.015+a+0.045)×10=1,解得a=0.025,不低于50分考生的平均成绩估计为55×0.1+65×0.25+75×0.45+85×0.15+95×0.05=73(分).
(2)现把[50,60)和[90,100]内的所有学生的考号贴在质地、形状和大小均相同的小球上,并放在盒子内,现从盒中随机抽取2个小球,若取出的两人成绩差不小于30,则称这两人为“黄金搭档组”.现随机抽取4次,每次
取出2个小球,记下考号后再放回盒内,记取出“黄金搭档组”的次数为X,求X的分布列和均值E(X).
在[90,100]上的频率为0.005×10=0.05,由条件得总人数为 =60,所以在[50,60]内的人数为60×0.1=6,每次抽取出‘黄金搭档组”的概率
P= ,
(2022·湛江模拟)某高三学生小明准备利用暑假的7月和8月勤工俭学,现有“送外卖员”和“销售员”两份工作可供其选择.已知“销售员”工作每日底薪为50元,每日销售的前5件每件奖励20元,超过5件的部分每件奖励30元.小明通过调查,统计了100名销售员1天的销售记录,其柱状图如图1;“送外卖员”没有底薪,收入与送的单数相关,在一日内:1至20单(含20单)每送一单3元,超过20单且不超过40单的部分每送一单4元,超过40单的部分,每送一单4.5元.小明通过随机调查,统计了100名送外卖员的日送单数,并绘制成如下频率分布直方图(如图2).
(1)分别求出“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式、“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式;
“销售员”的日薪y1(单位:元)与销售件数x1的函数关系式为
“送外卖员”的日薪y2(单位:元)与所送单数x2的函数关系式为
(2)若将频率视为概率,根据统计图,试分别估计“销售员”的日薪X1和“送外卖员”的日薪X2(同一组中的数据用该组区间的中点值代表)的均值,分析选择哪种工作比较合适,并说明你的理由.
由柱状图知,日平均销售量满足如下表格:
所以E(X1)=110×0.05+130×0.2+150×0.25+180×0.4+210×0.1=162(元).
由频率分布直方图可知,日送单数满足如下表格:
所以E(X2)=30×0.05+100×0.25+185×0.45+275×0.2+365×0.05=183(元).由以上计算得E(X2)>E(X1),做“送外卖员”挣的更多,故小明选择做“送外卖员”的工作比较合适.
高考常将频率分布直方图与分布列等交汇在一起进行考查,因此在解答此类题时,准确的把题中所涉及的事件进行分解,明确所求问题所属的事件类型是关键.
跟踪训练1 (2022·太原模拟)国家发改委、住建部发布了《生活垃圾分类制度实施方案》规定46个城市实施生活垃圾强制分类,垃圾回收利用率要达35%以上.某市在实施垃圾分类之前,对该市大型社区(即人口数量在1万左右)一天产生的垃圾量(单位:吨)进行了调查.已知该市这样的大型社区有200个,如图是某天从中随机抽取50个社区所产生的垃圾量绘制的频
率分布直方图.现将垃圾量超过14吨/天的社区称为“超标”社区.(1)根据上述资料,估计当天这50个社区垃圾量的平均值 (四舍五入精确到整数);
由频率分布直方图得该样本中垃圾量为[4,6),[6,8),[8,10),[10,12),[12,14),[14,16),[16,18]的频率分别为0.08,0.10,0.20,0.24,0.18,0.12,0.08,
=5×0.08+7×0.10+9×0.20+11×0.24+13×0.18+15×0.12+17×0.08=11.04≈11,∴当天这50个社区垃圾量的平均值为11吨.
(2)若当天该市这类大型社区的垃圾量X~N(μ,9),其中μ近似为(1)中的样本平均值 ,请根据X的分布估计这200个社区中“超标”社区的个数(四舍五入精确到整数);
由(1)知μ=11,∵σ2=9,∴σ=3,∴P(X>14)=P(X>μ+σ)
= =0.158 65,∴这200个社区中“超标”社区的个数为200×0.158 65≈32.
(3)市环保部门决定对样本中“超标”社区的垃圾来源进行调查,现从这些社区中随机抽取3个进行重点监控,设Y为其中当天垃圾量至少为16吨的社区个数,求Y的分布列与均值.附:P(μ-σ≤X≤μ+σ)≈0.682 7;P(μ-2σ≤X≤μ+2σ)≈0.954 5;P(μ-3σ≤X≤μ+3σ)≈0.997 3.
由(1)得样本中当天垃圾量为[14,16)的社区有50×0.12=6(个),垃圾量为[16,18)的社区有50×0.08=4(个),∴Y的所有可能取值为0,1,2,3,
回归模型与分布列的综合问题
例2 学习于才干信仰,犹如运动于健康体魄,持之以恒、行之愈远愈受益.为了顺利实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某市教育局为了解全市教职工在“学习强国”中每天学习得分情况,从全市教职工中随机抽取1 000名教职工,得到他们平均每天的学习
得分,得分都在[15,50]内,将他们的得分分为七组:[15,20),[20,25),[25,30),[30,35),[35,40),[40,45),[45,50]后得到频率分布直方图如图所示.
(1)从样本中得分不低于40的教职工中用分层随机抽样的方法抽取12人,然后从这12人中随机抽取3人进行学习体会交流,用X表示参加学习体会交流且得分不低于45分的人数,求X的分布列和均值;
在抽取的1 000名教职工中得分在[40,45)的有0.016×5×1 000=80(人),得分在[45,50]的有0.008×5×1 000=40(人),所以在得分为[40,45)的人中应抽取
×12=8(人),在得分为[45,50]的人中应抽取12-8=4(人).由题可得X的所有可能取值为0,1,2,3,
(2)某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表:
由表中数据可知该老师每天一次最多答对题数y与第x天之间可用线性模型拟合,请用样本相关系数加以说明,并求出y关于x的经验回归方程.
则y关于x的样本相关系数
因为0.99与1非常接近,所以y关于x有较强的线性相关关系,
设某幼苗从观察之日起,第x天的高度为y(cm),测得的一些数据如下表所示:
作出这组数据的散点图发现:y(cm)与x(天)之间近似满足关系式y= +a,其中a,b均为大于0的常数.(1)试借助一元线性回归模型,根据所给数据,用最小二乘法对a,b 作出估计,并求出y关于x的经验回归方程;
(2)在作出的这组数据的散点图中,甲同学随机圈取了其中的3个点,记这3个点中幼苗的高度大于 的点的个数为ξ,其中 为表格中所给的幼苗高度的平均数,试求随机变量ξ的分布列和均值.
7天中幼苗高度大于 =8的有4天,小于等于8的有3天,从散点图中任取3个点,即从这7天中任取3天,所以这3个点中幼苗的高度大于 的点的个数ξ的所有可能取值为0,1,2,3,
所以随机变量ξ的分布列为
高考常将回归模型与分布列等交汇在一起进行考查,求解时注意概率模型的应用,明确所求问题所属的事件类型是关键.
跟踪训练2 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.(1)赛前小明在某数独APP上进行了一段时间的训练,每天解题的平均速度y(秒/题)与训练天数x(天)有关,经统计得到如下数据:
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定先胜3局者赢得比赛.若小明每局获胜的概率为 ,且各局之间相互独立,设比赛X局后结束,求随机变量X的分布列及均值.
随机变量X的所有可能取值为3,4,5,
所以随机变量X的分布列为
独立性检验与分布列的综合问题
例3 (2022·苏州模拟)为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如下频率分布直方图:
(1)将使用寿命超过2 500小时和不超过2 500小时的台数填入下面的列联表:
根据上面的列联表,依据小概率值α=0.01的独立性检验,能否认为使用寿命是否超过2 500小时与型号有关?
由频率分布直方图可知,A型超过2 500小时的有100×(0.000 6+0.000 5+0.000 3)×500=70(台),则A型不超过2 500小时的有30台,同理,B型超过2 500小时的有100×(0.000 6+0.000 3+0.000 1)×500=50(台),则B型不超过2 500小时的有50台.
零假设为H0:使用寿命是否超过2 500小时与型号无关,根据列联表中的数据,经计算得到
≈8.333>6.635= ,所以依据小概率值α=0.01的独立性检验,我们推断H0不成立,即认为使用寿命是否超过2 500小时与型号有关.
(2)用分层随机抽样的方法从不超过2 500小时的A型和B型设备中抽取8台,再从这8台设备中随机抽取3台,其中A型设备为X台,求X的分布列和均值;
由(1)和分层随机抽样的定义可知A型设备有3台,B型设备有5台,所以X的所有可能取值为0,1,2,3,
(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作 2 500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.
由频率分布直方图中的频率估计概率知:A型设备每台更换的概率为0.3,所以10台A型设备估计要更换3台;B型设备每台更换的概率为0.5,所以10台B型设备估计要更换5台,选择A型设备的总费用y1=(10+3)×1+10×2×0.75×2 500×10-4=16.75 (万元),选择B型设备的总费用y2=(10+5)×0.6+10×6×0.75×2 500×10-4=20.25 (万元),y1
在相关政策扶持下,确保每件该医疗用品的合格品都有对口销售渠道,但按照国家对该医疗用品产品质量的要求,所有的次品必须由厂家自行销毁.(1)请根据所提供的数据,完成下面的2×2列联表(表二),依据小概率值α=0.001的独立性检验,能否认为产品的合格率与技术升级有关?
根据所提供的数据,可得2×2列联表:
零假设为H0:产品的合格率与技术升级无关,根据列联表中的数据,经计算得到
≈20.571>10.828=x0.001,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为产品的合格率与技术升级有关.
(2)在抽检的所有次品中,按甲、乙生产线生产的次品比例进行分层随机抽样抽取10件该医疗用品,然后从这10件中随机抽取5件,记其中属于甲生产线生产的有X件,求X的分布列和均值;
由于所有次品中,甲、乙生产线生产的次品比例为4∶1,故抽取的10件中有8件甲生产线的,2件乙生产线的,从中随机抽取5件中属于甲生产线的数量X的所有可能取值为3,4,5,
(3)每件该医疗用品的生产成本为20元,A,B等级产品的出厂单价分别为m元、40元.若甲生产线抽检的该医疗用品中有70件为A等级,用样本的频率估计概率,若进行技术升级后,平均生产一件该医疗用品比技术升级前多盈利不超过9元,则A等级产品的出厂单价最高为多少元?
甲生产线抽检的产品中有70件A等级,90件B等级,40件C等级;乙生产线抽检的产品中有130件A等级,60件B等级,10件C等级,因为用样本的频率估计概率,所以对于甲生产线,单件产品的利润
对于乙生产线,单件产品的利润
所以m≤50.即A等级产品的出厂单价最高为50元.
高考常将独立性检验与分布列等交汇在一起进行考查,由频率分布直方图解决相关问题,解题的关键是正确理解频率分布直方图,能利用频率分布直方图正确计算出各组数据.
跟踪训练3 (2022·邯郸模拟)暑假期间,学生居家生活和学习,教育部门特别强调,身体健康与学习成绩同样重要.某校对300名学生的锻炼时间进行调查,数据如表:
将学生日均锻炼的时间在[40,60]的学生评价为“体育合格”.
(1)请根据上述表格中的统计数据填写下面2×2列联表,依据小概率值α=0.001的独立性检验,能否认为“体育合格”与性别无关?
零假设为H0:“体育合格”与性别无关,根据列联表中的数据,经计算得到
≈9.184<10.828=x0.001,
所以依据小概率值α=0.001的独立性检验,没有充分的证据推断H0不成立,即认为“体育合格”与性别无关.
(2)从上述体育合格的学生中,按性别用分层随机抽样的方法抽取9名学生,再从这9名学生中随机抽取3人了解他们锻炼时间较多的原因,记所抽取的3人中男生的人数为随机变量X,求X的分布列和均值.
易知,所抽取的9名学生中,
X的所有可能取值为0,1,2,3,
KESHIJINGLIAN
建立y关于x的经验回归方程(系数精确到0.01),若不调控,依据相关关系预测12月份玉米的销售均价;
1.(2022·日照模拟)近年来,随着猪肉价格的上涨,作为饲料原材料之一的玉米,价格也出现了波动.为保证玉米销售市场稳定,相关部门某年9月份开始采取宏观调控措施.该部门调查研究发现,这一年某地各月份玉米的销售均价(元/斤)走势如图所示:
(1)该部门发现,3月到7月,各月玉米销售均价y(元/斤)与月份x之间具有较强的线性相关关系,试
∴从3月到7月,y关于x的经验回归方程为 =0.06x+0.75,当x=12时,代入经验回归方程得y=1.47,即可预测12月份玉米销售均价为1.47元/斤.
(2)该部门在这一年的12个月份中,随机抽取3个月份的数据作样本分析,若关注所抽三个月份的所属季度,记不同季度的个数为X,求X的分布列和均值.
X的所有可能取值为1,2,3,
2.(2022·沈阳模拟)第24届冬奥会于2022年在北京市和张家口市联合举行,冬奥会志愿者的服务工作是成功举办的重要保障.在冬奥会的志愿者选拔工作中,某高校承办了冬奥会志愿者选拔的面试工作,面试成绩满分100分,现随机抽取了80名候选者的面试成绩分五组,第一组[45,55),第二组[55,65),第三组
[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知图中从左到右前三个组的频率成等差数列,第一组和第五组的频率相同.
(1)求a,b的值,并估计这80名候选者面试成绩的平均值(同一组中的数据用该组区间的中点值作代表)和中位数(中位数精确到0.1);
由题意可知20b=10a+0.45,(2a+b+0.065)×10=1,解得a=0.005,b=0.025,所以平均值为50×0.05+60×0.25+70×0.45+80×0.2+90×0.05=69.5,
(2)已知抽取的80名候选人中,男生和女生各40人,男生希望参加张家口赛区志愿服务的有10人,女生希望参加张家口赛区志愿服务的有20人,补全下面2×2列联表,依据小概率值α=0.05的独立性检验,能否认为参加张家口赛区志愿者服务的候选人与性别有关?
零假设为H0:参加张家口赛区志愿者服务的候选人与性别无关,根
据列联表中的数据,经计算得到χ2=≈5.333>3.841=x0.05,所以依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为参加张家口赛区志愿者服务的候选人与性别有关.
(3)冰球项目的场地服务需要5名志愿者,有4名男生和3名女生通过该项志愿服务的选拔,需要通过抽签的方式决定最终的人选,现将5张写有“中签”和2张写有“未中签”字样的字条随机分配给每一位候选人,记男生中签的人数为X,求X的分布列及均值E(X).
X的所有可能取值为2,3,4,
由频率分布直方图可得 =55×0.1+65×0.2+75×0.45+85×0.2+95×0.05=74.
3.(2022·南京模拟)某乒乓球教练为了解某同学近期的训练效果,随机记录了该同学40局接球训练成绩,每局训练时教练连续发100个球,该同学每接球成功得1分,否则不得分,且每局训练结果相互独立,得到如图所示的频率分布直方图.(1)同一组数据用该组区间的中点值作代表,①求该同学40局接球训练成绩的样本平均数 ;
②若该同学的接球训练成绩X近似地服从正态分布N(μ,100),其中μ近似为样本平均数 ,求P(54≤X≤64)的值;参考数据:若随机变量ξ~N(μ,σ2),则P(μ-σ≤ξ≤μ+σ)≈0.682 7,P(μ-2σ≤ξ≤μ+2σ)≈0.954 5,P(μ-3σ≤ξ≤μ+3σ)≈0.997 3.
由题意可知μ=74,σ=10,则54=μ-2σ,64=μ-σ,所以P(54≤X≤64)=P(μ-2σ≤X≤μ-σ)
(2)为了提高该同学的训练兴趣,教练与他进行比赛.一局比赛中教练连续发100个球,该同学得分达到80分为获胜,否则教练获胜.若有人获胜达3局,则比赛结束,记比赛的局数为Y.以频率分布直方图中该同学获胜的频率作为概率,求均值E(Y).
由频率分布直方图可知,在一局中,该同学得分达到80分的概率为(0.02+0.005)×10= ,由题意可知,随机变量Y的所有可能取值为3,4,5,
所以随机变量Y的分布列为
4.(2022·福州模拟)某种病菌在某地区人群中的带菌率为10%,目前临床医学研究中已有费用昂贵但能准确检测出个体是否带菌的方法.现引进操作易、成本低的新型检测方法:每次只需检测x,y两项指标,若指标x的值大于4且指标y的值大于100,则检验结果呈阳性,否则呈阴性.为考查该检测方法的准确度,随机抽取50位带菌者(用“*”表示)和50位不带菌者(用“+”表示)各做1次检测,他们检测后的数据,制成如右统计图:
(1)从这100名被检测者中,随机抽取一名不带菌者,求检测结果呈阳性的概率;
方法一 设A=“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”,根据统计图可知在不带菌者中,检测结果呈阳性的有5人,所以P(A)= .
方法二 设A=“从这100名被检测者中,随机抽取一名为不带菌者”,D=“从这100名被检测者中,随机抽取一名检测结果呈阳性”,
则“从这100名被检测者中,随机抽取一名不带菌者,检测结果呈阳性”的概率就是“在事件A发生的条件下,事件D发生”的概率,记为P(D|A).
(2)依据小概率值α=0.001的独立性检验,能否认为“带菌”与“检测结果呈阳性”有关?
零假设为H0:“带菌”与“检测结果呈阳性”无关,可作出2×2列联表如下:
根据列联表中的数据,经计算得到
所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为“带菌”与“检测结果呈阳性”有关.
新高考数学一轮复习讲练课件10.6 概率与统计的综合问题(含解析): 这是一份新高考数学一轮复习讲练课件10.6 概率与统计的综合问题(含解析),共31页。
新高考数学一轮复习讲练测课件第10章§10.8概率与统计的综合问题 (含解析): 这是一份新高考数学一轮复习讲练测课件第10章§10.8概率与统计的综合问题 (含解析),共60页。PPT课件主要包含了题型一,则ξ的分布列为,思维升华,题型二,所以X的分布列为,则X的分布列为,题型三,课时精练,基础保分练,∴X的分布列为等内容,欢迎下载使用。
2024年高考数学一轮复习(新高考版) 第10章 §10.8 概率与统计的综合问题课件PPT: 这是一份2024年高考数学一轮复习(新高考版) 第10章 §10.8 概率与统计的综合问题课件PPT,共60页。PPT课件主要包含了题型一,则ξ的分布列为,思维升华,题型二,所以X的分布列为,则X的分布列为,题型三,课时精练,基础保分练,∴X的分布列为等内容,欢迎下载使用。