所属成套资源:高考数学复习解答题提高第一轮专题复习(典型题型归类训练)(学生版+解析)
- 高考数学复习解答题提高第一轮专题复习专题03平面与平面所成角(二面角)(含探索性问题)(典型题型归类训练)(学生版+解析) 试卷 0 次下载
- 高考数学复习解答题提高第一轮专题复习专题03数列求通项(构造法、倒数法)(典型题型归类训练)(学生版+解析) 试卷 0 次下载
- 高考数学复习解答题提高第一轮专题复习专题04回归直线方程与非线性回归方程(典型题型归类训练)(学生版+解析) 试卷 0 次下载
- 高考数学复习解答题提高第一轮专题复习专题04圆锥曲线中的定点、定值、定直线问题(典型题型归类训练)(学生版+解析) 试卷 0 次下载
- 高考数学复习解答题提高第一轮专题复习专题04数列求通项(隔项等差(等比)数列)(典型题型归类训练)(学生版+解析) 试卷 0 次下载
高考数学复习解答题提高第一轮专题复习专题03正态分布(典型题型归类训练)(学生版+解析)
展开
这是一份高考数学复习解答题提高第一轮专题复习专题03正态分布(典型题型归类训练)(学生版+解析),共52页。试卷主要包含了必备秘籍,典型题型,专项训练等内容,欢迎下载使用。
一、必备秘籍
1、正态分布
若随机变量的概率分布密度函数为对任意的,,它的图象在轴的上方.可以证明轴和曲线之间的区域的面积为1.我们称为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.
若随机变量的概率分布密度函数为,则称随机变量服从正态分布(nrmal dis-tributin),记为.特别地,当时,称随机变量服从标准正态分布,即.
由的密度函数及图象可以发现,正态曲线有以下特点:
曲线在轴的上方,与轴不相交。
(2)曲线是单峰的,它关于直线对称.
(3)曲线在处达到峰值 (最高点)
(4)当无限增大时,曲线无限接近轴.
(5)轴与正态曲线所夹面积恒等于1 .
2、正态分布的原则
二、典型题型
题型一:正态密度函数
1.(2021·陕西宝鸡·统考三模)某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.
(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);
(2)假设该镇外出务工人员年收入服从正态分布,其分布密度函数为,其中为样本平均值.若的最大值为,求的值;
(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在和的人群愿意返乡创业的人数比例分别为和.从样本人群收入在的人中随机抽取3人进行调查,设为愿意返乡创业的人数,求随机变量的分布列和数学期望.
2.(2018·高二课时练习)正态总体当时的概率密度函数是
(1)证明是偶函数;
(2)求的最大值;
(3)利用指数函数的性质说明的增减性.
3.(2014·高二课时练习)已知某种零件的尺寸ξ(单位:mm)服从正态分布,其正态曲线在(0,80)上是增函数,在上是减函数,且.
(1)求概率密度函数;
(2)估计尺寸在72mm~88mm间的零件大约占总数的百分之几?
题型二:标准正态分布的应用
1.(2023·全国·高二课堂例题)某批待出口的水果罐头,每罐净重X(单位:g)服从正态分布,求:(参考数据:,)
(1)随机抽取1罐,其净重超过的概率;
(2)随机抽取1罐,其净重在与之间的概率.
2.(2022·河南开封·河南省兰考县第一高级中学校联考模拟预测)《山东省高考改革试点方案》规定:年高考总成绩由语文、数学、外语三门统考科目和思想政治、历史、地理、物理、化学、生物六门选考科目组成,将每门选考科目的考生原始成绩从高到低划分为、、、、、、、共8个等级,参照正态分布原则,确定各等级人数所占比例分别为、、、、、、、,选择科目成绩计入考生总成绩时,将至等级内的考生原始成绩,依照(、分别为正态分布的均值和标准差)分别转换到、、、、、、、八个分数区间,得到考生的等级成绩.如果山东省年某次学业水平模拟考试物理科目的原始成绩,.
(1)若规定等级、、、、、为合格,、为不合格,需要补考,估计这次学业水平模拟考试物理合格线的最低原始分是多少;
(2)现随机抽取了该省名参加此次物理学科学业水平测试的原始分,若这些学生的原始分相互独立,记为被抽到的原始分不低于分的学生人数,求的数学期望和方差.
附:当时,,.
3.(2022·四川成都·石室中学校考三模)2021年某地在全国志愿服务信息系统注册登记志愿者8万多人,2020年7月份以来,共完成1931个志愿服务项目,8900多名志愿者开展志愿服务活动累计超过150万小时,为了了解此地志愿者对志愿服务的认知和参与度,随机调查了500名志愿者每月的志愿服务时长(单位:小时),并绘制如图所示的频率分布直方图.
(1)估计这500名志愿者每月志愿服务时长的样本平均数和样本方差(同一组中的数据用该组数据区间的中间值代表);
(2)由直方图可以认为,目前该地志愿者每月服务时长X服从正态分布,其中近似为样本平均数,近似为样本方差.一般正态分布的概率都可以转化为标准正态分布的概率进行计算:若,令,则,且.
(i)利用直方图得到的正态分布,求;
(ii)从该地随机抽取20名志愿者,记Z表示这20名志愿者中每月志愿服务时长超过10小时的人数,求(结果精确到0.001),以及Z的数学期望(结果精确到0.01).
参考数据:,,,,.若,则,,.
4.(2021·广东深圳·统考二模)已知某高校共有10000名学生,其图书馆阅览室共有994个座位,假设学生是否去自习是相互独立的,且每个学生在每天的晚自习时间去阅览室自习的概率均为0.1.
(1)将每天的晚自习时间去阅览室自习的学生人数记为,求的期望和方差;
(2)18世纪30年代,数学家棣莫弗发现,当比较大时,二项分布可视为正态分布.此外,如果随机变量,令,则.当时,对于任意实数,记.已知下表为标准正态分布表(节选),该表用于查询标准正态分布对应的概率值.例如当时,由于,则先在表的最左列找到数字0.1(位于第三行),然后在表的最上行找到数字0.06(位于第八列),则表中位于第三行第八列的数字0.5636便是的值.
①求在晚自习时间阅览室座位不够用的概率;
②若要使在晚自习时间阅览室座位够用的概率高于0.7,则至少需要添加多少个座位?
题型三:正态分布的实际应用
1.(2024上·湖南衡阳·高三统考期末)已知某超市销售的袋装食用盐的质量(单位:)服从正态分布,且0.15.某次该超市称量了120袋食用盐,其总质量为的值恰好等于这120袋食用盐每袋的平均质量(单位:).
(1)若从该超市销售的袋装食用盐中随机选取2袋,设这2袋中质量不小于的袋数为,求的分布列;
(2)若从该超市销售的袋装食用盐中随机选取(为正整数)袋,记质量在的袋数为,求满足的的最大值.
2.(2024上·海南省直辖县级单位·高三校考阶段练习)红松树分布在我国东北的小兴安岭到长白山一带,耐荫性强.在一森林公园内种有一大批红松树,为了研究生长了4年的红松树的生长状况,从中随机选取了12棵生长了4年的红松树,并测量了它们的树干直径(单位:厘米),如下表:
计算得:.
(1)求这12棵红松树的树干直径的样本均值与样本方差.
(2)假设生长了4年的红松树的树干直径近似服从正态分布.
记事件:在森林公园内再从中随机选取12棵生长了4年的红松树,其树干直径都位于区间.
①用(1)中所求的样本均值与样本方差分别作为正态分布的均值与方差,求;
②护林员在做数据统计时,得出了如下结论:生长了4年的红松树的树干直径近似服从正态分布.在这个条件下,求,并判断护林员的结论是否正确,说明理由.
参考公式:若,
则.
参考数据:.
3.(2023·全国·模拟预测)2023年中秋国庆双节期间,我国继续执行高速公路免费政策.交通部门为掌握双节期间车辆出行的高峰情况,在某高速公路收费点记录了10月1日上午这一时间段内通过的车辆数,统计发现这一时间段内共有1000辆车通过该收费点,为方便统计,时间段记作区间,记作,记作,记作,对通过该收费点的车辆数进行初步处理,已知,时间段内的车辆数的频数如下表:
(1)现对数据进一步分析,采用分层随机抽样的方法从这1000辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中在9:00~9:40通过的车辆数为,求的分布列与期望;
(2)由大数据分析可知,工作日期间车辆在每天通过该收费点的时刻,其中可用(1)中这1000辆车在之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知某天共有800辆车通过该收费点,估计在之间通过的车辆数(结果四舍五入保留到整数).
参考数据:若,则①;②;③.
4.(2023上·全国·高三专题练习)某钢管生产车间生产一批钢管,质检员从中抽出若干根对其直径(单位:)进行测量,得出这批钢管的直径服从正态分布.(参考数据:若,则;;)
(1)如果钢管的直径满足为合格品,求该批钢管为合格品的概率(精确到0.01);
(2)根据(1)的结论,现要从40根该种钢管中任意挑选3根,求次品数的分布列和数学期望.
题型四:根据正态曲线的对称性求参数
1.(2023下·广西玉林·高二校考期中)已知随机变量,且其正态曲线在上是增函数,在上是减函数,且.
(1)求参数,的值.
(2)求.
附:若,则,
2.(2023·江西赣州·统考二模)3D打印即快速成型技术的一种,又称增材制造,它是一种以数字模型文件为基础,运用粉末状金属或塑料等可粘合材料,通过逐层打印的方式来构造物体的技术.中国的3D打印技术在飞机上的应用已达到规模化、工程化,处于世界领先位置.我国某企业利用3D打印技术生产飞机的某种零件,8月1日质检组从当天生产的零件中抽取了部分零件作为样本,检测每个零件的某项质量指标,得到下面的检测结果:
(1)根据频率分布表,估计8月1日生产的该种零件的质量指标的平均值和方差(同一组的数据用该组区间的中点值作代表);
(2)由频率分布表可以认为,该种零件的质量指标,其中近似为样本平均数,近似为样本方差.
①若,求的值;
②若8月1日该企业共生产了500件该种零件,问这500件零件中质量指标不少于的件数最有可能是多少?
附参考数据:,若,则,,.
3.(2022·广东广州·统考三模)为调查禽类某种病菌感染情况,某养殖场每周都定期抽样检测禽类血液中指标的值.养殖场将某周的5000只家禽血液样本中指标的检测数据进行整理,绘成如下频率分布直方图
(1)根据频率分布直方图,估计这5000只家禽血液样本中指标值的中位数(结果保留两位小数);
(2)通过长期调查分析可知,该养殖场家禽血液中指标的值服从正态分布
(i)若其中一个养殖棚有1000只家禽,估计其中血液指标的值不超过的家禽数量(结果保留整数);
(ii)在统计学中,把发生概率小于的事件称为小概率事件,通常认为小概率事件的发生是不正常的.该养殖场除定期抽检外,每天还会随机抽检20只,若某天发现抽检的20只家禽中恰有3只血液中指标的值大于,判断这一天该养殖场的家禽健康状况是否正常,并分析说明理由.
参考数据:
①;
②若,则
4.(2022下·云南昆明·高二云南师大附中校考期中)为普及传染病防治知识,增强市民的疾病防范意识,提高自身保护能力,某市举办传染病防治知识有奖竞赛.现从该市所有参赛者中随机抽取了100名参赛者的竞赛成绩,并以此为样本绘制了如表所示的频率分布表.
(1)求这100名参赛者的竞赛成绩的样本均值和样本方差(同一组中的数据用该组区间的中点值作代表);
(2)若该市所有参赛者的成绩X近似地服从正态分布,用样本估计总体,近似为样本均值,近似为样本方差,利用所得正态分布模型解决以下问题:(参考数据:)
①如果按照的比例将参赛者的竞赛成绩划分为参与奖、二等奖、一等奖、特等奖四个等级,试确定各等级的分数线(精确到整数);
②若该市共有10000名市民参加了竞赛,试估计参赛者中获得特等奖的人数(结果四舍五入到整数).
附:若随机变量X服从正态分布,则,.
题型五:3原则
1.(2023上·江西南昌·高二南昌十中校考阶段练习)近年来,随着电脑、智能手机的迅速普及,我国在线教育行业出现了较大的发展.某在线教育平台为了解利用该平台学习的高一学生化学学习效果,举行了一次化学测试,并从中随机抽查了200名学生的化学成绩(满分100分),将他们的成绩分成以下6组:,,,…,,统计结果如下面的频数分布表所示.
(1)现利用分层抽样的方法从前3组中抽取9人,再从这9人中随机抽取4人调查其成绩不理想的原因,试求这4人中至少有2人来自前2组的概率.
(2)高一学生的这次化学成绩Z(单位:分)近似地服从正态分布,其中近似为样本平均数,近似为样本的标准差s,并已求得,且这次测试恰有2万名学生参加.
(i)试估计这些学生这次化学成绩在区间内的概率(同一组中的数据用该组区间的中点值为代表);
(ii)为了提升学生的成绩,该平台决定免费赠送给在平台学习的学生若干学习视频,具体赠送方案如下:
方案1:每人均赠送25小时学习视频;
方案2:这次测试中化学成绩不高于56.19分的学生赠送40小时的学习视频,化学成绩在内的学生赠送30小时的学习视频,化学成绩高于84.81分的学生赠送10小时的学习视频.问:哪种方案该平台赠送的学习视频总时长更多?请根据数据计算说明.
参考数据:则,.
2.(2023·陕西咸阳·校考模拟预测)2015年5月,国务院印发《中国制造》,是我国由制造业大国转向制造业强国战略的行动纲领.经过多年的发展,我国制造业的水平有了很大的提高,出现了一批在国际上有影响的制造企业.我国的造船业、光伏产业、5G等已经在国际上处于领先地位,我国的精密制造也有了长足发展.已知某精密设备制造企业生产某种零件,根据长期检测结果,得知生产该零件的生产线的产品质量指标值服从正态分布,且质量指标值在内的零件称为优等品.
(1)求该企业生产的零件为优等品的概率(结果精确到0.01);
(2)从该生产线生产的零件中随机抽取5件,随机变量表示抽取的5件中优等品的个数,求的分布列、数学期望和方差.
附:0.9973.
3.(2023下·江西上饶·高二上饶市第一中学校考阶段练习)某市为了传承发展中华优秀传统文化,组织该市中学生进行了一次文化知识有奖竞赛,竞赛类励规则如下:得分在内的学生获三等奖,得分在内的学生获二等奖,得分在内的学生获得一等奖,其他学生不得奖,为了解学生对相关知识的掌握情况,随机抽取100名学生的竞赛成绩,并以此为样本绘制了样本频率分布直方图,如图所示.
若该市所有参赛学生的成绩近似服从正态分布,其中,为样本平均数的估计值,利用所得正态分布模型解决以下问题:
(1)若该市共有10000名学生参加了竞赛,试估计参赛学生中成绩超过79分的学生数(结果四舍五入到整数);
(2)若从所有参赛学生中(参赛学生数大于随机取3名学生进行访谈,设其中竞赛成绩在64分以上的学生数为,求随机变量的分布列和期望.
附参考数据,若随机变量服从正态分布,则,,.
4.(2023下·福建泉州·高二校考期中)某车间生产一批零件,现从中随机抽取个零件,测量其内径的数据如下(单位:):
.
设这个数据的平均值为,标准差为.
(1)求与;
(2)假设这批零件的内径(单位:)服从正态分布.从这批零件中随机抽取个,设这个零件中内径小于的个数为,求.
参考数据:若,则,,.
三、专项训练
1.(2024上·江西·高三校联考期末)面试是求职者进入职场的一个重要关口,也是机构招聘员工的重要环节.某科技企业招聘员工,首先要进行笔试,笔试达标者进入面试,面试环节要求应聘者回答3个问题,第一题考查对公司的了解,答对得2分,答错不得分,第二题和第三题均考查专业知识,每道题答对得4分,答错不得分.
(1)若一共有100人应聘,他们的笔试得分X服从正态分布,规定为达标,求进入面试环节的人数大约为多少(结果四舍五入保留整数);
(2)某进入面试的应聘者第一题答对的概率为,后两题答对的概率均为,每道题是否答对互不影响,求该应聘者的面试成绩Y的数学期望.
附:若(),则,,.
2.(2024上·江苏常州·高三统考期末)某制造商生产的5000根金属棒的长度近似服从正态分布,其中恰有114根金属棒长度不小于6.04.
(1)求;
(2)如果允许制造商生产这种金属棒的长度范围是(5.95,6.05),那么这批金属棒中不合格的金属棒约有多少根?
说明:对任何一个正态分布来说,通过转化为标准正态分布,从而查标准正态分布表得到.
可供查阅的(部分)标准正态分布表
3.(2024上·云南昆明·高三昆明一中校考阶段练习)某面包店的面包师声称自己店里所出售的每个面包的质量均服从期望为,标准差为的正态分布.
(1)已知如下结论:若,从X的取值中随机抽取K(,)个数据,记这K个数据的平均值为Y,则随机变量请利用该结论解决问题;假设面包师的说法是真实的,那么从面包店里随机购买25个面包,记这25个面包质量的平均值为Y,求;
(2)假设有两箱面包(面包除颜色外,其它都一样),已知第一箱中共装有6个面包,其中黄色面包有2个;第二箱中共装有8个面包,其中黄色面包有3个,现随机挑选一箱,然后从该箱中随机取出2个面包,求取出黄色面包个数的分布列及数学期望.
附:随机变量服从正态分布,则,,.
4.(2024·全国·模拟预测)某学校为了了解高一学生安全知识水平,对高一学生进行“消防安全知识测试”,并且规定测试成绩小于60分的为“不合格”,否则为“合格”.若该年级“不合格”的人数不超过总人数的,则该年级知识“达标”;否则该年级知识“不达标”,需要重新对该年级学生进行消防安全培训.现从全体高一学生中随机抽取10名,经统计得,10名学生的平均成绩为74分,标准差为7.
(1)假设高一学生的知识测试成绩服从正态分布.将上述10名学生的成绩作为样本,用样本平均数作为的估计值,用样本标准差作为的估计值.利用估计值估计:高一学生知识是否“达标”?
(2)已知知识测试中的多项选择题中,有4个选项.小明知道每道多项选择题均有两个或三个正确选项.但根据得分规则:全部选对的得5分,部分选对的得2分,有选错的得0分.这样,小明在做多项选择题时,可能选择一个选项,也可能选择两个或三个选项,但不会选择四个选项.假设小明在做某道多项选择题时,基于已有的解题经验,他选择一个选项的概率为,选择两个选项的概率为,选择三个选项的概率为.已知该道多项选择题只有两个正确选项,小明完全不知道四个选项的正误,只好根据自己的经验随机选择.记表示小明做完该道多项选择题后所得的分数,求的分布列及数学期望.
附:若随机变量服从正态分布,则,,.
5.(2023·全国·模拟预测)某市有20000名学生参加了一项知识竞赛活动(知识竞赛分为初赛和复赛),并随机抽取了100名学生的初赛成绩作为样本,绘制了频率分布直方图,如图所示.
(1)根据频率分布直方图,求样本平均数的估计值和分位数.
(2)若所有学生的初赛成绩近似服从正态分布,其中为样本平均数的估计值,,初赛成绩不低于89分的学生才能参加复赛,试估计能参加复赛的人数.
(3)复赛设置了三道试题,第一、二题答对得30分,第三题答对得40分,答错得0分.已知某学生已通过初赛,他在复赛中第一题答对的概率为,后两题答对的概率均为,且每道题回答正确与否互不影响,记该考生的复赛成绩为,求的分布列及数学期望.
附:若随机变量服从正态分布,则,,.
6.(2023上·四川攀枝花·高二统考期末)攀枝花属于亚热带季风气候区,水果种类丰富.其中,“红格脐橙”已经“中华人民共和国农业部2010年第1364号公告”予以登记,根据其种植规模与以往的种植经验,产自该果园的单个“红格脐橙”的果径(最大横切面直径,单位:)在正常环境下服从正态分布.
(1)一顾客购买了10个该果园的“红格脐橙”,求会买到果径小于的概率;
(2)为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2013年至2022年(单位:万元)与年利润增量y(单位:万元)的散点图:
该果园为了预测2023年投资金额为20万元时的年利润增量,建立了关于的两个回归模型;
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近.对投资金额做交换,令,且有,,,.
(ⅰ)根据所给的统计量,求模型②中关于的回归方程;
(ⅱ)根据下列表格中的数据,比较两种模型的相关指数R2,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).
附:若随机变量,则,;
样本()的最小二乘估计公式为,;
相关指数.
8.(2023下·黑龙江大兴安岭地·高二大兴安岭实验中学校考期中)全面建设社会主义现代化国家,最艰巨最繁重的任务仍然在农村,强国必先强农,农强方能国强.某市为了解当地农村经济情况,随机抽取该地2000户农户家庭年收入x(单位:万元)进行调查,并绘制得到如下图所示的频率分布直方图.
(1)求这2000户农户家庭年收入的样本平均数(同一组的数据用该组区间中点值代表).
(2)由直方图可认为农户家庭年收入近似服从正态分布,其中近似为样本平均数,近似为样本方差,其中.
①估计这2000户农户家庭年收入超过9.52万元(含9.52)的户数?(结果保留整数)
②如果用该地区农户家庭年收入的情况来估计全市农户家庭年收入的情况,现从全市农户家庭中随机抽取4户,即年收入不超过9.52万元的农户家庭数为,求.(结果精确到0.001)
附:①;②若,则,;③.
9.(2023·四川宜宾·四川省宜宾市南溪第一中学校校考模拟预测)为深入学习党的二十大精神,激励青年学生积极奋发向上.某学校团委组织学生参加了“青春心向党,奋进新时代”为主题的知识竞赛活动,并从中抽取了200份试卷进行调查,这200份试卷的成绩(卷面共100分)频率分布直方图如图所示.
(1)将此次竞赛成绩近似看作服从正态分布(用样本平均数和标准差S分别作为,的近似值),已知样本的标准差.现从该校参与知识竞赛的所有学生中任取100人,记这100人中知识竞赛成绩超过88分的学生人数为随机变量,求的数学期望;
(2)从得分区间和的试卷中用分层抽样的方法抽取10份试卷,再从这10份样本中随机抽测3份试卷,若已知抽测的3份试卷来自于不同区间,求抽测3份试卷有2份来自区间的概率.
参考数据:若,则 ,,.
10.(2023下·重庆江北·高二重庆十八中校考阶段练习)为落实体育总局和教育部发布的《关于深化体教融合,促进青少年健康发展的意见》,A市共100000名男学生进行100米短跑训练,在某次短跑测试中,从中抽取100名男生作为样本,统计他们的成绩(单位:秒),整理得到如图所示的频率分布直方图,现规定男生短跑成绩不超过13.5秒为优秀.
(1)估计样本中男生短跑成绩的平均数.(同一组的数据用该组区间的中点值为代表)
(2)根据统计分析,A市男生的短跑成绩X服从正态分布,以(1)中所求的样本平均数作为的估计值,求下列问题:
①若从A市的男生中随机抽取10人,记其中短跑成绩在以外的人数为Y,求;
②在这100名男生中、任意抽取2名成绩优秀的男生的条件下,将该2人成绩纳入全市排名(短跑周时越少、排名越靠前),能进入全市前2275名的人数为x,求x的期望.
附:若,则:,,,0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6404
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808,
0.6844
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157'
0.7190
0.7224
1
2
3
4
5
6
7
8
9
10
11
12
28.7
27.2
31.5
35.8
24.3
33.5
36.3
26.7
28.9
27.4
25.2
34.5
时间段
频数
100
300
m
n
质量指标
频率
竞赛成绩
人数
6
10
18
33
16
11
6
组别
频数
20
30
40
60
30
20
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
回归模型
模型①
模型②
回归方程
102.28
36.19
专题03 正态分布(典型题型归类训练)
一、必备秘籍
1、正态分布
若随机变量的概率分布密度函数为对任意的,,它的图象在轴的上方.可以证明轴和曲线之间的区域的面积为1.我们称为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如上图所示.
若随机变量的概率分布密度函数为,则称随机变量服从正态分布(nrmal dis-tributin),记为.特别地,当时,称随机变量服从标准正态分布,即.
由的密度函数及图象可以发现,正态曲线有以下特点:
曲线在轴的上方,与轴不相交。
(2)曲线是单峰的,它关于直线对称.
(3)曲线在处达到峰值 (最高点)
(4)当无限增大时,曲线无限接近轴.
(5)轴与正态曲线所夹面积恒等于1 .
2、正态分布的原则
二、典型题型
题型一:正态密度函数
1.(2021·陕西宝鸡·统考三模)某地处偏远山区的古镇约有人口5000人,为了响应国家号召,镇政府多项并举,鼓励青壮劳力外出务工的同时发展以旅游业为龙头的乡村特色经济,到2020年底一举脱贫.据不完全统计该镇约有的人外出务工.下图是根据2020年扶贫工作期间随机调查本地100名在外务工人员的年收入(单位:千元)数据绘制的频率分布直方图.
(1)根据样本数据怙计该镇外出务工人员的创收总额(同一组中的数据用该组区间的中点值为代表);
(2)假设该镇外出务工人员年收入服从正态分布,其分布密度函数为,其中为样本平均值.若的最大值为,求的值;
(3)完成脱贫任务后,古镇党政班子并不懈怠,决心带领全镇人民在奔小康道路上再上一个新台阶,出台了多项优惠政策,鼓励本地在外人员返乡创业.调查显示务工收入在和的人群愿意返乡创业的人数比例分别为和.从样本人群收入在的人中随机抽取3人进行调查,设为愿意返乡创业的人数,求随机变量的分布列和数学期望.
【答案】(1)(千元);(2);(3)分布列答案见解析,数学期望:.
【分析】(1)利用频率分布直方图求出100名在外务工人员的年平均收入,再乘以可得结果;
(2)根据概率密度函数的单调性求出最大值,结合已知最大值可得结果;
(3)求出随机变量的可能取值及其概率可得分布列,根据期望公式求出数学期望.
【详解】(1)由频率分布直可知100名在外务工人员的平均年收入为
(千元)
∴该镇外出务工人员的创收总额为(千元).
(2)∵概率密度函数为,在上单调递增,在上单调递减
∴当时,函数取得最大值为,
∴,解得.
(3)∵,,
∴样本中年收入在(即)和(即)内愿意返乡创业的人数分别为人和人.
∴样本人群收入在内共25人,其中愿意返乡创业的共4人,
∴随机变量的可能取值分别为0,1,2,3,
∴;;,
.
∴随机变量的分布列为
∴.
【点睛】关键点点睛:掌握利用频率分布直方图求平均数、正确求出离散型随机变量的分布列是解题关键.
2.(2018·高二课时练习)正态总体当时的概率密度函数是
(1)证明是偶函数;
(2)求的最大值;
(3)利用指数函数的性质说明的增减性.
【答案】(1)证明见解析;
(2);
(3)当时是单调递增;当时是单调递减
【分析】(1)根据函数奇偶性的定义判断函数的奇偶性;;
(2)结合的最值情况和是关于的增函数,即可得到最大值;
(3)利用指数函数的性质以及单调性的定义即可得到答案
(1)
对于任意的,,
所以是偶函数.
(2)
令,当时,;
(3)
任取且,有,所以,
因为是上的增函数,
所以,所以,即,
所以当时是单调递增,
又因为是偶函数,所以在上是减函数,
所以当时是单调递增;当时是单调递减
3.(2014·高二课时练习)已知某种零件的尺寸ξ(单位:mm)服从正态分布,其正态曲线在(0,80)上是增函数,在上是减函数,且.
(1)求概率密度函数;
(2)估计尺寸在72mm~88mm间的零件大约占总数的百分之几?
【答案】(1);
(2)68.26%.
【分析】(1)根据正态分布曲线关于对称和峰值为计算即可;
(2)根据正态分布曲线的对称性求概率即可.
【详解】(1)由于正态曲线在上是增函数,在上是减函数,所以正态曲线关于直线对称,且处取得最大值,因此.
根据题意得,所以.
故概率密度函数解析式是.
(2)因为,,所以,
所以尺寸在72mm~88mm之间的零件的百分率68.26%
题型二:标准正态分布的应用
1.(2023·全国·高二课堂例题)某批待出口的水果罐头,每罐净重X(单位:g)服从正态分布,求:(参考数据:,)
(1)随机抽取1罐,其净重超过的概率;
(2)随机抽取1罐,其净重在与之间的概率.
【答案】(1)0.4207;
(2)0.9544.
【分析】(1)(2)将正态分布转化为标准正态分布形式,结合正态分布的对称性求概率即可.
【详解】(1).
故随机抽取1罐,其净重超过的概率是0.4207,
(2)
.
故随机抽取1罐,其净重在与之间的概率为0.9544.
2.(2022·河南开封·河南省兰考县第一高级中学校联考模拟预测)《山东省高考改革试点方案》规定:年高考总成绩由语文、数学、外语三门统考科目和思想政治、历史、地理、物理、化学、生物六门选考科目组成,将每门选考科目的考生原始成绩从高到低划分为、、、、、、、共8个等级,参照正态分布原则,确定各等级人数所占比例分别为、、、、、、、,选择科目成绩计入考生总成绩时,将至等级内的考生原始成绩,依照(、分别为正态分布的均值和标准差)分别转换到、、、、、、、八个分数区间,得到考生的等级成绩.如果山东省年某次学业水平模拟考试物理科目的原始成绩,.
(1)若规定等级、、、、、为合格,、为不合格,需要补考,估计这次学业水平模拟考试物理合格线的最低原始分是多少;
(2)现随机抽取了该省名参加此次物理学科学业水平测试的原始分,若这些学生的原始分相互独立,记为被抽到的原始分不低于分的学生人数,求的数学期望和方差.
附:当时,,.
【答案】(1);
(2),.
【分析】(1)分析可得,由,解出的范围,即可得出结论;
(2)由可得出,计算得出,分析可知,利用二项分布的期望和方差公式可求得结果.
【详解】(1)解:由题意可知,学业水平模拟考试物理科目合格的比例为,
估计这次学业水平模拟考试物理合格线的最低原始分为分.
(2)解:若,则,,
由题意可知,
,.
3.(2022·四川成都·石室中学校考三模)2021年某地在全国志愿服务信息系统注册登记志愿者8万多人,2020年7月份以来,共完成1931个志愿服务项目,8900多名志愿者开展志愿服务活动累计超过150万小时,为了了解此地志愿者对志愿服务的认知和参与度,随机调查了500名志愿者每月的志愿服务时长(单位:小时),并绘制如图所示的频率分布直方图.
(1)估计这500名志愿者每月志愿服务时长的样本平均数和样本方差(同一组中的数据用该组数据区间的中间值代表);
(2)由直方图可以认为,目前该地志愿者每月服务时长X服从正态分布,其中近似为样本平均数,近似为样本方差.一般正态分布的概率都可以转化为标准正态分布的概率进行计算:若,令,则,且.
(i)利用直方图得到的正态分布,求;
(ii)从该地随机抽取20名志愿者,记Z表示这20名志愿者中每月志愿服务时长超过10小时的人数,求(结果精确到0.001),以及Z的数学期望(结果精确到0.01).
参考数据:,,,,.若,则,,.
【答案】(1)平均数9,样本方差1.64
(2)(i)0.7823;(ii)0.993,4.35
【分析】(1)根据频率分布直方图平均数和方差的计算方法计算即可;
(2)(i)根据(1)中所得平均数和方差,几何正态分布的性质可求μ和σ,根据题中所给信息即可求;(ii)求出,由题可知Z服从二项分布,根据二项分布概率计算方法即可求,根据二项分布数学期望公式即可求其数学期望.
【详解】(1),
(2)(i)由题意并结合(1)可知,,,
∴,∴.
(ii)由(ⅰ)可知,,
∴,
∴,.
4.(2021·广东深圳·统考二模)已知某高校共有10000名学生,其图书馆阅览室共有994个座位,假设学生是否去自习是相互独立的,且每个学生在每天的晚自习时间去阅览室自习的概率均为0.1.
(1)将每天的晚自习时间去阅览室自习的学生人数记为,求的期望和方差;
(2)18世纪30年代,数学家棣莫弗发现,当比较大时,二项分布可视为正态分布.此外,如果随机变量,令,则.当时,对于任意实数,记.已知下表为标准正态分布表(节选),该表用于查询标准正态分布对应的概率值.例如当时,由于,则先在表的最左列找到数字0.1(位于第三行),然后在表的最上行找到数字0.06(位于第八列),则表中位于第三行第八列的数字0.5636便是的值.
①求在晚自习时间阅览室座位不够用的概率;
②若要使在晚自习时间阅览室座位够用的概率高于0.7,则至少需要添加多少个座位?
【答案】(1),;
(2)①;②22.
【分析】(1)显然,根据二项分布的期望和方差公式,直接求解即可得解;
(2)①根据题意可得,,则,根据标准正态分布表即可得解;②查表可得,,则,即,再结合标准正态分布即可得解.
【详解】(1)由题意可得,随机变量X服从二项分布,
则,
,
(2)①由于(1)中二项分布的n值增大,
故可以认为随机变量X服从二项分布,
由(1)可得,,
可得,则,
则,
由标准正态分布性质可得,,
故,
故,
在晚自习时间阅览室座位不够用的概率为;
②查表可得,,则,
故座位数至少要1016个,
,
故阅览室座位至少需要添加22个.
【点睛】本题考查了二项分布和正态,考查了利用二项分布的性质求期望方差,同时考查了标准正态分布的概率值,考查了转化思想和一定的计算能力,属于中档题.本题的关键点有:
(1)掌握二项分布和正态分布的概念性质及应用;
(2)通过正态分布和标准正态分布的转化求概率值解决问题.
题型三:正态分布的实际应用
1.(2024上·湖南衡阳·高三统考期末)已知某超市销售的袋装食用盐的质量(单位:)服从正态分布,且0.15.某次该超市称量了120袋食用盐,其总质量为的值恰好等于这120袋食用盐每袋的平均质量(单位:).
(1)若从该超市销售的袋装食用盐中随机选取2袋,设这2袋中质量不小于的袋数为,求的分布列;
(2)若从该超市销售的袋装食用盐中随机选取(为正整数)袋,记质量在的袋数为,求满足的的最大值.
【答案】(1)分布列见解析
(2)199
【分析】(1)根据题意可求得,从而求出,由的可能取值为,从而求出相应概率即可列出分布列.
(2)由(1)及可得,且,利用二项分布求方差公式从而可求解.
【详解】(1)依题意可得,
则,
的可能取值为,
,,
所以的分布列为
(2)因为,所以.
2.(2024上·海南省直辖县级单位·高三校考阶段练习)红松树分布在我国东北的小兴安岭到长白山一带,耐荫性强.在一森林公园内种有一大批红松树,为了研究生长了4年的红松树的生长状况,从中随机选取了12棵生长了4年的红松树,并测量了它们的树干直径(单位:厘米),如下表:
计算得:.
(1)求这12棵红松树的树干直径的样本均值与样本方差.
(2)假设生长了4年的红松树的树干直径近似服从正态分布.
记事件:在森林公园内再从中随机选取12棵生长了4年的红松树,其树干直径都位于区间.
①用(1)中所求的样本均值与样本方差分别作为正态分布的均值与方差,求;
②护林员在做数据统计时,得出了如下结论:生长了4年的红松树的树干直径近似服从正态分布.在这个条件下,求,并判断护林员的结论是否正确,说明理由.
参考公式:若,
则.
参考数据:.
【答案】(1),.
(2)①;②,护林员给出的结论是错误的,理由见解析.
【分析】(1)利用均值(平均数)的计算公式和方差公式,计算即可;
(2)①12棵生长了4年的红松树,其树干直径都位于区间,是一个独立重复实验,其中在区间内等价于发生;②根据随机变量服从正态分布,其中在区间内等价于发生,计算得出,再比较即可.
【详解】(1)样本均值,
样本方差
.
(2)①由题意可得,树干直径(单位:近似服从正态分布.
在森林公园内再随机选一棵生长了4年的红松树,其树干直径位于区间的概率是,所以.
②若树干直径近似服从正态分布,
此时事件发生的概率远小于①中根据测量结果得出的概率估计值.
事件是一个小概率事件,但是第一次随机选取的12棵生长了4年的红松树,事件发生了,所以认为护林员给出的结论是错误的.
3.(2023·全国·模拟预测)2023年中秋国庆双节期间,我国继续执行高速公路免费政策.交通部门为掌握双节期间车辆出行的高峰情况,在某高速公路收费点记录了10月1日上午这一时间段内通过的车辆数,统计发现这一时间段内共有1000辆车通过该收费点,为方便统计,时间段记作区间,记作,记作,记作,对通过该收费点的车辆数进行初步处理,已知,时间段内的车辆数的频数如下表:
(1)现对数据进一步分析,采用分层随机抽样的方法从这1000辆车中抽取10辆,再从这10辆车中随机抽取4辆,设抽到的4辆车中在9:00~9:40通过的车辆数为,求的分布列与期望;
(2)由大数据分析可知,工作日期间车辆在每天通过该收费点的时刻,其中可用(1)中这1000辆车在之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代替(同一组中的数据用该组区间的中点值代表),已知某天共有800辆车通过该收费点,估计在之间通过的车辆数(结果四舍五入保留到整数).
参考数据:若,则①;②;③.
【答案】(1)分布列见解析,期望为
(2)
【分析】(1)根据分层抽样、超几何分布等知识求得分布列并求得数学期望.
(2)先求得,然后根据正态分布的对称性求得正确答案.
【详解】(1)因为,,所以,.
由分层随机抽样可知,抽取的10辆车中,在9:00~9:40通过的车辆数位于时间段,这两个区间内的车辆数为,
车辆数的可能取值为0,1,2,3,4,
所以X的分布列为
所以.
(2)这1000辆车在时间段内通过该收费点的时刻的平均值,即9:04,
,
所以.
估计在这一时间段内通过的车辆数,也就是通过的车辆数,
工作日期间车辆在每天通过该收费点的时刻,
,
所以估计在这一时间段内通过的车辆数为.
4.(2023上·全国·高三专题练习)某钢管生产车间生产一批钢管,质检员从中抽出若干根对其直径(单位:)进行测量,得出这批钢管的直径服从正态分布.(参考数据:若,则;;)
(1)如果钢管的直径满足为合格品,求该批钢管为合格品的概率(精确到0.01);
(2)根据(1)的结论,现要从40根该种钢管中任意挑选3根,求次品数的分布列和数学期望.
【答案】(1)0.95
(2)分布列见解析,期望为
【分析】(1)由正态分布的均值与方差可得,为合格品即满足,由参考数据可得该批钢管为合格品的概率;
(2)由(1)知,40根钢管中合格品为38根,次品为2根,任意挑选3根,按离散型变量的分布列步骤,由古典概型概率公式逐一求解每一个取值对应的概率即可.
【详解】(1)由题意这批钢管的直径服从正态分布.
则,则,
所以,
由题意,钢管直径满足为合格品,
由,
所以该批钢管为合格品的概率约为.
(2)由(1)知,40根钢管中合格品为38根,次品为2根,任意挑选3根,则次品数的可能取值为0,1,2,
,,.
次品数的分布列为
∴.
题型四:根据正态曲线的对称性求参数
1.(2023下·广西玉林·高二校考期中)已知随机变量,且其正态曲线在上是增函数,在上是减函数,且.
(1)求参数,的值.
(2)求.
附:若,则,
【答案】(1),
(2)0.1359
【分析】(1)由题设及特殊区间的概率值得到,即可确定参数;
(2)利用正态分布的对称性求、,进而求目标概率值.
【详解】(1)由题设,而,则,可得.
(2)由(1)知:,
正态曲线关于对称 ,即,
所以,故,
由,则,
所以,
综上,.
2.(2023·江西赣州·统考二模)3D打印即快速成型技术的一种,又称增材制造,它是一种以数字模型文件为基础,运用粉末状金属或塑料等可粘合材料,通过逐层打印的方式来构造物体的技术.中国的3D打印技术在飞机上的应用已达到规模化、工程化,处于世界领先位置.我国某企业利用3D打印技术生产飞机的某种零件,8月1日质检组从当天生产的零件中抽取了部分零件作为样本,检测每个零件的某项质量指标,得到下面的检测结果:
(1)根据频率分布表,估计8月1日生产的该种零件的质量指标的平均值和方差(同一组的数据用该组区间的中点值作代表);
(2)由频率分布表可以认为,该种零件的质量指标,其中近似为样本平均数,近似为样本方差.
①若,求的值;
②若8月1日该企业共生产了500件该种零件,问这500件零件中质量指标不少于的件数最有可能是多少?
附参考数据:,若,则,,.
【答案】(1)
(2)①;②
【分析】(1)根据题意结合平均数和方差的公式运算求解;
(2)①根据正态分布的性质运算求解;②根据题意结合二项分布的概率公式列式求解即可.
【详解】(1)由题意可得:,
(2)由(1)可得:,
即.
①因为,
所以.
②由①可知:,
设这500件零件中质量指标不少于的件数为,则,
可得,
解得,
且,则,即当时,概率最大,
所以这500件零件中质量指标不少于的件数最有可能是489.
3.(2022·广东广州·统考三模)为调查禽类某种病菌感染情况,某养殖场每周都定期抽样检测禽类血液中指标的值.养殖场将某周的5000只家禽血液样本中指标的检测数据进行整理,绘成如下频率分布直方图
(1)根据频率分布直方图,估计这5000只家禽血液样本中指标值的中位数(结果保留两位小数);
(2)通过长期调查分析可知,该养殖场家禽血液中指标的值服从正态分布
(i)若其中一个养殖棚有1000只家禽,估计其中血液指标的值不超过的家禽数量(结果保留整数);
(ii)在统计学中,把发生概率小于的事件称为小概率事件,通常认为小概率事件的发生是不正常的.该养殖场除定期抽检外,每天还会随机抽检20只,若某天发现抽检的20只家禽中恰有3只血液中指标的值大于,判断这一天该养殖场的家禽健康状况是否正常,并分析说明理由.
参考数据:
①;
②若,则
【答案】(1)7.33
(2)(i)841;(ii)不正常,理由见解析.
【分析】(1)先判断中位数所在区间,再设出中位数,利用中位数左侧频率和为0.5求解即可;
(2)(i)由正态分布的对称性及特殊区间的概率求得,再计算家禽数量即可;(ii)先求出,再由独立重复实验的概率公式求出恰有3只血液中指标的值大于的概率,和比较作出判断即可.
【详解】(1)由可得中位数在区间内,
设中位数为,则,解得;
(2)(i)由可得,
则,只;
(ii),,随机抽检20只相当于进行20次独立重复实验,
设恰有3只血液中指标的值大于为事件,则,
所以这一天该养殖场的家禽健康状况不正常.
4.(2022下·云南昆明·高二云南师大附中校考期中)为普及传染病防治知识,增强市民的疾病防范意识,提高自身保护能力,某市举办传染病防治知识有奖竞赛.现从该市所有参赛者中随机抽取了100名参赛者的竞赛成绩,并以此为样本绘制了如表所示的频率分布表.
(1)求这100名参赛者的竞赛成绩的样本均值和样本方差(同一组中的数据用该组区间的中点值作代表);
(2)若该市所有参赛者的成绩X近似地服从正态分布,用样本估计总体,近似为样本均值,近似为样本方差,利用所得正态分布模型解决以下问题:(参考数据:)
①如果按照的比例将参赛者的竞赛成绩划分为参与奖、二等奖、一等奖、特等奖四个等级,试确定各等级的分数线(精确到整数);
②若该市共有10000名市民参加了竞赛,试估计参赛者中获得特等奖的人数(结果四舍五入到整数).
附:若随机变量X服从正态分布,则,.
【答案】(1);
(2)①分数低于50的为参与奖,分数大于等于50小于65的为二等奖,分数大于等于65小于80的为一等奖,分数大于等于80的为特等奖 ;②
【分析】(1)根据频率分布表中的数据利用平均数公式和方差公式可求得结果,
(2)①设竞赛成绩达到a及以上为特等奖;成绩达到b但小于a为一等奖,成绩达到c但小于b为二等奖,成绩未达到c为参与奖,则根据题意和正态分布的性质可得,,从而可得答案,②根据正态分布的性质求解
【详解】(1)由频率分布表可得
(2)该市所有参赛者的成绩X近似地服从正态分布,
①设竞赛成绩达到a及以上为特等奖;成绩达到b但小于a为一等奖,成绩达到c但小于b为二等奖,成绩未达到c为参与奖,则
,
由于,因此;
所以分数低于50的为参与奖,分数大于等于50小于65的为二等奖,分数大于等于65小于80的为一等奖,分数大于等于80的为特等奖.
②
估计参赛者中超过80分的人数为.
题型五:3原则
1.(2023上·江西南昌·高二南昌十中校考阶段练习)近年来,随着电脑、智能手机的迅速普及,我国在线教育行业出现了较大的发展.某在线教育平台为了解利用该平台学习的高一学生化学学习效果,举行了一次化学测试,并从中随机抽查了200名学生的化学成绩(满分100分),将他们的成绩分成以下6组:,,,…,,统计结果如下面的频数分布表所示.
(1)现利用分层抽样的方法从前3组中抽取9人,再从这9人中随机抽取4人调查其成绩不理想的原因,试求这4人中至少有2人来自前2组的概率.
(2)高一学生的这次化学成绩Z(单位:分)近似地服从正态分布,其中近似为样本平均数,近似为样本的标准差s,并已求得,且这次测试恰有2万名学生参加.
(i)试估计这些学生这次化学成绩在区间内的概率(同一组中的数据用该组区间的中点值为代表);
(ii)为了提升学生的成绩,该平台决定免费赠送给在平台学习的学生若干学习视频,具体赠送方案如下:
方案1:每人均赠送25小时学习视频;
方案2:这次测试中化学成绩不高于56.19分的学生赠送40小时的学习视频,化学成绩在内的学生赠送30小时的学习视频,化学成绩高于84.81分的学生赠送10小时的学习视频.问:哪种方案该平台赠送的学习视频总时长更多?请根据数据计算说明.
参考数据:则,.
【答案】(1)
(2)(i)0.8186;(ii)方案2该平台赠送的学习视频总时长更多.
【分析】(1)由古典概率公式结合对立事件的概率求解即可;
(2)(i)由平均数的计算公式求出,再由原则求解即可;(ii)对于方案2,设每位学生所获赠学习视频的小时数为X,求出X的所有可能取值及其概率,再求出,与方案一比较即可得出答案..
【详解】(1)用分层抽样的方法抽取9人,则第1,2,3组各抽取了2,3,4人,⋯
从这9人中抽取4人,则这4人中至少有2人来自前2组的概率为.
(2)(i)由题意得:
所以样本平均数为.
因为,,所以,,,,
所以
.
(ii)对于方案2,设每位学生所获赠学习视频的小时数为X,
则X的所有可能取值为40,30,10.
化学成绩不高于56.19分的概率为,
则数学期望(小时).
因为,所以方案2该平台赠送的学习视频总时长更多.
2.(2023·陕西咸阳·校考模拟预测)2015年5月,国务院印发《中国制造》,是我国由制造业大国转向制造业强国战略的行动纲领.经过多年的发展,我国制造业的水平有了很大的提高,出现了一批在国际上有影响的制造企业.我国的造船业、光伏产业、5G等已经在国际上处于领先地位,我国的精密制造也有了长足发展.已知某精密设备制造企业生产某种零件,根据长期检测结果,得知生产该零件的生产线的产品质量指标值服从正态分布,且质量指标值在内的零件称为优等品.
(1)求该企业生产的零件为优等品的概率(结果精确到0.01);
(2)从该生产线生产的零件中随机抽取5件,随机变量表示抽取的5件中优等品的个数,求的分布列、数学期望和方差.
附:0.9973.
【答案】(1)0.82
(2)分布列见解析,
【分析】(1)产品质量指标值服从正态分布,结合原则,求优等品的概率;
(2)随机变量的取值,计算相应的概率,列出分布列,利用二项分布求数学期望和方差.
【详解】(1)因为产品质量指标值,则,
所以优等品的概率
,
所以该企业生产零件为优等品的概率约为0.82.
(2)由(1)知产品为优等品的概率为0.82,由题意知,
随机变量的取值为:0,1,2,3,4,5;
故的分布列为,即
所以.
3.(2023下·江西上饶·高二上饶市第一中学校考阶段练习)某市为了传承发展中华优秀传统文化,组织该市中学生进行了一次文化知识有奖竞赛,竞赛类励规则如下:得分在内的学生获三等奖,得分在内的学生获二等奖,得分在内的学生获得一等奖,其他学生不得奖,为了解学生对相关知识的掌握情况,随机抽取100名学生的竞赛成绩,并以此为样本绘制了样本频率分布直方图,如图所示.
若该市所有参赛学生的成绩近似服从正态分布,其中,为样本平均数的估计值,利用所得正态分布模型解决以下问题:
(1)若该市共有10000名学生参加了竞赛,试估计参赛学生中成绩超过79分的学生数(结果四舍五入到整数);
(2)若从所有参赛学生中(参赛学生数大于随机取3名学生进行访谈,设其中竞赛成绩在64分以上的学生数为,求随机变量的分布列和期望.
附参考数据,若随机变量服从正态分布,则,,.
【答案】(1)1587;
(2)分布列见解析,数学期望为.
【分析】(1)由样本频率分布直方图得,求解样本平均数的估计值,即可得正泰分布的均值,按照正态分布的性质求解参赛学生中成绩超过79分的学生数;
(2)由样本估计总体可知随机变量服从二项分布,根据二项分布确定概率分布列与数学期望即可.
【详解】(1)解:由样本频率分布直方图得,样本平均数的估计值:
,
则所有参赛学生的成绩近似服从正态分布,
即从所有参赛学生中随机抽取1名学生,该生竞赛成绩在64分以上的概率为,
所以随机变量服从二项分布,
所以,
,
所以随机变量的分布列为:
所以期望为.
4.(2023下·福建泉州·高二校考期中)某车间生产一批零件,现从中随机抽取个零件,测量其内径的数据如下(单位:):
.
设这个数据的平均值为,标准差为.
(1)求与;
(2)假设这批零件的内径(单位:)服从正态分布.从这批零件中随机抽取个,设这个零件中内径小于的个数为,求.
参考数据:若,则,,.
【答案】(1),
(2)
【分析】(1)利用平均数和方差公式可求得、的值;
(2)求出,分析可知,利用二项分布的期望公式以及期望的性质可得出的值.
【详解】(1)解:,
,则.
(2)解:由(1)可知,,则,
所以,,
由题意可知,,则,
由期望的性质可得.
三、专项训练
1.(2024上·江西·高三校联考期末)面试是求职者进入职场的一个重要关口,也是机构招聘员工的重要环节.某科技企业招聘员工,首先要进行笔试,笔试达标者进入面试,面试环节要求应聘者回答3个问题,第一题考查对公司的了解,答对得2分,答错不得分,第二题和第三题均考查专业知识,每道题答对得4分,答错不得分.
(1)若一共有100人应聘,他们的笔试得分X服从正态分布,规定为达标,求进入面试环节的人数大约为多少(结果四舍五入保留整数);
(2)某进入面试的应聘者第一题答对的概率为,后两题答对的概率均为,每道题是否答对互不影响,求该应聘者的面试成绩Y的数学期望.
附:若(),则,,.
【答案】(1)16
(2)
【分析】(1)由正态分布的性质可求得,由此可估计进入面试的人数.
(2)由已知得的可能取值为0,2,4,6,8,10,分别求得取每一个可能的值的概率,得的分布列,根据数学期望公式可求得答案.
【详解】(1)因为服从正态分布,所以,,,
所以.
进入面试的人数,.
因此,进入面试的人数大约为16.
(2)由题意可知,的可能取值为0,2,4,6,8,10,
;
;
.
所以.
2.(2024上·江苏常州·高三统考期末)某制造商生产的5000根金属棒的长度近似服从正态分布,其中恰有114根金属棒长度不小于6.04.
(1)求;
(2)如果允许制造商生产这种金属棒的长度范围是(5.95,6.05),那么这批金属棒中不合格的金属棒约有多少根?
说明:对任何一个正态分布来说,通过转化为标准正态分布,从而查标准正态分布表得到.
可供查阅的(部分)标准正态分布表
【答案】(1)
(2)根
【分析】(1)求出,进而求出即可求解;
(2)根据题意求出即可求解.
【详解】(1),,
,
,,
;
(2)
,
不合格的金属棒有:根.
3.(2024上·云南昆明·高三昆明一中校考阶段练习)某面包店的面包师声称自己店里所出售的每个面包的质量均服从期望为,标准差为的正态分布.
(1)已知如下结论:若,从X的取值中随机抽取K(,)个数据,记这K个数据的平均值为Y,则随机变量请利用该结论解决问题;假设面包师的说法是真实的,那么从面包店里随机购买25个面包,记这25个面包质量的平均值为Y,求;
(2)假设有两箱面包(面包除颜色外,其它都一样),已知第一箱中共装有6个面包,其中黄色面包有2个;第二箱中共装有8个面包,其中黄色面包有3个,现随机挑选一箱,然后从该箱中随机取出2个面包,求取出黄色面包个数的分布列及数学期望.
附:随机变量服从正态分布,则,,.
【答案】(1)
(2)分布列见解析,数学期望为
【分析】(1)根据题设求得随机变量的期望和标准差,由条件算出,利用正态分布图的对称性性质即可求得;
(2)根据题意,得出随机变量的可能值,结合条件可得概率,从而可得分布列及数学期望.
【详解】(1)由题意则,
所以,于是随机变量的期望为,标准差为,
因,
故随机变量的分布列为:
所以数学期望为:
4.(2024·全国·模拟预测)某学校为了了解高一学生安全知识水平,对高一学生进行“消防安全知识测试”,并且规定测试成绩小于60分的为“不合格”,否则为“合格”.若该年级“不合格”的人数不超过总人数的,则该年级知识“达标”;否则该年级知识“不达标”,需要重新对该年级学生进行消防安全培训.现从全体高一学生中随机抽取10名,经统计得,10名学生的平均成绩为74分,标准差为7.
(1)假设高一学生的知识测试成绩服从正态分布.将上述10名学生的成绩作为样本,用样本平均数作为的估计值,用样本标准差作为的估计值.利用估计值估计:高一学生知识是否“达标”?
(2)已知知识测试中的多项选择题中,有4个选项.小明知道每道多项选择题均有两个或三个正确选项.但根据得分规则:全部选对的得5分,部分选对的得2分,有选错的得0分.这样,小明在做多项选择题时,可能选择一个选项,也可能选择两个或三个选项,但不会选择四个选项.假设小明在做某道多项选择题时,基于已有的解题经验,他选择一个选项的概率为,选择两个选项的概率为,选择三个选项的概率为.已知该道多项选择题只有两个正确选项,小明完全不知道四个选项的正误,只好根据自己的经验随机选择.记表示小明做完该道多项选择题后所得的分数,求的分布列及数学期望.
附:若随机变量服从正态分布,则,,.
【答案】(1)高一学生知识“达标”
(2)分布列见解析;期望为
【分析】(1)首先由题得,,再根据正态分布的对称性计算出,最后得到不合格人数,得到合格率.
(2)的可能取值为0,2,5,分别计算出其概率,得到分布列,最后得到期望.
【详解】(1)由,得的估计值为的估计值为7,
,
.
高一学生知识“达标”.
(2)由题意得,的可能取值为,
,
的分布列为
5.(2023·全国·模拟预测)某市有20000名学生参加了一项知识竞赛活动(知识竞赛分为初赛和复赛),并随机抽取了100名学生的初赛成绩作为样本,绘制了频率分布直方图,如图所示.
(1)根据频率分布直方图,求样本平均数的估计值和分位数.
(2)若所有学生的初赛成绩近似服从正态分布,其中为样本平均数的估计值,,初赛成绩不低于89分的学生才能参加复赛,试估计能参加复赛的人数.
(3)复赛设置了三道试题,第一、二题答对得30分,第三题答对得40分,答错得0分.已知某学生已通过初赛,他在复赛中第一题答对的概率为,后两题答对的概率均为,且每道题回答正确与否互不影响,记该考生的复赛成绩为,求的分布列及数学期望.
附:若随机变量服从正态分布,则,,.
【答案】(1)平均数67,分位数为
(2)455
(3)分布列见解析,数学期望为55
【分析】(1)根据频率分布直方图中平均数和百分位数的求法即可求解;
(2)由(1),易知近似服从正态分布,结合题意和正态分布3段区间的概率即可求解;
(3)利用独立事件的概率乘法公式求出随机变量Y值对应的概率,列出分布列,结合数学期望计算公式求解即可.
【详解】(1)样本平均数.
因为前2组的频率之和为,前3组的频率之和为,
设分位数为,则,解得.
(2)因为学生的初赛成绩近似服从正态分布,其中,,
所以,
所以,
所以估计能参加复赛的人数为.
(3)所有可能的取值为0,30,40,60,70,100,
,,
所以的分布列为
,
所以的数学期望为55.
6.(2023上·四川攀枝花·高二统考期末)攀枝花属于亚热带季风气候区,水果种类丰富.其中,“红格脐橙”已经“中华人民共和国农业部2010年第1364号公告”予以登记,根据其种植规模与以往的种植经验,产自该果园的单个“红格脐橙”的果径(最大横切面直径,单位:)在正常环境下服从正态分布.
(1)一顾客购买了10个该果园的“红格脐橙”,求会买到果径小于的概率;
(2)为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2013年至2022年(单位:万元)与年利润增量y(单位:万元)的散点图:
该果园为了预测2023年投资金额为20万元时的年利润增量,建立了关于的两个回归模型;
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近.对投资金额做交换,令,且有,,,.
(ⅰ)根据所给的统计量,求模型②中关于的回归方程;
(ⅱ)根据下列表格中的数据,比较两种模型的相关指数R2,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).
附:若随机变量,则,;
样本()的最小二乘估计公式为,;
相关指数.
参考数据:,,,.
【答案】(1);
(2)(ⅰ);(ⅱ)模型②刻画的拟合效果更好,当时,模型②的年利润增量的预测值为万元.
【分析】(1)由正态分布的对称性结合法则求解;
(2)(ⅰ)由已知数据利用最小二乘法求解模型②中关于的回归方程;
(ⅱ)由已知表格中的数据,可得模型①的小于模型②,说明模型②刻画的拟合效果更好,再由(ⅰ)中求得线性回归方程求解.
【详解】(1)由题意,,,
由正态分布曲线的对称性可知,
.
设一顾客购买了10个该果园的“红格脐橙”,
其中果径小于的有个,,
故,
∴一顾客购买了10个该果园的“红格脐橙”,会买到果径小于的概率为;
(2)(ⅰ)由题中所给数据,可得,,
,.
∴模型②中关于的线性回归方程为;
(ⅱ)由表格中的数据,有,即,
∴模型①的小于模型②,说明模型②刻画的拟合效果更好.
当时,模型②的年利润增量的预测值为:
万元.
7.(2023上·江苏南通·高三海安高级中学校考阶段练习)某大型公司招聘新员工,应聘人员简历符合要求之后进入考试环节.考试分为笔试和面试,只有笔试成绩高于75分的考生才能进入面试环节,已知2023年共有1000人参加该公司的笔试,笔试成绩.
(1)从参加笔试的1000名考生中随机抽取4人,求这4人中至少有一人进入面试的概率;
(2)甲、乙、丙三名应聘人员进入面试环节,且他们通过面试的概率分别为.设这三名应聘人员中通过面试的人数为,求随机变量的分布列和数学期望.
参考数据:若,则,
【答案】(1)0.499
(2)分布列见解析,
【析】(1)记“至少有一人进入面试”,由正态分布可得,再根据对立事件和独立事件概率乘法公式运算求解;
(2)由题意可得:的可能取值为,根据独立事件概率乘法公式求分布列,进而可得期望.
【详解】(1)记“至少有一人进入面试”,由已知得,
所以,
则,
即这4人中至少有一人进入面试的概率为0.499.
(2)由题意可得:的可能取值为,则:
,
,
,
,
可得随机变量的分布列为
所以.
8.(2023下·黑龙江大兴安岭地·高二大兴安岭实验中学校考期中)全面建设社会主义现代化国家,最艰巨最繁重的任务仍然在农村,强国必先强农,农强方能国强.某市为了解当地农村经济情况,随机抽取该地2000户农户家庭年收入x(单位:万元)进行调查,并绘制得到如下图所示的频率分布直方图.
(1)求这2000户农户家庭年收入的样本平均数(同一组的数据用该组区间中点值代表).
(2)由直方图可认为农户家庭年收入近似服从正态分布,其中近似为样本平均数,近似为样本方差,其中.
①估计这2000户农户家庭年收入超过9.52万元(含9.52)的户数?(结果保留整数)
②如果用该地区农户家庭年收入的情况来估计全市农户家庭年收入的情况,现从全市农户家庭中随机抽取4户,即年收入不超过9.52万元的农户家庭数为,求.(结果精确到0.001)
附:①;②若,则,;③.
【答案】(1)8
(2)①317户;②
【分析】(1)利用平均数公式求解;
(2)易知①农户家庭年收入近似服从正态分布,根据,求得即可.②由年收入不超过9.52万元的农户家庭数服从二项分布求解.
【详解】(1)解:这2000户农户家庭年收入的样本平均数.
(2)①农户家庭年收入近似服从正态分布.
因为,
所以.
因为,
即,故的数学期望.
所以抽取的100人中知识竞赛成绩超过88分的学生人数的数学期望为16人;
(2)由频率分布直方图可知,分数在和的频率分别为和,
按照分层抽样,抽取10份,其中分数在,应抽取份,
分数在应抽取份,
记事件:抽测的3份试卷来自于不同区间;
事件B:取出的试卷有2份来自区间,
则,,
所以 ,
所以抽测3份试卷有2份来自区间的概率为.
10.(2023下·重庆江北·高二重庆十八中校考阶段练习)为落实体育总局和教育部发布的《关于深化体教融合,促进青少年健康发展的意见》,A市共100000名男学生进行100米短跑训练,在某次短跑测试中,从中抽取100名男生作为样本,统计他们的成绩(单位:秒),整理得到如图所示的频率分布直方图,现规定男生短跑成绩不超过13.5秒为优秀.
(1)估计样本中男生短跑成绩的平均数.(同一组的数据用该组区间的中点值为代表)
(2)根据统计分析,A市男生的短跑成绩X服从正态分布,以(1)中所求的样本平均数作为的估计值,求下列问题:
①若从A市的男生中随机抽取10人,记其中短跑成绩在以外的人数为Y,求;
②在这100名男生中、任意抽取2名成绩优秀的男生的条件下,将该2人成绩纳入全市排名(短跑周时越少、排名越靠前),能进入全市前2275名的人数为x,求x的期望.
附:若,则:,,,
【答案】(1)15
(2)①,②
【分析】(1)先根据各组的频率和为1求出,再利用平均数的定义可求出男生短跑成绩的平均数;
(2)①根据已知条件,结合正态分布的对称性,以及二项分布的概率公式,即可求解;
②先求出100人中成绩优秀的人数,全市短跑成绩在秒内的有2275人,这100人中短跑成绩在秒内的有2人,可能取0,1,2,求出对应的概率,从而可求出期望.
【详解】(1)由频率分布直方图可得,解得,
则样本中男生短跑成绩的平均数为
,
(2)①由(1)可知,则服从正态分布,
所以A市男生的短跑成绩在以外的概率为
,
由题意可得,
所以,
②这100名男生中成绩优秀的有人,
因为,
所以,
所以,
所以全市短跑成绩在秒内的有2275人,这100人中短跑成绩在秒内的有人,
所以可能取0,1,2,
,,,
所以.
0
1
2
3
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.0
0.5000
0.5040
0.5080
0.5120
0.5160
0.5199
0.5239
0.5279
0.5319
0.5359
0.1
0.5398
0.5438
0.5478
0.5517
0.5557
0.5596
0.5636
0.5675
0.5714
0.5753
0.2
0.5793
0.5832
0.5871
0.5910
0.5948
0.5987
0.6026
0.6064
0.6103
0.6141
0.3
0.6179
0.6217
0.6255
0.6293
0.6331
0.6368
0.6404
0.6443
0.6480
0.6517
0.4
0.6554
0.6591
0.6628
0.6664
0.6700
0.6736
0.6772
0.6808,
0.6844
0.6879
0.5
0.6915
0.6950
0.6985
0.7019
0.7054
0.7088
0.7123
0.7157'
0.7190
0.7224
0
1
2
0.25
0.5
0.25
1
2
3
4
5
6
7
8
9
10
11
12
28.7
27.2
31.5
35.8
24.3
33.5
36.3
26.7
28.9
27.4
25.2
34.5
时间段
频数
100
300
m
n
0
1
2
质量指标
频率
竞赛成绩
人数
6
10
18
33
16
11
6
组别
频数
20
30
40
60
30
20
中间值
45
55
65
75
85
95
概率
0.1
0.15
0.2
0.3
0.15
0.1
0
1
2
3
4
5
0
1
2
3
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
0.8643
0.8849
0.9032
0.9192
0.9332
0.9452
0.9554
0.9641
0.9713
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
0.9772
0.9821
0.9861
0.9893
0.9918
0.9938
0.9953
0.9965
0.9974
0
1
2
p
0
2
5
0
30
40
60
70
100
回归模型
模型①
模型②
回归方程
102.28
36.19
0
1
2
3
相关试卷
这是一份高考数学复习解答题提高第一轮专题复习专题08数列求和(奇偶项讨论求和)(典型题型归类训练)(学生版+解析),共33页。
这是一份高考数学复习解答题提高第一轮专题复习专题07数列求和(错位相减法)(典型题型归类训练)(学生版+解析),共22页。
这是一份高考数学复习解答题提高第一轮专题复习专题06数列求和(裂项相消法)(典型题型归类训练)(学生版+解析),共29页。试卷主要包含了解答题等内容,欢迎下载使用。