(新高考专用)高考数学二轮热点题型归纳与变式演练 专题13 成对数据的统计分析(解析+原卷)学案
展开专题13 成对数据的统计分析
目录
一.考情分析
二.热点题型归纳
【题型一】回归分析在实际问题中的应用
【题型二】独立性检验在实际问题中的应用
【题型三】有关预测与决策问题
三.最新模考题组练
【考情分析】
1.考查特点:(1)统计知识主要考查:抽样方法、样本数字特征、统计图表等,以选择题、填空题形式命题,难度较小;(2)回归分析与独立性检验常与概率交汇命题,也是近年的热点,常出现在第19或20题的位置,以中档题为主.
2.关键能力: 逻辑思维能力、运算求解能力、数学建模能力、创新能力.
3.学科素养:数学抽象、逻辑推理、数学建模、数学运算、数据分析.
【题型一】回归分析在实际问题中的应用
【典例分析】【例1】(2021·长沙统考)某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
他们用两种模型①=x+,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
xiyi
x
7
30
1 464.24
364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:
(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;
(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为:==,=-.
【解析】(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)(ⅰ)剔除异常数据,即3月份的数据后,得
=×(7×6-6)=7.2,
=×(30×6-31.8)=29.64.
xiyi=1 464.24-6×31.8=1 273.44,
x=364-62=328.
====3,
=-=29.64-3×7.2=8.04.
所以y关于x的回归方程为=3x+8.04.
(ⅱ)把x=18代入(ⅰ)中所求回归方程得=3×18+8.04=62.04,
故预报值为62.04万元.
【例2】一个国家的数学实力往往影响着国家的科技发展,几乎所有的重大科技进展都与数学息息相关,我国第五代通讯技术的进步就是源于数学算法的优化.华为公司所研发的Single算法在部署基站时可以把原来的、基站利用起来以节省开支,华为创始人任正非将之归功于“数学的力量”,近年来,我国加大基站建设力度,基站已覆盖所有地级市,并逐步延伸到乡村.
(1)现抽样调查英市所轴的地和地基站覆盖情况,各取100个村,调查情况如下表:
已覆盖
未覆盖
A地
20
80
B地
25
75
视样本的频率为总体的概率,假设从地和地所有村中各随机抽取2个村,求这4个村中地已覆盖的村比地多的概率;
(2)该市2020年已建成的基站数与月份的数据如下表:
1
2
3
4
5
6
7
8
9
10
11
12
283
340
428
547
701
905
1151
1423
1721
2109
2601
3381
探究上表中的数据发现,因年初受新冠疫情影响,基站建设进度比较慢,随着疫情得到有效控制,基站建设进度越来越快,根据散点图分析,已建成的基站数呈现先慢后快的非线性变化趋势,采用非线性回归模型拟合比较合理,请结合参考数据,求基站数关于月份的回归方程.(的值精确到0.01).
附:设,则,,,,,,,对于样本,的线性回归方程有,.
【解析】(1)用样本估计总体,抽到地覆盖的村概率为,抽到地覆盖的村概率为,
地抽到的2个村中基站覆盖的村个数为,则满足二项分布
,
地抽到的2个村中基站覆盖的村个数为,则满足二项分布
,,
从地和地各随机抽取2个村,这4个村中地覆盖的村比地覆盖的村多的概率为
.
(2)由指数模型,设,则,则与是线性相关关系.
因为,,
,,
所以,
,即,即.
【提分秘籍】
1.对于非线性回归分析问题,应先进行变量代换, 求出代换后的回归直线方程,再求非线性回归方程.
2.回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
【变式演练】
1.(2021·贵州凯里一中高三开学考试(理))越接近高考学生焦虑程度越强,四个高三学生中大约有一个有焦虑症,经有关机构调查,得出距离高考周数与焦虑程度对应的正常值变化情况如下表周数
周数x
6
5
4
3
2
1.
正常值y
55
63
72
80
90
99
其中,,,
(1)作出散点图;
(2)根据上表数据用最小二乘法求出y关于x的经验回归方程(精确到0.01)
(3)根据经验观测值为正常值的0.85~1.06为正常,若1.06~1.12为轻度焦虑,1.12~1.20为中度焦虑,1.20及以上为重度焦虑.若为中度焦虑及以上,则要进行心理疏导.若一个学生在距高考第二周时观测值为103,则该学生是否需要进行心理疏导?
【解析】(1) 散点图如下:
(2)因为,
,,
所以所求经验回归方程为:.
(3)因为,为中度焦虑,所以该学生需要进行心理疏导.
2.(2021·济南市历城第二中学高三月考)某公司为了预测下月产品销售情况,找出了近7个月的产品销售量(单位:万件)的统计表:
月份代码
1
2
3
4
5
6
7
销售量(万件)
但其中数据污损不清,经查证,,.
(1)请用相关系数说明销售量与月份代码有很强的线性相关关系;
(2)求关于的回归方程(系数精确到0.01);
(3)公司经营期间的广告宣传费(单位:万元)(),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)
参考公式及数据:,相关系数,当时认为两个变量有很强的线性相关关系,回归方程中斜率和截距的最小二乘估计公式分别为,.
【解析】(1)由折线图中的数据和附注中的参考数据得
, , ,
∴, 因为
所以销售量与月份代码有很强的线性相关关系.
(2) 由及(Ⅰ)得
所以关于的回归方程为
(3)当时,代入回归方程得(万件)
第8个月的毛利润为
,预测第8个月的毛利润不能突破万元.
【题型二】独立性检验在实际问题中的应用
【典例分析】
【例3】(2021·山东青岛市·高三二模)现对某市工薪阶层对于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入(单位:百元)的频数分布及对“楼市限购令”赞成人数如下表:
月收入
频数
5
10
15
10
5
5
赞成人数
4
8
12
5
2
1
(1)根据以上统计数据完成下面的列联表,根据小概率值α=0.025的χ2独立性检验,判断能否有97.5%的把握认为“某市工薪阶层对于‘楼市限购令’的态度与月收入以6500元为分界点有关”?
月收入不低于65百元的人数
月收入低于65百元的人数
合计
赞成
不赞成
合计
(2)若对月收入在和的被调查人中各随机选取两人进行追踪调查,求在选中的4人中有人不赞成的条件下,赞成“楼市限购令”的人数的分布列及数学期望.
附:,.
0.050
0.025
0.010
0.005
0.001
3.841
5.024
6.635
7.879
10.828
【解析】(1)由题意列联表如下:
月收入不低于65百元的人数
月收入低于65百元的人数
合计
赞成
3
29
32
不赞成
7
11
18
合计
10
40
50
,
根据小概率值α=0.025的χ2独立性检验,有97.5%的把握认为“某市工薪阶层对于‘楼市限购令’的态度与月收入以6500元为分界点有关”
(2)的取值分别是,,
,
,,
记4人中有人不赞成为事件,则,
,
同理,,,,
所以的分布列为:
0
1
2
3
4
0
.
【提分秘籍】
独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个随机事件有关系”犯错误概率的显著性水平α,然后查表确定分位数k.
(2)利用公式,计算随机变量χ2.
(3)如果χ2>k,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.
【变式演练】
1.(2021·吉林长春市·东北师大附中高三其他模拟(理))近日,为进一步做好新冠肺炎疫情防控工作,某社区以网上调查问卷形式对辖区内部分居民做了新冠疫苗免费接种的宣传和调查.调查数据如下:共95份有效问卷,40名男性中有10名不愿意接种疫苗,55名女性中有5名不愿意接种疫苗.
(1)根据所给数据,完成下面的2×2列联表,并根据列联表,根据小概率值α=0.050的χ2独立性检验,判断判断是否有95%的把握认为是否愿意接种疫苗与性别有关?
愿意接种
不愿意接种
合计
男
女
合计
(2)从不愿意接种的15份调查问卷中得到拒绝接种新冠疫苗的原因:有3份身体原因不能接种;有2份认为新冠肺炎已得到控制,无需接种:有4份担心疫苗的有效性:有6份担心疫苗的安全性.求从这15份问卷中随机选出2份,在已知至少有一份担心疫苗安全性的条件下,另一份是担心疫苗有效性的概率.
附:
0.050
0.010
0.005
3.841
6.635
7.879
【解析】(1)
愿意接种
不愿意接种
合计
男
30
10
40
女
50
5
55
合计
80
15
95
根据小概率值α=0.050的χ2独立性检验,有的把握认为是否愿意接种疫苗与性别有关.
(2)设事件A为至少有一份担心疫苗安全性,事件B为另一份担心疫苗有效性,
则,,
所以.
【题型三】有关预测与决策问题
【典例分析】
【例4】(2021·山东淄博市·实验中学高三模拟)某市在司法知识宣传周活动中,举办了一场司法知识网上答题考试,要求本市所有机关、企事业单位工作人员均要参加考试,试题满分为100分,考试成绩大于等于90分的为优秀.考试结束后,组织部门从所有参加考试的人员中随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64.假设该市机关、企事业单位工作人员有20万人,考试成绩服从正态分布.
(1)估计该市此次司法考试成绩优秀者的人数有多少万人?
(2)该市组织部门为调动机关、企事业单位工作人员学习司法知识的积极性,制定了如下奖励方案:所有参加考试者,均可参与网上“抽奖赢手机流量”活动,并且成绩优秀者可有两次抽奖机会,其余参加者抽奖一次.抽奖者点击抽奖按钮,即随机产生一个两位数,若产生的两位数的数字相同,则可获赠手机流量5G,否则获赠手机流量1G.假设参加考试的所有人均参加了抽奖活动,试估计此次抽奖活动赠予的手机流量总共有多少G?
参考数据:若,则
【解析】(1)由题意,随机抽取了200人的成绩作为统计样本,得到样本平均数为82、方差为64,
即,所以考试成绩优秀者得分,即.
又由,得.
所以估计该市此次司法考试成绩优秀者人数可达万人.
(2)设每位抽奖者获赠的手机流量为G,则的值为1,2,5,6,10.
可得,
,
,
,
.
所以随机变量的分布列为:
1
2
5
6
10
所以(G).
因此,估计此次抽奖活动赠予的手机流量总值为(万G).
【变式演练】
(2021•青羊区校级模拟)2021年3•15期间,某家具城举办了一次家具有奖促销活动,消费每超过1万元(含1万元),均可抽奖一次,抽奖方案有两种,顾客只能选择其中的一种.方案一:从装有10个形状与大小完全相同的小球(其中红球2个,白球1个,黑球7个)的抽奖盒中,一次性摸出3个球,其中奖规则为:若摸到2个红球和1个白球,则打5折;若摸出2个红球和1个黑球则打7折;若摸出1个白球2个黑球,则打9折:其余情况不打折.方案二:从装有10个形状与大小完全相同的小球(其中红球2个,黑球8个)的抽奖盒中,有放回每次摸取1球,连摸3次,每摸到1次红球,立减2000元.
(1)若一位顾客消费了1万元,且选择抽奖方案一,试求该顾客享受7折优惠的概率;
(2)若某顾客消费恰好满1万元,试从数学期望的角度比较该顾客选择哪一种抽奖方案更合算?
【分析】(1)利用古典概型的概率公式求解即可;
(2)先求出方案一的随机变量X的可能取值,然后求出其对应的概率,列出分布列,由数学期望的计算公式求解,然后再利用方案二满足二项分布,由二项分布的数学期望公式求解,最后进行比较即可得到答案.
【解答】解:(1)选择方案一,若享受到7折,则需要摸出2个红球和1个黑球,
故该顾客享受7折优惠的概率为=;
(2)若选择方案一,
设付款金额为X元,则X的可能取值为5000,7000,9000,10000,
所以P(X=5000)==,
P(X=7000)==,
P(X=9000)==,
P(X=10000)=1﹣﹣﹣=,
故E(X)=5000×+7000×+9000×+10000×=元;
若选择方案二,
设摸到红球的个数为Y,付款金额为Z,则Z=10000﹣2000Y,
由已知可得Y~B(3,),
所以E(Y)=3×=,
故E(Z)=E(10000﹣2000Y)=10000﹣2000E(Y)=8800元.
因为E(X)>E(Z),
故该顾客选择第二种抽奖方案更合算.
1.春节是中国人的团圆节,年春节期间,某超市为了给“就地过年”的外来务工人员营造温馨的新春佳节氛围,在月日至月日期间举行购物抽奖活动,活动规定:凡是一次性购物满元的顾客就可以从装有个球(其中个球上写有“牛转乾坤”,另个球上写有“谢谢惠顾”,每个球除写的字不同外,其他都相同)的抽奖箱中一次性摸出个球,只有摸到“牛转乾坤”才能获奖,若个球都是“牛转乾坤”,则获一等奖,奖励元;若有个球是“牛转乾坤”,则获二等奖,奖励元;若只有个球是“牛转乾坤”,则获三等奖,奖励元.
(1)若一位顾客在此活动期间购物满元并且参加抽奖,求这位顾客中奖的概率;
(2)经统计,月日有人次购物满元,其中有人次没有参加抽奖,设参加一次抽奖所得奖金的金额为元,试求的分布列,并求月日该超市发放奖金总金额的数学期望.
【解析】(1)解法一:设一位顾客在此活动期间购物满元参加抽奖且中奖为事件,参加抽奖且中一等奖为事件,参加抽奖且中二等奖为事件,参加抽奖且中三等奖为事件,则,
.
一位顾客在此活动期间购物满元参加抽奖且中奖的概率为.
解法二:一位顾客在此活动期间购物满元且参加抽奖,设中奖为事件,则事件的对立事件为,为一位顾客在此活动期间购物满元参加抽奖且没有中奖,即摸出的个球都是“谢谢惠顾”,
,
一位顾客在此活动期间购物满元参加抽奖且中奖的概率为;
(2)依题意得:的所有可能取值为,,,,
,,,,
的分布列为:
数学期望,
月日该超市发放奖金总金额的数学期望为元.
2.(2021·海南中学高三模拟)从去年开始,全国各地积极开展“一盔一带”安全守护行动,倡导群众佩戴安全头盔、使用安全带.为了解相关的情况,某学习小组统计了国内20个城市的电动自行车头盔佩戴率和电动自行车驾乘人员交通事故死亡率,并整理得到下面的散点图.
(1)求这20个城市的电动自行车头盔佩戴率大于50%的概率;
(2)通过散点图分析与的相关关系,说明佩戴安全头盔的必要性;
(3)有四名同学通过计算得到与的相关系数分别为0.97,0.62,,,请你从中选出最有可能正确的结果,并以此求出关于的线性回归方程.
参考数据:,,,.参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
【解析】(1)电动自行车头盔佩戴率大于50%的城市有10个,故所求的概率为.
(2)由散点图可知与有较强的负相关关系,提高电动自行车头盔佩戴率能有效降低驾乘人员交通事故死亡率,所以佩戴安全头盔十分有必要.
(3)最有可能正确的结果为.
根据参考数据得,,
所以,
,
所以关于的线性回归方程为.
3.中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了100名学生进行调查,调查样本中有40名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“嫦娥五号”的部分).
关注
没关注
合计
男
女
合计
附:
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
,其中
(1)完成上面的2×2列联表,并计算回答是否有95%的把握认为“对‘嫦娥五号’关注程度与性别有关”?
(2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量,求的分布列及数学期望.
【解析】(1)列联表如下:
关注
没关注
合计
男
30
30
60
女
12
28
40
合计
42
58
100
所以,
所以有95%的把握认为“对‘嫦娥五号’关注程度与性别有关”;
(2)因为随机选一个高三的女生,对此事关注的概率为,
又因为,所以随机变量的分布列为:
0
1
2
3
故.
4.随着5G通讯技术的发展成熟,移动互联网短视频变得越来越普及,人们也越来越热衷于通过短视频获取资讯和学习成长.某短视频创作平台,为了鼓励短视频创作者生产出更多高质量的短视频,会对创作者上传的短视频进行审核,通过审核后的短视频,会对用户进行重点的分发推荐.短视频创作者上传一条短视频后,先由短视频创作平台的智能机器人进行第一阶段审核,短视频审核通过的概率为,通过智能机器人审核后,进入第二阶段的人工审核,人工审核部门会随机分配3名员工对该条短视频进行审核,同一条短视频每名员工审核通过的概率均为,若该视频获得2名或者2名以上员工审核通过,则该短视频获得重点分发推荐.
(1)某创作者上传一条短视频,求该短视频获得重点分发推荐的概率;
(2)若某创作者一次性上传3条短视频作品,求其获得重点分发推荐的短视频个数的分布列与数学期望.
【解析】(1)设“该短视频获得重点分发推荐”为事件,
则.
(2)设其获得重点分发推荐的短视频个数为随机变量,可取.
则,
;;
;,
随机变量的分布列如下:
.(或)
5.(2021·东北育才学校高三模拟)学校食品安全问题关系着师生的身心健康,一直受到社会各界的高度关注.为进一步加强学校食堂安全管理,某市卫生监督部门决定对本市所有学校进行一次食品安全抽查.某中学按照要求,将卫生监督部门当天检查的所售菜品取样分成甲、乙两组,甲组菜品有不同的荤菜份和不同的素菜份,乙组菜品有荤菜份和不同的素菜份,已知从甲组菜品中随机任取两份菜样,在第一次抽到素菜的条件下,第二次抽到荤菜的概率是.
(1)求的值;
(2)若卫生监督部门第一次从甲组中随机抽取一份菜样,从第二次抽样开始,若前一次抽到荤菜,则再从甲组中抽取一份;若前一次抽到素菜,则再从乙组中抽取一份,第三次抽样后结束,每次抽取菜样都不放回.已知荤菜检测费用为元/份,素菜检测费用为元/份,求本次抽查检测费用的分布列和数学期望.
【解析】(1)设第一次抽到素菜为事件A,第二次抽到荤菜为事件B,
∴,,
∵,∴.
(2)设卫生监督部门抽样结束后,抽取荤菜的份数为,检测费用为,其中可以取,则的可能取值为180,200,220,240.
,
,
,
.
所以检测费用的分布列为
所以检测费用的数学期望为(元).
6.某病毒在进入人体后有潜伏期,患者在潜伏期内无任何症状,但已具传染性.假设一位病毒携带者在潜伏期内每天有n位密接者,每位密接者被感染的概率为p,
(1)若,,求一天内被一位病毒携带者直接感染人数X的分布列和均值:
(2)某定点医院为筛查某些人员是否感染此病毒,需要检测血液样本是否为阳性,有以下两种检验方式:
①逐份检验,即k份血液样本需要检验k次;
②混合检验,即将k份(且)血液样本分别取样混合在一起检验,若检验结果为阴性,则这k份血液样本全为阴性,因而这k份血液样本只要检验一次就够了:如果检验结果为阳性,为了明确这k份血液样本究竞哪份为阳性,就要对k份血液样本再逐份检验,此时这k份血液样本的检验次数为k+1次.
假设样本的检验结果相互独立,且每份样本检验结果是阳性的概率为,为使混合检验需要的检验的总次数的期望值比逐份检验的总次数的期望值更少,求k的取值范围.
参考数据:,,,,.
【解析】(1)若n=3,p=,依题意可知X服从二项分布,即X~B(3,),
从而,i=0,1,2,3.
随机变量X的分布列为:
X
0
1
2
3
P
随机变量X的均值为.
(2)由题意知ζ的所有可能取值为1,,且,,
∴,
又∵E(η)=k,依题意E(ζ)<E(η),即:k+1-k(1-p)k<k,∴<(1-p)k,
∵p=1-,∴<()k,∴lnk>k.
设,则,所以时,,时,,
所以f(x)在(0,3)上单调递增,在(3,+∞)上单调递减,
由于f(1)=<0,f(2)=ln2->0,
f(4)=ln4-=0.0530>0,f(5)=ln5-=-0.0573<0,
故k的取值范围为且k∈N*.
(新高考专用)高考数学二轮热点题型归纳与变式演练 专题04 函数与导数的综合应用(解析+原卷)学案: 这是一份(新高考专用)高考数学二轮热点题型归纳与变式演练 专题04 函数与导数的综合应用(解析+原卷)学案,文件包含新高考专用高考数学二轮热点题型归纳与变式演练专题04函数与导数的综合应用解析版docx、新高考专用高考数学二轮热点题型归纳与变式演练专题04函数与导数的综合应用原卷版docx等2份学案配套教学资源,其中学案共36页, 欢迎下载使用。
(新高考专用)高考数学二轮热点题型归纳与变式演练 专题01 函数的图象和性质(解析+原卷)学案: 这是一份(新高考专用)高考数学二轮热点题型归纳与变式演练 专题01 函数的图象和性质(解析+原卷)学案,文件包含新高考专用高考数学二轮热点题型归纳与变式演练专题01函数的图象和性质解析版docx、新高考专用高考数学二轮热点题型归纳与变式演练专题01函数的图象和性质原卷版docx等2份学案配套教学资源,其中学案共25页, 欢迎下载使用。
(新高考专用)高考数学二轮热点题型归纳与变式演练 专题15 圆锥曲线的定义、方程与性质(解析+原卷)学案: 这是一份(新高考专用)高考数学二轮热点题型归纳与变式演练 专题15 圆锥曲线的定义、方程与性质(解析+原卷)学案,文件包含新高考专用高考数学二轮热点题型归纳与变式演练专题15圆锥曲线的定义方程与性质解析版docx、新高考专用高考数学二轮热点题型归纳与变式演练专题15圆锥曲线的定义方程与性质原卷版docx等2份学案配套教学资源,其中学案共33页, 欢迎下载使用。