高中数学高考第9讲 回归分析与独立性检验(解析版)
展开为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为1,2,,建立模型①:;根据2010年至2016年的数据(时间变量的值依次为1,2,,建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
【解析】解:(1)根据模型①:,
计算时,;
利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;
根据模型②:,
计算时,;
利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;
(2)模型②得到的预测值更可靠;
因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,
而从2000年到2009年间递增的幅度较小些,
从2010年到2016年间递增的幅度较大些,
所以,利用模型②的预测值更可靠些.
2.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量,2,,数据作了初步处理,得到如图的散点图及一些统计量的值.
表中,.
附:对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计分别为,.
(1)根据散点图判断和哪一个适宜作为销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)已知这种产品的年利润与、的关系为,根据(2)的结果回答下列问题:
①年宣传费时,年销售量及年利润的预报值是多少?
②年宣传费为何值时,年利润的预报值最大?
【解析】解:(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型;
(2)令,先建立关于的线性回归方程,由于,
,
关于的线性回归方程为,
因此关于的回归方程为;
(3)①由(2)知,当时,年销售量的预报值,
年利润的预报值;
②根据(2)的结果可知,年利润的预报值,
当时,即时年利润的预报值最大.
3.长沙某公司对其主推产品在过去5个月的月广告投入(百万元)和相应的销售额(百万元)进行了统计,其中,2,3,4,5,对所得数据进行整理,绘制散点图并计算出一些统计量如下:
其中,,2,3,4,5.
(1)根据散点图判断,与哪一个适宜作为月销售额关于月广告投入的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及题中所给数据,建立关于的回归方程,并据此估计月广告投入200万元时的月销售额.
附:对于一组数据,,,,,,,其回归直线的斜率和截距的最小二乘估计分别为:,.
【解析】解:(1)根据散点图可知,选择作为回归方程;
(2)令,则,
,,
,
,
故回归方程为,
当月广告投入为200万元时,月销售额为(百万元).
答:选择作为回归方程,当月广告投入为200万元时,月销售额约403.3万元.
4.在党的十九大报告中,习近平总书提出“绿水青山就是金山银山”;为响应总书记的号召,某市旅游局计划共投入4千万元,对全市各旅区的环境进行综合治理,并且对各放游量区收益的增加值作了初步的估计,根据旅游局的治理规划方案,针对各旅游景区在治理后收益的增加值,工作人员绘了下面的频率分布直方图(如图所示),由于操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
(Ⅰ)频率分布直方图中各小长方形的宽度相等,求这个宽度;
(Ⅱ)旅游局在投入4千万元的治理经费下,估计全市旅游景区收量增加值的平均数为多少万元(以各组的区间中点值代表该组的取值)
(Ⅲ)若旅游局投入的不同数额的经费,按照以上的研究方法,得到以下数据:
请将(Ⅱ)的答案填入上表的空白栏,结果显示与之间存在线性相关关系.在优化环境的同时,旅游局还计划使全市旅游景区收益的总额至少增加10万元,试估计旅游局应该对全市旅游景区至少投入多少千万元的治理经费?(答案精确到
附注:回归直线方程中的斜率和截距的最小二乘法估计公式分别为:
,.
【解析】解:(Ⅰ)设各小长方形的宽度为,由频率分布直方图各小长方形面积总和为1可得,
,
解得;(4分)
(Ⅱ)由(Ⅰ)知各小组依次是,,,,,,,,,,,
其中点分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04,
故可估计平均值为;(7分)
(Ⅲ)空白栏中填5.
由题意可知,,
;(8分)
,
;
根据公式可求得:
,
;
所以回归直线方程为;(10分)
当时,;
即旅游局对全市旅游景区至少投入8.12千万元的治理经费.(12分)
高考预测二:独立性检验
5.为了比较两种治疗失眠症的药(分别称为药,药)的疗效,某机构随机地选取20位患者服用药,20位患者服用药,观察这40位患者的睡眠改善情况.这些患者服用一段时间后,根据患者的日平均增加睡眠时间(单位:,以整数部分当茎,小数部分当叶,绘制了如图茎叶图:
(1)根据茎叶图判断哪种药对增加睡眠时间更有效?并说明理由;
(2)求这40名患者日平均增加睡眠时间的中位数,并将日平均增加睡眠时间超过和不超过的患者人数填入如表的列联表:
(3)根据(2)中的列联表,能否有的把握认为,两种药的疗效有差异?
附:.
【解析】解:(1)四个理由,任意一个均可,(答案不唯一)
①从以上茎叶图可以看出,药疗效的试验结果有的叶集中在茎2和3上,而药疗效的试验结果有的叶集中在茎0和1上,由此可看出药的疗效更好.
②从茎叶图的分布情况可以看出,服用药的患者日平均增加睡眠时间的平均数大于2,而服用药的患者日平均增加睡眠时间的平均数小于2,因此可知药的疗效更好.
③由茎叶图可知,服用药的患者日平均增加睡眠时间的中位数是,而服用药的患者日平均增加睡眠时间的中位数是,因此药的疗效更好.
④由茎叶图可知,服用药的患者日平均增加睡眠时间分布在茎2上的最多,关于茎2大致呈对称分布;而服用药的患者日平均增加睡眠时间分布在茎1上的最多,关于茎1大致呈对称分布;又患者在服用两种药后日平均增加睡眠时间分布的区间相同,故可以认为服用药的患者日平均增加睡眠时间比服用药的患者日平均增加睡眠时间更多,因此药的疗效更好.
(2)由茎叶图可知,40组数据的中位数为,
因此列联表如下:
(3)由于;
所以有的把握认为,两种药的疗效有差异.
6.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:,其频率分布直方图如图:
(1)设两种养殖方法的箱产量相互独立,记表示事件“旧养殖法的箱产量低于,新养殖法的箱产量不低于”,估计的概率;
(2)填写下面列联表,并根据列联表判断是否有的把握认为箱产量与养殖方法有关:
(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到.
附:
.
【解析】解:(1)记表示事件“旧养殖法的箱产量低于”, 表示事件“新养殖法的箱产量不低于”,
由(A)(B)(C),
则旧养殖法的箱产量低于,
故(B)的估计值0.62,
新养殖法的箱产量不低于,
故(C)的估计值为,
则事件的概率估计值为(A)(B)(C);
发生的概率为0.4092;
(2)列联表:
则,
由,
有的把握认为箱产量与养殖方法有关;
(3)由新养殖法的箱产量频率分布直方图中,箱产量低于的直方图的面积:
,
箱产量低于的直方图面积为:
,
故新养殖法产量的中位数的估计值为:,
新养殖法箱产量的中位数的估计值.
7.某校为了探索一种新的教学模式,进行了一项课题实验,甲班为实验班,乙班为对比班,甲乙两班的人数均为50人,一年后对两班进行测试,测试成绩的分组区间为,、,、,、,、,,由此得到两个班测试成绩的频率分布直方图:
(Ⅰ)完成下面列联表,你能有的把握认为“这两个班在这次测试中成绩的差异与实施课题实验有关”吗?并说明理由;
(Ⅱ)现从乙班50人中任意抽取3人,记表示抽到测试成绩在,的人数,求的分布列和数学期望.
附:,其中
【解析】解:(Ⅰ)由题意,,,,,(2分)
,(4分)
,
有的把握认为这两个班在这次测试中成绩的差异与实施课题实验有关” (6分)
(Ⅱ)乙班测试成绩在,的有25人,可取0,1,2,3,(8分)
,
,
的分布列是
(10分)
.(12分)
8.某线上学习平台为保证老学员在此平台持续报名学习,以便吸引更多学员报名,从用户系统中随机选出200名学员,对该学习平台的教学成效评价和课后跟踪辅导评价进行了统计,并用以估计所有学员对该学习平台的满意度.其中对教学成效满意率为0.9,课后跟踪辅导的满意率为0.8,对教学成效和课后跟踪辅导都不满意的有10人.
(1)完成下面列联表,并分析是否有把握认为教学成效满意度与跟踪辅导满意度有关.
(2)若用频率代替概率,假设在学习服务协议终止时对教学成效和课后跟踪辅导都满意学员的续签率为,只对其中一项不满意的学员续签率为,对两项都不满意的续签率为.从该学习平台中任选10名学员,估计在学习服务终止时续签学员人数.
附:列联表参考公式:,其中.
临界值:
【解析】解:(1)依题意有
算得的观测值为
故有把握认为教学成效满意度与跟踪辅导满意度有关.
(2)在200人中对平台的双满意的续签人数为,
仅一项满意的续签人数为,都不满意的续签人数为,
所以该平台的续签率为,
从该学习平台中任选10名学员,该平台续签人数为8人.
9.某校高三数学竞赛初赛考试后,对考生的成绩进行统计(考生成绩均不低于90分,满分150分),将成绩按如下方式分成六组,第一组,、第二组,第六组,.图(1)为其频率分布直方图的一部分,若第四、五、六组的人数依次成等差数列,且第六组有4人.
(Ⅰ)请补充完整频率分布直方图,并估计这组数据的平均数;
(Ⅱ)若不低于120分的同学进入决赛,不低于140分的同学为种子选手,完成下面
列联表(即填写空格处的数据),并判断是否有的把握认为“进入决赛的同学
成为种子选手与专家培训有关”.
附:
【解析】解:(Ⅰ)设第四,五组的频率分别为,,则①
②
由①②解得,
从而得出直方图(如图所示)
(Ⅱ)依题意,进入决赛人数为,进而填写列联表如下:
又由,故没有的把握认为“进入决赛的同学成为种子选手与专家培训有关46.6
563
6.8
289.8
1.6
1469
108.8
68
10.3
15.8
1.602
0.46
3.56
投入治理经费(单位:千万元)
1
2
3
4
5
6
7
收益的增加值(单位:万元)
2
3
2
7
7
9
超过
不超过
服用药
服用药
0.01
0.005
0.001
6.635
7.879
10.828
超过
不超过
服用药
14
6
服用药
5
15
箱产量
箱产量
旧养殖法
新养殖法
0.050
0.010
0.001
3.841
6.635
10.828
箱产量
箱产量
总计
旧养殖法
62
38
100
新养殖法
34
66
100
总计
96
104
200
成绩小于100分
成绩不小于100分
合计
甲班
12
50
乙班
50
合计
100
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.204
6.635
7.879
10.828
0
1
2
3
人数
对教学成效满意
对教学成效不满意
合计
对课后跟踪辅导满意
对课后跟踪辅导不满意
合计
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
人数
对教学成效满意
对教学成效不满意
合计
对课后跟踪辅导满意
150
10
160
对课后跟踪辅导不满意
30
10
40
合计
180
20
200
,
,
合计
参加培训
5
8
未参加培训
合计
4
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
,
,
合计
参加培训
5
3
8
未参加培训
15
1
16
合计
20
4
24
2024年高考数学重难点突破专题十 概率与统计第二十九讲 回归分析与独立性检验答案138: 这是一份2024年高考数学重难点突破专题十 概率与统计第二十九讲 回归分析与独立性检验答案138,共6页。试卷主要包含了6.,9+3等内容,欢迎下载使用。
(新高考)高考数学一轮复习讲练测第9章§9.4列联表与独立性检验(含解析): 这是一份(新高考)高考数学一轮复习讲练测第9章§9.4列联表与独立性检验(含解析),共17页。试卷主要包含了635)=0,01,205>2,5+3+4+4,16或a≤34,879等内容,欢迎下载使用。
高中数学高考第9讲 回归分析与独立性检验(原卷版): 这是一份高中数学高考第9讲 回归分析与独立性检验(原卷版),共11页。