所属成套资源:【精品原创】人教A版(2019)高中数学选择性必修第三册(含答案解析)
高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用精品课时作业
展开
这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用精品课时作业,共27页。试卷主要包含了0分),86%的城镇居民年人均消费,64,e8,【答案】D等内容,欢迎下载使用。
绝密★启用前
8.2一元线性回归模型及其应用同步练习
人教A版(2019)高中数学选择性必修第三册
注意:本试卷包含Ⅰ、Ⅱ两卷。第Ⅰ卷为选择题,所有答案必须用2B铅笔涂在答题卡中相应的位置。第Ⅱ卷为非选择题,所有答案必须填在答题卷的相应位置。答案写在试卷上均无效,不予记分。
一、单选题(本大题共12小题,共60.0分)
1. 有以下五组变量:
①某商品的销售价格与销售量;
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮销售量;
⑤电瓶车的重量和行驶每千米的耗电量.
其中两个变量成正相关的是( )
A. ①③ B. ②④ C. ②⑤ D. ④⑤
2. 对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A. 由样本数据得到的线性回归方程y=bx+a必过样本点的中心(x,y)
B. 残差平方和越小的模型,拟合的效果越好
C. 用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D. 若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系
3. 对于一组具有线性相关关系的数据(xi,yi)(i=1,2,3,⋯,n),根据最小二乘法求得回归直线方程为y=bx+a,则以下说法正确的是( )
A. 至少有一个样本点落在回归直线y=bx+a上
B. 预报变量y的值由解释变量x唯一确定
C. 相关指数R2越小,说明该模型的拟合效果越好
D. 在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高
4. 某经济与社会发展研究所为了研究我国城镇居民人均年消费变化趋势,对2015∼2019年人均年消费(单位:元)进行统计,统计数据如下表所示:
年份
2015
2016
2017
2018
2019
年份代码t
1
2
3
4
5
年人均消费y
26467
28843
31193
33616
36641
根据数据求得人均年消费y与年份代码t的回归直线方程为y=2512t+23816,相关指数R2=0.9972(附:0.9972≈0.9986),则下列结论错误的是
A. 我国城镇居民人均年消费y与年份代码t线性正相关
B. 数据(3,31193)的残差为−159
C. 我国2020年城镇居民人均年消费约38888元
D. 年份解释了99.86%的城镇居民年人均消费
5. 下列四个命题:
①残差平方和越小的模型,拟合的效果越好;
②用相关指数R2来刻画回归效果,R2越小,说明模型拟合的效果越好;
③散点图中所有点都在回归直线附近;
④随机误差e满足E(e)=0,其方差D(e)的大小可用来衡量预报精确度.
其中正确命题的个数是( )
A. 1 B. 2 C. 3 D. 4
6. 下列说法:①对于独立性检验,χ2的值越大,说明两事件相关程度越大;②以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,将其变换后得到线性方程z=0.3x+4,则c,k的值分别是e4和0.3;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程y=a+bx中,b=2,x=1,y=3,则a=1;④通过回归直线y=bx+a及回归系数b,可以精确反映变量的取值和变化趋势,其中正确的个数是( )
A. 1 B. 2 C. 3 D. 4
7. 在用最小二乘法进行线性回归分析时,有下列说法:①由样本x1,y1,x2,y2,…,xn,yn得到回归直线,可能该样本中的样本点都不在回归直线上;
②残差图中的残差点比较均匀地落在水平的带状区域中,宽度越窄,则说明模型拟合精度越高;③利用R2=1−i=1nyi−yi2i=1nyi−y2来刻画回归的效果,R2≈0.75比R2≈0.64的模型回归效果好.以上说法正确的( )
A. ①② B. ①③ C. ②③ D. ①②③
8. 已知一系列样本点(xi,yi)(i=1,2,3,…,n)的回归直线方程为y=2x+a,若样本点(r,1)与(1,s)的残差相同,则有( )
A. r=s B. s=2r C. s=−2r+3 D. s=2r+1
9. 下列关于回归分析的说法中错误的是( )
A. 回归直线一定过样本中心点(x,y)
B. 残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适
C. 若甲、乙两个模型的相关指数R2分别约为0.98和0.80,则模型乙的拟合效果更好
D. 两个模型中残差平方和越小的模型拟合的效果越好
10. 以下有关线性回归分析的说法不正确的是( )
A. 通过最小二乘法得到的线性回归直线经过样本的中心(x,y)
B. 相关系数r越小,表明两个变量相关性越弱
C. 最小二乘法求回归直线方程,是求使i=1n(yi−bxi−a)2 最小的a,b的值
D. R2越接近1,表明回归的效果越好
11. 对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是( )
A. 由样本数据得到的线性回归方程y=bx+a必过样本点的中心(x,y)
B. 残差平方和越小的模型,拟合的效果越好
C. 用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好
D. 若变量y和x之间的相关系数r=-0.936 2,则变量y与x之间具有线性相关关系
12. 有如下几个结论:
①相关指数R2越大,说明残差平方和越小,模型的拟合效果越好;
②回归直线y=bx+a.一定过样本点的中心(x,y);
③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适;
④在独立性检验中,若公式K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)中的|ad−bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数是( )
A. 1 B. 3 C. 2 D. 4
二、多空题(本大题共5小题,共25.0分)
13. 商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.
项目落地国
中国
南亚某国
投资额x(亿元)
10
11
12
13
14
10
11
12
13
14
利润y(亿元)
11
12
14
16
19
12
13
13
14
15
请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 ,并根据回归直线方程预计在该国投资15亿元所获得的利润是 亿元
参考数据和公式:i=15xi−x2=10,中国i=15xi−xyi−y=20,南亚某国i=15xi−xyi−y=7,b=i=15xi−xyi−yi=15xi−x2,a=y−bx.
14. 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:
时间
1
2
3
4
5
命中率
0.4
0.5
0.6
0.6
0.4
小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李每月6号打篮球6小时的投篮命中率为
15. 如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①y=−30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②y=99+17.5t.利用这两个模型,该地区2018年的环境基础设施投资额的预测值分别为 , ;并且可以判断利用模型 得到的预测值更可靠.
16. 若用最小二乘法求得回归方程y=0.67x+54.9,则当x=5时,y的值为 (1) ;若回归方程是由下面数据求得的,则a的值为 (2) .
x
10
20
30
40
50
y
62
a
75
81
89
17. 商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联,如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.
项目落地国
中国
南亚某国
投资额x(亿元)
10
11
12
13
14
10
11
12
13
14
利润y(亿元)
11
12
14
16
19
12
13
13
14
15
请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 ,并根据回归直线方程预计在该国投资15亿元所获得的利润是 亿元.
参考数据和公式:i=15(xi−x)2=10,中国i=15(xi−x)(yi−y)=20,南亚某国i=15(xi−x)(yi−y)=7,b=i=15(xi−x)(yi−y)i=15(xi−x)2,a=y−bx.
三、解答题(本大题共6小题,共72.0分)
18. 某企业为了提升行业竞争力,加大了科技研发资金投入.该企业连续6年来的科技投入x(百万元)与收益y(百万元)的数据统计如下:
科技投入x
2
4
6
8
10
12
收益y
5.6
6.5
12.0
27.5
80.0
129.2
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线y=c·2bx的周围,据此他对数据进行了一些初步处理.如下表:
y
z
i=16(xi−x)(yi−y)
i=16(xi−x)(zi−z)
i=16(yi−y)2
i=16(xi−x)2
43.5
4.5
854.0
34.7
12730.4
70.0
其中zi=log2yi,z=16i=16zi.
(1)①请根据表中数据,建立y关于x的回归方程(保留一位小数);
②根据所建立的回归方程,若该企业想在下一年收益达到2亿元,则科技投入的费用至少要多少?(其中log25≈2.3)
(2)乙认为样本点分布在二次曲线y=mx2+n的周围,并计算得回归方程为y=0.92x2−12.0,以及该回归模型的相关指数R2=0.94,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线方程v=α+βu的斜率和截距的最小二乘估计分别为β=i=1n(ui−u)(vi−v)i=1n(ui−u)2,α=v−βu,相关指数:R2=1−i=1n(vi−vi)2i=1n(vi−v)2.
.
19. 2018年11月5日至10日,首届中国国际进口博览会在国家会展中心(上海)举行,吸引了58个“一带一路”沿线国家的超过1000多家企业参展,成为共建“一带一路”的又一个重要支撑.某企业为了参加这次盛会,提升行业竞争力,加大了科技投入.该企业连续6年来的科技投入x(百万元)与收益y(百万元)的数据统计如下:
科技投入x
2
4
6
8
10
12
收益y
5.6
6.5
12.0
27.5
80.0
129.2
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线y=c⋅2bx的周围,据此他对数据进行了一些初步处理.如下表:
y
z
i=16xi−xyi−y
i=16xi−xzi−z
i=16yi−y2
i=16xi−x2
43.5
4.5
854.0
34.7
12730.4
70
其中zi=log2yi,z=16i=16zi.
(1)(i)请根据表中数据,建立y关于x的回归方程(保留一位小数);
(ii)根据所建立的回归方程,若该企业想在下一年收益达到2亿,则科技投入的费用至少要多少?(其中log25≈2.3)
(2)乙认为样本点分布在二次曲线y=mx2+n的周围,并计算得回归方程为y=0.92x2−12.0,以及该回归模型的相关指数R2=0.94,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据u1,v1,u2,v2,…,un,vn,其回归直线方程v=α+βu的斜率和截距的最小二乘估计分别为β=i=1nui−uvi−vi=1nui−u2,α=v−βu,相关指数:R2=1−i=1nvi−vi2i=1nvi−v2.
20. 某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度x ℃时相对应产卵数个数为y的8组数据,为了对数据进行分析,他们绘制了如下散点图:
(Ⅰ)根据散点图,甲、乙两位同学分别用y=bx+a和z=dx+c(其中z=lny)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数R2更接近1;(给出判断即可,不必说明理由)
(Ⅱ)根据(Ⅰ)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程;(方程表示为y=f(x)的形式,数据计算结果保留两位小数)
x
y
z
i=18xiyi
i=18xizi
i=18xi2
26
72
3.3
11871
757
5722
(Ⅲ)据测算,若一只此种昆虫的产卵数超过e4,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在25 ℃左右,试利用(Ⅱ)中的回归方程预测,近期当地是否会发生虫害.
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=i=1nuivi−nuvi=1nui2−nu2,α=v−βu.
21. 某校高二生物研究性学习小组的同学们为了研究当地某种昆虫的产卵数与温度的变化关系,他们收集了一只该种昆虫在温度时相对应产卵数个数为y的8组数据,为了对数据进行分析,他们绘制了如下散点图:
(1)根据散点图,甲、乙两位同学分别用y=bx+a和其中z=lny)两种模型进行回归分析,试判断这两位同学得到的回归方程中,哪一个的相关指数R2更接近1;(给出判断即可,不必说明理由)
(2)根据(1)的结论选定上述两个模型中更适宜作为对昆虫产卵数与温度变化关系进行回归分析的模型,并利用下表中数据,计算该模型的回归方程:(方程表示为y=fx的形式,数据计算结果保留两位小数)
x
y
z
i=18xiyi
i=18xizi
i=18xi2
26
72
3.3
11871
757
5722
(3)据测算,若只此种昆虫的产卵数超过e4,则会发生虫害.研究性学习小组的同学通过查阅气象资料得知近期当地温度维持在左右,试利用(2)中的回归方程预测近期当地是否会发生虫害.
附:对于一组数据u1,v1,u2,v2,⋯,un,vn,其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=i=1nulvi−nuvi=1nui2−nu2,α=v−βu.
22. 首届中国国际进口博览会在国家会展中心(上海)举行,吸引了58个“一带一路”沿线国家的超过1000多家企业参展,成为共建“一带一路”的又一个重要支撑.某企业为了参加这次盛会,提升行业竞争力,加大了科技投入.该企业连续6年来的科技投入x(百万元)与收益y(百万元)的数据统计如下:
科技投入x
2
4
6
8
10
12
收益y
5.6
6.5
12.0
27.5
80.0
129.2
并根据数据绘制散点图如图所示:
根据散点图的特点,甲认为样本点分布在指数曲线y=c⋅2bx的周围,据此他对数据进行了一些初步处理.如下表:
y
z
i=16(xi−x)(yi−y)
i=16(xi−x)(zi−z)
i=16(yi−y)2
i=16(xi−x)2
43.5
4.5
854.0
34.7
12730.4
70
其中zi=log2yi,z=16i=16zi.
(1)(i)请根据表中数据,建立y关于x的回归方程(保留一位小数);
(ii)根据所建立的回归方程,若该企业想在下一年收益达到2亿,则科技投入的费用至少要多少?(其中log25≈2.3)
(2)乙认为样本点分布在二次曲线y=mx2+n的周围,并计算得回归方程为y=0.92x2−12.0,以及该回归模型的相关指数R2=0.94,试比较甲乙两人所建立的模型,谁的拟合效果更好.
附:对于一组数据u1,v1,u2,v2,u3,v3,⋅⋅⋅,un,vn,其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β=i=1nvi−vui−ui=1nui−u2,α=v−βu.相关指数:R2=1−i=1n(vi−vi)2i=1n(vi−v)2.
23. 一只药用昆虫的产卵数y与一定范围内的温度x有关,现收集了该种药用昆虫的6组观测数据如表:
温度x/℃
21
23
24
27
29
32
产卵数y/个
6
11
20
27
57
77
经计算得:x=16i=16xi=26,y=16i=16yi=33,i=16(xi−x)(yi−y)=557,i=16(xi−x)2=84,i=16(yi−y)2=3930,线性回归模型的残差平方和i=16(yi−yi)2=236.64,e8.0605≈3167,其中xi,yi分别为观测数据中的温度和产卵数,i=1,2,3,4,5,6.
(Ⅰ)若用线性回归模型,求y关于x的回归方程y=bx+a(精确到0.1);
(Ⅱ)若用非线性回归模型求得y关于x的回归方程为y=0.06e0.2303x,且相关指数R2=0.9522.
(i)试与(Ⅰ)中的回归模型相比,用R2说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为35°C时该种药用昆虫的产卵数(结果取整数).
附:一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线y=bx+a(的斜率和截距的最小二乘估计为b=i=1n(xi−x)(yi−y)i=1n(xi−x)2,a=y−bx;相关指数R2=1−i=1n(yi−yi)2i=1n(yi−y)2.
答案和解析
1.【答案】D
【解析】
【分析】
本题考查了通常状况下两个变量是否具有正相关关系的应用问题,是基础题.
根据题意,对题目中的每组变量之间的关系判断是否为正相关关系即可.
【解答】
解:对于①,一般情况下,某商品的销售价格与销售量成负相关关系;
对于②,学生的学籍号与学生的数学成绩没有相关关系;
对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;
对于④,一般情况下,气温与冷饮销售量成正相关关系;
对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.
综上所述,其中两个变量成正相关的序号是④⑤.
故选:D.
2.【答案】C
【解析】
【分析】
本题考查回归分析,属基础题.
根据选项逐一分析即可.
【解答】
解:对于A,样本中心点在直线上,故A正确;
对于B,残差平方和越小的模型,拟合效果越好,故B正确;
对于C,R2越大拟合效果越好,故C不正确;
对于D,变量 y和 x之间的相关系数 r=−0.9362,表示两个变量具有线性负相关关系,故D正确.
故选C.
3.【答案】D
【解析】
【分析】
本题主要考查回归直线方程及回归分析的应用,相关指数、残差图的应用,属于基础题.
根据回归直线方程、回归分析及相关指数、残差图的应用,逐一分析判断可得.
【解答】
解:对于一组具有线性相关关系的数据(xi,yi),可能所有的样本点都不在回归直线y=bx+a上,故A错误;
预报变量y的值由解释变量x进行估计,故B错误;
相关指数R2越小,残差平方和越大,说明该模型的拟合效果越不好,故C错误;
在残差图中,残差点分布水平带状区域的宽度越窄,则回归方程的预报精确度越高,故D正确.
故选:D.
4.【答案】D
【解析】
【分析】
本题主要考查线性回归方程,考查残差,正负相关性.根据所给的回归直线方程为y=2512t+23816,逐项判断正误即可.
【解析】
解:由题知,b=2512>0,∴我国城镇居民人均年消费y与年份代码t线性正相关,故A正确;
将t=3代入回归直线方程得17年预报值为31352,∴数据(3,31193)的残差为31193−31352=−159,故B正确;
将t=6代入回归直线方程得20年预报值为38888,故C正确;
由R2的意义知D不正确.
故选D.
5.【答案】B
【解析】
【分析】
本题考查回归分析的基本思想.
根据回归分析中相关指数,残差平方和的意义,以及回归直线的原理,依次判断选项即可.
【解答】
解:根据回归方程的性质得到:
①残差平方和越小的模型,拟合的效果越好,故①正确;
②用相关指数R2来刻画回归效果,R2越靠近1,说明拟合效果越好,越靠近0,拟合效果越不好,故②不正确;
③散点图中所有点都在回归直线附近,不正确,应该是大部分点都在回归直线附近,而不是所有点,故③不正确;
④随机误差e满足E(e)=0,其方差D(e)的大小用来衡量预报的精确度,④正确,
综上,正确命题的个数为2.
故答案为B.
6.【答案】C
【解析】
【分析】
本题考查了回归直线方程、非线性回归方程变换以及独立性检验相关知识,考查推理能力,属于中等题.
对4个命题分别进行判断,即可得出结论.
【解答】
解:对于命题①,根据独立性检验的性质知,两个分类变量χ2越大,说明两个分类变量相关程度越大,命题①正确;
对于命题②,由y=cekx,两边取自然对数,可得lny=lnc+kx,
令z=lny,得z=kx+lnc,又z=0.3x+4,
所以lnc=4k=0.3,则c=e4k=0.3,命题②正确;
对于命题③,回归直线方程y=a+bx中,a=y−bx=3−2×1=1,命题③正确;
对于命题④,通过回归直线y=bx+a及回归系数b,可估计和预测变量的取值和变化趋势,命题④错误.
故选:C.
7.【答案】D
【解析】
【分析】
本题主要考查线性相关指数的理解,考查线性回归方程的特征,属于基础题.
线性回归方程一定过样本中心点,但不一定过样本中的点,可以用来衡量模拟效果好坏的几个量分别是相关指数,残差平方和和相关系数,只有残差平方和越小越好,其他的都是越大越好.
【解答】
解:利用最小二乘法所求得的回归直线一定过样本点的中心(x,y),但是样本中的点x1,y1,x2,y2,…,xn,yn,可能都不在回归直线上,故①正确;
残差点比较均匀地落在水平的带状区域中,这样的带状区域的宽度越窄,说明模型拟合精度越高,故②正确;
由于R2越大拟合效果越好,故③正确;
故选D.
8.【答案】C
【解析】
【分析】
本题考查回归直线方程,可线性化的回归分析,属于基础题.
由题意,根据残差的概念可得结论.
【解答】
解:样本点(r,1)的残差为2r+a−1,样本点(1,s)的残差为2+a−s,
依题意2r+a−1=2+a−s,故s=−2r+3,
故选C.
9.【答案】C
【解析】
【分析】
本题主要考查线性相关指数的理解,解题的关键是理解对于拟合效果好坏的几个量的大小反映的拟合效果的好坏,比较基础.
可以用来衡量模拟效果好坏的几个量分别是相关指数,残差平方和和相关系数,只有残差平方和越小越好,其他的都是越大越好.
【解答】
解:对于A,回归直线一定过样本中心,故A正确;
对于B,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.故B正确;
对于C,R2取值越大,说明残差平方和越小,模型的拟合效果越好,又∵甲、乙两个模型的相关指数R2的值分别约为0.98和0.80,0.98>0.80,∴甲模型的拟合效果好,故C不正确;
对于D,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故D正确.
故选C.
10.【答案】B
【解析】
【分析】
本题考查线性回归方程,考查学生对线性回归方程的理解,属于中档题.
根据线性回归方程、最小二乘法、相关指数的定义和性质分别进行判断即可.
【解答】
解:由于线性回归直线经过样本的中心x,y,故A正确;
由于相关系数r的绝对值越小,表明两个变量相关性越弱,故B不正确;
由于用最小二乘法求回归直线方程,是寻求使i−1nyi−bxi−a2最小的a,b的值,故C正确;
由于R2=1−i=1nyi−yi^ 2i=1nyi−y2越接近1,表明回归的效果越好,故D正确.
故选B.
11.【答案】C
【解析】
【试题解析】
【分析】
本题考查回归分析,属基础题.
根据选项逐一分析即可.
【解答】
解:对于A,样本中心点在直线上,故A正确;
对于B,残差平方和越小的模型,拟合效果越好,故B正确;
对于C,R2越大拟合效果越好,故C不正确;
对于D,变量 y和 x之间的相关系数 r=−0.9362,表示两个变量具有线性负相关关系,故D正确.
故选C.
12.【答案】D
【解析】
【分析】
本题考查了回归直线方程,回归分析,相关指数及独立性检验,属于基础题.
对用来衡量模拟效果好坏的几个量,即相关指数、残差平方和、相关系数及残差图中带状区域的宽窄进行分析,残差平方和越小越好,带状区域的宽度越窄,说明模型的拟合精度越高,R2越大,模型的拟合效果越好,相关指数R2越大,模型的拟合效果越好,则可判断①③;根据样本点中心(x,y)点必在回归直线上,可判断②;根据独立性检验的相关知识,可判断④.
【解答】
解:对于①相关指数R2越大,说明残差平方和越小,模型的拟合效果越好,成立;
对于②回归直线方程:y=bx+a一定过样本点的中心:x,y,成立;
对于③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,成立;
对于④在独立性检验中,若公式K2=nad−bc2a+bc+da+cb+d中的|ad−bc|的值越大,说明“两个分类变量有关系”的可能性越强,成立.
因此正确结论的个数有4个.
故选D.
13.【答案】y=2x−9.6
20.4
【解析】
【分析】
本题主要考查回归直线方程及回归分析的应用,平均数的计算,属于中档题.
分别计算出中国和南亚某国的投资额、利润的平均数,然后进行比较和选择,然后利用公式和参考数据计算出b的值,再根据a=y−bx计算出a的值,则回归直线方程可求;根据回归直线方程计算出x=15时y的取值即可.
【解答】
解:由表中数据可求得,x中国=x南亚某国=10+11+12+13+145=12,
y中国=11+12+14+16+195=14.4,y南亚某国=12+13+13+14+155=13.4,
因此应选择中国.
∴由参考数据和公式可知b=2010=2,
∴a=14.4−2×12=−9.6,
所以所求回归直线方程为y=2x−9.6,
当x=15时,y=20.4.
故答案为:y=2x−9.6;20.4.
14.【答案】0.5
0.53
【解析】
【分析】
本题考查了回归直线方程的求法以及用回归直线方程进行预测,属于中档题.
【解答】
解:这5天的平均投篮命中率为.
.
.
, .
所以回归直线方程为.
当x=6时,.
故答案为0.5;0.53.
15.【答案】226.1(亿元)
256.5(亿元)
②
【解析】
【分析】
本题主要考查线性回归方程的应用,结合条件求出对应的预测值是解决本题的关键.属于基础题.
根据两个模型分别求出2018年的预测值,然后对比2016年的预测值,进行比较即可确定两个模型的预测值的可靠性.
【解答】
①y=−30.4+13.5×19=226.1(亿元).
②y=99+17.5×9=256.5(亿元).
当年份为2016
对于模型①:t=17,y=−30.4+13.5×17=199.1(亿元),
对于模型②:t=7,y=99+17.5×7=221.5(亿元),
所以②的准确度较高,①偏差较大,所以选择②得到的预测值更可靠.
本题正确结果:226.1(亿元);256.5(亿元);②.
16.【答案】58.25
68
【解析】
【分析】
本题考查线性回归方程的应用,解题的关键是正确应用线性回归方程进行预测.根据表中所给的数据,做出横标和纵标的平均数,得到样本中心点,根据由最小二乘法求得回归方程y=0.67x+54.9,代入样本中心点求出该数据的值.
【解答】
解:由表中数据得:x=30,y=a+3075,
由于由最小二乘法求得回归方程y=0.67x+54.9,
将x=30,y=a+3075, 代入回归直线方程,得a=68,
当x=5时,y=58.25;
故答案为58.25;68.
17.【答案】y=2x−9.6
20.4
【解析】
【分析】
本题考查平均数和回归直线方程及其应用,属于基础题.
通过比较平均值的大小可知应选择中国,求出回归直线方程的系数,得y=2x−9.6,令x=15即可求得预测值.
【解答】
解:由表中数据可求得,x中国=x南亚某国=12,y中国=14.4,y南亚某国=13.4,
由于14.4>13.4,因此应选择中国.
∴b=i=15(xi−x)(yi−y)i=15(xi−x)2=2010=2,∴a=14.4−2×12=−9.6,
所以所求回归直线方程为y=2x−9.6,
当x=15时,y的值约为20.4.
故答案为y=2x−9.6;20.4.
18.【答案】解:(1) ①依题意:x=2+4+6+8+10+126=7,
令z=log2y=bx+log2c;
再令a=log2c,则z=bx+a.
根据最小二乘估计可知:b=i=16(xi−x)(zi−z)i=16(xi−x)2=34.770≈0.5,
得a=z−bx=4.5−0.5×7=1,
所以回归方程为z=0.5x+1,即y=20.5x+1.
②设20.5x+1≥200,解得0.5x+1≥log2200,即x≥4+4log25≈13.2.
所以科技投入的费用至少要13.2百万元,下一年的收益才能达到2亿.
(2)甲建立的回归模型的残差为:
yi
5.6
6.5
12.0
27.5
80.0
129.2
yi
4
8
16
32
64
128
yi−yi
1.6
−1.5
−4
−4.5
16
1.2
则i=16(yi−yi)2=298.5,从而R2=1−298.512730.4≈1−0.02=0.98>0.94.
所以甲建立的回归模型拟合效果更好.
【解析】本题考查回归分析及其应用,属于中档题.
(1) ①求出x,令z=log2y=bx+log2c;再令a=log2c,先求出z和x的回归直线方程,即可求得y关于x的回归方程;
②解20.5x+1≥200即可;
(2)列出残差表,求出R2,即可判断甲建立的回归模型拟合效果更好.
19.【答案】解:(1)(i)x=2+4+6+8+10+126=7,
令z=log2y=bx+log2c;
令a=log2c,则z=bx+a.
根据最小二乘估计可知:b=i=16xi−xzi−zi=16xi−x2=34.770≈0.5,
从而a=z−bx=4.5−0.5×7=1,
故回归方程为z=0.5x+1,
即y=20.5x+1.
(ii)设20.5x+1≥200,
解得0.5x+1≥log2200,
即x≥4+4log25≈13.2,
故科技投入的费用至少要13.2百万元,下一年的收益才能达到2亿.
(2)甲建立的回归模型的残差:
则i=16yi−yi2=298.5,
从而R2=1−298.512730.4≈1−0.02=0.98>0.94,
即甲建立的回归模型拟合效果更好.
【解析】本题考查求回归方程以及相关指数,属于较难的题.
(1)(i)令z=log2y=bx+log2c,a=log2c,则z=bx+a,根据最小二乘估计b≈0.5,a=1,则z=0.5x+1,从而确定y关于x的回归方程即可.
(ii)令20.5x+1≥200,解得x的取值范围即可.
(2)先计算甲建立的回归模型的残差,i=16yi−yi2=298.5,再计算甲模型的相关指数R2=0.98,与乙模型的相关指数比较大小,即可.
20.【答案】解:(Ⅰ)乙同学模型的相关指数R2更接近1.
(Ⅱ)根据(Ⅰ)的结论,应选择z=dx+c做为回归方程,根据公式,
d=i=18xizi−nxzi=1nxi2−nx2=757−8×26×3.35722−8×262≈0.22,
c=z−dx≈3.3−0.22×26=−2.42,
∴z=0.22x−2.42,
故y关于x的回归方程为y=e0.22x−2.42.
(Ⅲ)当x=25时,y=e3.08
相关试卷
这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用优秀复习练习题,文件包含同步讲义人教A版2019高中数学选修第三册82一元线性回归模型及其应用原卷版docx、同步讲义人教A版2019高中数学选修第三册82一元线性回归模型及其应用解析版docx等2份试卷配套教学资源,其中试卷共96页, 欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.2 一元线性回归模型及其应用当堂检测题,共6页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
这是一份高中数学人教A版 (2019)选择性必修 第三册8.2 一元线性回归模型及其应用同步达标检测题,文件包含人教A版2019选择性必修三高中数学同步82一元线性回归模型及其应用解析版docx、人教A版2019选择性必修三高中数学同步82一元线性回归模型及其应用原卷版docx等2份试卷配套教学资源,其中试卷共24页, 欢迎下载使用。