苏教版 (2019)选择性必修第二册9.1线性回归分析同步训练题
展开1.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系B.学生的成绩和身高
C.儿童的年龄与体重D.物体的体积和质量
2.已知变量x和y满足关系,变量y和z负相关.下列说法正确的是( )
A.x和y负相关,x和z负相关B.x和y正相关,x和z正相关
C.x和y正相关,x和z负相关D.x和y负相关,x和z正相关
3.甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关系数r,则线性相关程度最高的是( )
A.甲B.乙C.丙D.丁
4.下列有关样本相关系数说法不正确的是( )
A.,且越接近1,相关程度越大
B.,且越接近0,相关程度越小
C.,且越接近1,相关程度越大
D.相关系数用来衡量变量x与y的线性相关程度
5.下列说法错误的是( )
A.用相关系数r来衡量两个变量之间线性关系的强弱时,越接近于1,相关性越弱
B.当相关系数时,表明两变量负相关
C.当相关系数时,表明两变量线性不相关
D.当相关系数时,表明两变量有较强的线性相关程度
6.有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,现抽取某次考试中一个班级(共50名学生)的数学成绩与物理成绩绘制成散点图.根据下图,以下结论中正确的是( ).
A.数学成绩好,物理成绩也好B.数学成绩好,但物理成绩差
C.物理成绩好,但数学成绩差D.物理成绩差,但数学成绩好
7.在建立两个变量y与x的回归模型,模型的的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( )
A.模型1B.模型2C.模型3D.模型4
8.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额看成年份序号(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的个数为( )
①销售额与年份序号呈正相关关系;
②销售额与年份序号线性相关不显著;
③三次函数回归曲线的效果好于回归直线的拟合效果;
④根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元.
A.1B.2C.3D.4
二、多选题
9.对两个变量,进行线性回归分析,计算得到相关系数,则下列说法中正确的是( )
A.与负相关
B.与具有较强的线性相关关系
C.与几乎不具有线性相关关系
D.与的线性相关关系还需进一步确定
10.(多选)在下列所示的四个图中,每个图的两个变量间具有相关关系的是( ).
A.B.C.D.
11.有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是( )
A.残差平方和变小
B.相关系数变小
C.决定系数变小
D.解释变量与响应变量的相关性变强
12.某中学课外活动小组为了研究经济走势,根据该市1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图:
该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的有( )
A.变量与正相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.若选择模型二,的图象一定经过点
D.当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1
三、填空题
13.对于给定的两个变量的统计数据,下列说法正确的是__________.(填序号)
①都可以分析出两个变量的关系;
②都可以用一条直线近似地表示两者的关系;
③都可以作出散点图;
④都可以用确定的表达式表示两者的关系.
14.下面对于线性相关系数r的叙述中,正确的是________.
①,越大相关程度越大,反之相关程度越小;
②,r越大相关程度越大,反之相关程度越小;
③表示的两变量的相关程度大于表示的相关程度.
15.对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为______.
16.某中学统计了2011~2021这11年本校学生参加高考数学均分、英语均分、总分均分,得到如表所示的表格:
从表中可知,数学和英语这两科中与总分相关性较高的是______.
四、解答题
17.下列几对变量,哪些有明显的正相关、明显的负相关、接近于0的相关系数?
(1)广告费与销售额;
(2)合理范围内的施肥量与粮食产量;
(3)汽车车速与司机的年龄.
18.下面是随机抽取的9名15岁男生的身高、体重列表:
判断所给的两个变量之间是否存在相关关系.
19.中国天气网2016年3月4日晚六时通过手机发布的3月5日通州区天气预报的折线图(如图),其中上面的折线代表可能出现的从高气温,下面的折线代表可能出现的最低气温.
(Ⅰ)指出最高气温与最低气温的相关性;
(Ⅱ)比较最低气温与最高气温方差的大小(结论不要求证明);
(Ⅲ)在内每个整点时刻的温差(最高气温与最低气温的差)依次记为,求在连续两个时刻的温差中恰好有一个时刻的温差不小于的概率.
20.网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数和时间(第天)间的数据,列表如下:
(1)由表中给出的数据是否可用一元线性回归模型拟合人数y与时间x之间的关系?(若,则线性相关程度很高,可用一元线性回归模型拟合,计算r时精确到0.01.)
参考数据:.附:相关系数.
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满100元可减15元;方案二,一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
21.有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
22.红铃虫是棉花的主要害虫之一,也侵害木棉、锦葵等植物.为了防治虫害,从根源上抑制害虫数量.现研究红铃虫的产卵数和温度的关系,收集到7组温度和产卵数的观测数据于表I中.根据绘制的散点图决定从回归模型①与回归模型②中选择一个来进行拟合.
表I
(1)请借助表II中的数据,求出回归模型①的方程:表II(注:表中)
(2)类似的,可以得到回归模型②的方程为.试求两种模型下温度为时的残差;
(3)若求得回归模型①的相关指数,回归模型②的相关指数,请结合②说明哪个模型的拟合效果更好.
参考数据:
附:回归方程中相关指数
23.如图是某创业公司2017年每月份公司利润(单位:百万元)情况的散点图:为了预测该公司2018年的利润情况,根据上图数据,建立了利润y与月份x的两个线性回归模型:①0.94+0.028;②0.96+0.032lnx,并得到以下统计值:
(1)请利用相关指数R2判断哪个模型的拟合效果更好;
(2)为了激励员工工作的积极性,公司每月会根据利润的情况进行奖惩,假设本月利润为y1,而上一月利润为y2,计算z,并规定:若z≥10,则向全体员工发放奖金总额z元;若z<10,从全体员工每人的工资中倒扣10﹣z元作为惩罚,扣完为止,请根据(1)中拟合效果更好的回归模型,试预测208年4月份该公司的奖惩情况?(结果精确到小数点后两位)
参考数据及公式:1.73,2.24,1n2≈0.69,1n3≈1.10,ln5≈1.61.相关指数R2=1.
甲
乙
丙
丁
r
0.87
0.58
0.83
年份
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
数学x(分)
75
77
79
74
80
81
77
83
80
82
81
英语m(分)
95
98
100
101
102
103
101
98
107
106
100
总分y(分)
473
481
479
485
490
487
478
492
488
493
489
编号
1
2
3
4
5
6
7
8
9
身高/cm
165
157
155
175
168
157
178
160
163
体重/kg
52
44
45
55
54
47
62
50
53
1
2
3
4
5
75
84
93
98
100
温度
20
22
25
27
29
31
35
产卵数个
7
11
21
24
65
114
325
189
567
25.27
162
78106
11.06
3040
41.86
825.09
模型①
模型②
残差平方和(yi)2
0.000591
0.000164
总偏差平方和(yi)2
0.006050
参考答案
一、单选题
1.下列两个量之间的关系是相关关系的是( )
A.匀速直线运动中时间与位移的关系B.学生的成绩和身高
C.儿童的年龄与体重D.物体的体积和质量
【答案】C
【分析】根据相关关系和函数关系的概念即可判断
【解析】A、D是函数关系;B是不相关关系;C是相关关系,
故选:C
2.已知变量x和y满足关系,变量y和z负相关.下列说法正确的是( )
A.x和y负相关,x和z负相关B.x和y正相关,x和z正相关
C.x和y正相关,x和z负相关D.x和y负相关,x和z正相关
【答案】D
【分析】由变量间的正、负相关定义求解.
【解析】由知x和y负相关,又y和z负相关,所以x和z正相关.
故选:D
3.甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关系数r,则线性相关程度最高的是( )
A.甲B.乙C.丙D.丁
【答案】B
【分析】根据越接近于1,两个变量的线性相关程度越高,即可得解.
【解析】解:因为越接近于1,两个变量的线性相关程度越高,
所以线性相关程度最高的是乙.
故选:B.
4.下列有关样本相关系数说法不正确的是( )
A.,且越接近1,相关程度越大
B.,且越接近0,相关程度越小
C.,且越接近1,相关程度越大
D.相关系数用来衡量变量x与y的线性相关程度
【答案】A
【分析】根据相关系数的定义和性质判断.
【解析】由相关系数的定义可得,A错,
由相关系数的性质可得:
当越接近0,相关程度越小,B对,
越接近1,相关程度越大,C对,
相关系数与x与y的线性相关程度有关,D对,
故选:A.
5.下列说法错误的是( )
A.用相关系数r来衡量两个变量之间线性关系的强弱时,越接近于1,相关性越弱
B.当相关系数时,表明两变量负相关
C.当相关系数时,表明两变量线性不相关
D.当相关系数时,表明两变量有较强的线性相关程度
【答案】A
【分析】根据相关系数r的含义判断即可.
【解析】用相关系数r来衡量两个变量之间线性关系的强弱时,越接近于1,相关性越强,故A错误;
由相关系数r的含义易知B,C正确,
对D,很接近于1,故有较强的线性相关程度,故D正确,
故选:A
6.有些老师常说:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,现抽取某次考试中一个班级(共50名学生)的数学成绩与物理成绩绘制成散点图.根据下图,以下结论中正确的是( ).
A.数学成绩好,物理成绩也好B.数学成绩好,但物理成绩差
C.物理成绩好,但数学成绩差D.物理成绩差,但数学成绩好
【答案】A
【分析】根据散点图可知,数学成绩与物理成绩正相关
【解析】根据散点图可知,数学成绩与物理成绩正相关,即一般来说,数学成绩好,物理成绩也好
故选:A.
7.在建立两个变量y与x的回归模型,模型的的值依次是0.35,0.67,0.84,0.92,则其中拟合效果最好的模型是( )
A.模型1B.模型2C.模型3D.模型4
【答案】D
【分析】根据相关指数的概念,直接判定,即可得出结果.
【解析】根据相关指数的作用,可知相关指数越大,模型拟合效果越好,
因为,
所以模型4的拟合效果最好.
故选:D.
【点睛】本题主要考查相关指数的有关概念,属于基础题型.
8.某电子商务平台每年都会举行“年货节”商业促销狂欢活动,现统计了该平台从2012年到2020年共9年“年货节”期间的销售额(单位:亿元)并作出散点图,将销售额看成年份序号(2012年作为第1年)的函数.运用Excel软件,分别选择回归直线和三次函数回归曲线进行拟合,效果如下图,则下列说法中正确的个数为( )
①销售额与年份序号呈正相关关系;
②销售额与年份序号线性相关不显著;
③三次函数回归曲线的效果好于回归直线的拟合效果;
④根据三次函数回归曲线可以预测2021年“年货节”期间的销售额约为8454亿元.
A.1B.2C.3D.4
【答案】B
【分析】由散点图分布趋势知①正确;由相关系数知②错误;根据两模型相关系数大小关系可知③正确;将代入三次函数方程即可求得的预估值,知④错误.
【解析】根据图象可知,散点从左下到右上分布,销售额与年份序号呈正相关关系,①正确;
相关系数,靠近,销售额与年份序号线性相关显著,②错误;
根据三次函数回归曲线的相关指数,相关指数越大,拟合效果越好,所以三次函数回归曲线的拟合效果好于回归直线的拟合效果,③正确;
由三次函数,当时,亿元,④错误.
故选:B.
二、多选题
9.对两个变量,进行线性回归分析,计算得到相关系数,则下列说法中正确的是( )
A.与负相关
B.与具有较强的线性相关关系
C.与几乎不具有线性相关关系
D.与的线性相关关系还需进一步确定
【答案】AB
【分析】根据相关系数依次分析各选项即可得答案.
【解析】解:因为相关系数的绝对值越接近于,线性相关性越强,且当时,认为变量,具有较强的线性相关关系.
对于A选项,相关系数,故与负相关,正确;
对于BCD选项,,故与具有较强的线性相关关系,故B正确,CD错误;
故选:AB
10.(多选)在下列所示的四个图中,每个图的两个变量间具有相关关系的是( ).
A.B.C.D.
【答案】BC
【分析】利用散点图判断相关关系的方法,逐一分析各个选项中的图形,判断作答.
【解析】对于A,散点落在某条曲线上,两个变量具有函数关系;
对于B、C,散点落在某条直线附近,这两个变量具有相关关系;
对于D,散点杂乱无章,无规律可言,这两个变量无相关性,不具有相关关系.
故选:BC
11.有一散点图如图所示,在5个数据中去掉后,下列说法中正确的是( )
A.残差平方和变小
B.相关系数变小
C.决定系数变小
D.解释变量与响应变量的相关性变强
【答案】AD
【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况.
【解析】解:从散点图可分析出,若去掉点,则解释变量与响应变量的线性相关性变强,且是正相关,
所以相关系数变大,决定系数变大,残差平方和变小.
故选:AD
12.某中学课外活动小组为了研究经济走势,根据该市1999—2021年的GDP(国内生产总值)数据绘制出下面的散点图:
该小组选择了如下2个模型来拟合GDP值随年份的变化情况,模型一:;模型二:,下列说法正确的有( )
A.变量与正相关
B.根据散点图的特征,模型一能更好地拟合GDP值随年份的变化情况
C.若选择模型二,的图象一定经过点
D.当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1
【答案】AD
【分析】根据散点图和变量关系依次判断即可.
【解析】对A,根据散点图易得变量与正相关,故A正确;
对B,由散点图可得与的变化趋向于一条曲线,所以模型二能更好地拟合GDP值随年份的变化情况,故B错误;
对C,若选择模型二,,令,则图象经过点,故C错误;
对D,当时,通过模型计算得GDP值为70,实际GDP值为71,则残差为1,故D正确.
故选:AD.
三、填空题
13.对于给定的两个变量的统计数据,下列说法正确的是__________.(填序号)
①都可以分析出两个变量的关系;
②都可以用一条直线近似地表示两者的关系;
③都可以作出散点图;
④都可以用确定的表达式表示两者的关系.
【答案】③
【分析】辨析两个变量的相关关系、函数关系与线性相关的概念,结合散点图的特点,对四个说法进行判断即可.
【解析】给出一组样本数据,总可以作出相应的散点图,故③正确,
但不一定能分析出两个变量的关系,故①不正确,
更不一定符合线性相关,不一定用一条直线近似的表示,故②不正确,
两个变量的统计数据不一定有函数关系,不一定可以用确定的表达式表示两者的关系,故④不正确.
故答案为:③.
14.下面对于线性相关系数r的叙述中,正确的是________.
①,越大相关程度越大,反之相关程度越小;
②,r越大相关程度越大,反之相关程度越小;
③表示的两变量的相关程度大于表示的相关程度.
【答案】①③
【分析】根据相关系数的性质,, 越接近于1,相关程度越大,即可判断①③正确,②错误.
【解析】对于①,根据相关系数的性质,,且越接近于1,相关程度越大,越接近于0,相关程度越小,①正确;
对于②,变量间的线性相关系数r的取值范围为,②错误;
对于③,越接近于1,相关程度越大,③正确.
故答案为:①③
15.对四组数据进行统计,依次获得如图所示的散点图.
关于其相关系数的大小比较,将0、、、、从小到大排列,应为______.
【答案】
【分析】根据散点图直接求解即可.
【解析】由散点图可知,
所以.
故答案为:.
16.某中学统计了2011~2021这11年本校学生参加高考数学均分、英语均分、总分均分,得到如表所示的表格:
从表中可知,数学和英语这两科中与总分相关性较高的是______.
【答案】数学
【分析】根据相关系数公式计算可得.
【解析】设数学学科和英语学科的相关系数分别为,,,,,
;
;
,
∴,∴.
;
,
∴,∴.
∵,∴从相关系数角度来考虑,数学学科与总分的相关性较高,
故答案为:数学.
四、解答题
17.下列几对变量,哪些有明显的正相关、明显的负相关、接近于0的相关系数?
(1)广告费与销售额;
(2)合理范围内的施肥量与粮食产量;
(3)汽车车速与司机的年龄.
【答案】(1)正相关
(2)正相关
(3)接近于0的相关系数
【分析】(1)广告费用高了,销售额也高了;
(2)合理范围内,施肥量大,粮食产量高;
(3)汽车车速与司机的年龄之间没有明显相关关系.
(1)
广告费用高了,销售额也高了,因此是正相关.
(2)
合理范围内,施肥量大,粮食产量高,它们是正相关.
(3)
汽车车速与司机的年龄之间相关关系不太明显,是接近于0的相关系数.
18.下面是随机抽取的9名15岁男生的身高、体重列表:
判断所给的两个变量之间是否存在相关关系.
【答案】存在相关关系
【分析】方法一:对比数据,发现体重随着身高的增高而增长,因此人的身高和体重之间存在相关关系.
方法二:画出散点图,发现,随着身高的增高,体重基本上呈增长的趋势.所以体重与身高之间存在相关关系,并且是正相关.
【解析】方法一:根据经验可知,人的身高和体重之间存在相关关系.观察表格中的数据可知,人的体重随着身高的增高而增长,因此人的身高和体重之间存在相关关系.
方法二:以x轴表示身高,以y轴表示体重,得到相应的散点图如图所示.
我们会发现,随着身高的增高,体重基本上呈增长的趋势.所以体重与身高之间存在相关关系,并且是正相关.
【点睛】本题主要考查了线性相关与散点图,属于基础题.
19.中国天气网2016年3月4日晚六时通过手机发布的3月5日通州区天气预报的折线图(如图),其中上面的折线代表可能出现的从高气温,下面的折线代表可能出现的最低气温.
(Ⅰ)指出最高气温与最低气温的相关性;
(Ⅱ)比较最低气温与最高气温方差的大小(结论不要求证明);
(Ⅲ)在内每个整点时刻的温差(最高气温与最低气温的差)依次记为,求在连续两个时刻的温差中恰好有一个时刻的温差不小于的概率.
【答案】(Ⅰ)正相关;(Ⅱ)最高气温方差小于最低气温方差;(Ⅲ).
【分析】(Ⅰ)根据图表及正相关的概念即得;
(Ⅱ)由图可以看出,最高气温曲线波动较小,进而即得;
(Ⅲ)利用列举法及古典概型概率公式即得.
【解析】(Ⅰ)由最高气温与最低气温的折线图可得,最高气温与最低气温之间成正相关,
即最高气温越高,相应地最低气温也越高.
(Ⅱ)由图可以看出,最高气温曲线波动较小,
因此最高气温方差小于最低气温方差.
(Ⅲ)由图可得下表:
由表可知,连续两个整点时刻(基本事件)共有15个:
,
,
.
其中满足条件“恰好有一个时刻的温差不小于”的事件(记为)共有3个:.
所以在连续两个时刻的温差中恰好有一个时刻的温差不小于的概率.
20.网上购物就是通过互联网检索商品信息,并通过电子订购单发出购物请求,厂商通过邮购的方式发货或通过快递公司送货上门,货到后通过银行转账、微信或支付宝支付等方式在线汇款,根据2019年中国消费者信息研究,超过40%的消费者更加频繁地使用网上购物,使得网上购物和送货上门的需求量激增,越来越多的消费者也首次通过第三方APP、品牌官方网站和微信社群等平台进行购物,某天猫专营店统计了2020年8月5日至9日这5天到该专营店购物的人数和时间(第天)间的数据,列表如下:
(1)由表中给出的数据是否可用一元线性回归模型拟合人数y与时间x之间的关系?(若,则线性相关程度很高,可用一元线性回归模型拟合,计算r时精确到0.01.)
参考数据:.附:相关系数.
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满100元可减15元;方案二,一次性购物金额超过800元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打9折,中奖两次打8折,中奖三次打6折.某顾客计划在此专营店购买1000元的商品,请从实际付款金额的数学期望的角度分析选哪种方案更优惠.
【答案】(1)可用一元线性回归模型拟合人数y与时间x之间的关系
(2)选方案二更划算
【分析】(1)根据表中数据,求得相关关系r判断;
(2)易知若选方案一,则需付款1000-150=850元;若选方案二,设需付款X元,则X的可能取值为600,800,900,1000,再计算其相应的概率,求得期望比较即可.
(1)
解:由表中数据可得,,,,
,
所以.
所以变量y与x具有很强的线性相关性,
所以可用一元线性回归模型拟合人数y与时间x之间的关系.
(2)
若选方案一,则需付款1000-150=850元;
若选方案二,设需付款X元,则X的可能取值为600,800,900,1000,
相应的概率为:
,,
,.
所以,
故选方案二更划算.
21.有一个开房门的游戏,其玩法为:
盒中先放入两把钥匙和两把钥匙,能够打开房门,不能打开房门.
每次从盒中随机取一把试开,试开后不放回钥匙.第一次打开房门后,关上门继续试开,第二次打开房门后停止抽取,称为进行了一轮游戏.
若每一轮取钥匙不超过三次,则该轮“成功”,否则为“失败”,如果某一轮“成功”,则游戏终止;若“失败”,则将所有钥匙重新放入盒中,并再放入一把钥匙,继续下一轮抽取,直至“成功”.
(1)有名爱好者独立参与这个游戏,记表示“成功”时抽取钥匙的轮次数,表示对应的人数,部分统计数据如下表:
若将作为关于的经验回归方程,估计抽取轮才“成功”的人数(人数精确到个位);
(2)由于时间关系,规定:进行游戏时,最多进行三轮,若均未“成功”也要终止游戏.求游戏要进行三轮的概率.
参考公式:最小二乘估计,.
参考数据:取,,其中,.
【答案】(1)人
(2)
【分析】(1)利用参考数据以及最小二乘法公式求出、的值,可得出经验回归方程,然后在回归方程中令,可求得结果;
(2)设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立,分析可知游戏要进行三轮,即前两轮均失败,计算出、的值,利用对立事件和独立事件的概率公式可求得所求事件的概率.
【解析】(1)解:令,设,
由条件知,,
所以,
,从而,
故所求的回归方程为.
所以,估计当时,,即抽取轮才“成功”的人数约为人.
(2)解:由条件知,游戏要进行三轮,即前两轮均失败.
设事件为“第一轮成功”,事件为“第二轮成功”,则、相互独立.
因为,,
所以,前两轮均失败的概率为.
故游戏要进行三轮的概率为.
22.红铃虫是棉花的主要害虫之一,也侵害木棉、锦葵等植物.为了防治虫害,从根源上抑制害虫数量.现研究红铃虫的产卵数和温度的关系,收集到7组温度和产卵数的观测数据于表I中.根据绘制的散点图决定从回归模型①与回归模型②中选择一个来进行拟合.
表I
(1)请借助表II中的数据,求出回归模型①的方程:表II(注:表中)
(2)类似的,可以得到回归模型②的方程为.试求两种模型下温度为时的残差;
(3)若求得回归模型①的相关指数,回归模型②的相关指数,请结合②说明哪个模型的拟合效果更好.
参考数据:
附:回归方程中相关指数
【答案】(1)
(2)1.54,65.54
(3)模型①的拟合效果更好
【分析】(1)由得,令,,,得,由表Ⅱ数据可求得,,从而得到回归直线方程;
(2)把分别代入回归模型①②的方程,利用即可;
(3),即模型①的相关指数大于模型②的相关指数,于是模型①的残差平方和小于模型②的.因此用模型①得到的数据更接近真实数据,从而即可判断.
(1)
由得
令,,,得
由表Ⅱ数据可得: ,
,
所以回归方程为:.
(2)
模型①在时的残差为:
模型②在时的残差为:
(3)
,即模型①的相关指数大于模型②的相关指数,
于是模型①的残差平方和小于模型②的.
因此用模型①得到的数据更接近真实数据,所以模型①的拟合效果更好.
23.如图是某创业公司2017年每月份公司利润(单位:百万元)情况的散点图:为了预测该公司2018年的利润情况,根据上图数据,建立了利润y与月份x的两个线性回归模型:①0.94+0.028;②0.96+0.032lnx,并得到以下统计值:
(1)请利用相关指数R2判断哪个模型的拟合效果更好;
(2)为了激励员工工作的积极性,公司每月会根据利润的情况进行奖惩,假设本月利润为y1,而上一月利润为y2,计算z,并规定:若z≥10,则向全体员工发放奖金总额z元;若z<10,从全体员工每人的工资中倒扣10﹣z元作为惩罚,扣完为止,请根据(1)中拟合效果更好的回归模型,试预测208年4月份该公司的奖惩情况?(结果精确到小数点后两位)
参考数据及公式:1.73,2.24,1n2≈0.69,1n3≈1.10,ln5≈1.61.相关指数R2=1.
【答案】(1)模型②0.96+0.032lnx,的拟合效果更好,详见解析(2)预测2018年4月份公司应该向全体员工发放10.56万元的奖金总额
【分析】(1)根据所给数据,分别计算出两种回归方程的相关指数,比较即可.
(2)由(1)知模型②的拟合效果更好,利用模型②预报4月份和3月份的利润y2,y1,代入公式求出z分析即可.
【解析】设模型①②的相关指数分别为,,
则10.902314,10.97289,
所以,所以模型②0.96+0.032lnx,的拟合效果更好.
(2)由(1)知,模型②0.96+0.032lnx,的拟合效果更好.
则2018年4月份公司的利润的预报值为:y1=0.96+0.032ln16=0.96+0.032×4×ln2≈1.04832(百万元),
2018年3月份公司的利润预报为:y2=0.96+0.32ln15=0.96+0.032(ln3+ln5)≈1.04672(百万元),
所以z=0.1y1+0.5×(y2﹣y1)=0.104832+0.5×0.0016≈0.105632(百万元)≈10.56万元,
因为z≥10,
所以,预测2018年4月份公司应该向全体员工发放10.56万元的奖金总额.
【点睛】本题考查了利用相关指数判断回归分析拟合效果,主要考查计算能力,属基础题.甲
乙
丙
丁
r
0.87
0.58
0.83
年份
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
数学x(分)
75
77
79
74
80
81
77
83
80
82
81
英语m(分)
95
98
100
101
102
103
101
98
107
106
100
总分y(分)
473
481
479
485
490
487
478
492
488
493
489
编号
1
2
3
4
5
6
7
8
9
身高/cm
165
157
155
175
168
157
178
160
163
体重/kg
52
44
45
55
54
47
62
50
53
整点时刻
8:00
9:00
10:00
11:00
12:00
13:00
14:00
15:00
最高气温
10
11
12
13
13
13
13
最低气温
4
6
8
10
12
10
温差
6
5
4
3
1
整点时刻
16:00
17:00
18:00
19:00
20:00
21:00
22:00
23:00
最高气温
12
10
8
6
5
4
3
最低气温
8
6
5
4
3
2
温差
6
5
4
3
1
1
2
3
4
5
75
84
93
98
100
温度
20
22
25
27
29
31
35
产卵数个
7
11
21
24
65
114
325
189
567
25.27
162
78106
11.06
3040
41.86
825.09
模型①
模型②
残差平方和(yi)2
0.000591
0.000164
总偏差平方和(yi)2
0.006050
苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题: 这是一份苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题,文件包含911变量的相关性原卷版docx、911变量的相关性解析版docx等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。
【同步讲义】(苏教版2019)高中数学选修第二册:9.1.1变量的相关性 讲义: 这是一份【同步讲义】(苏教版2019)高中数学选修第二册:9.1.1变量的相关性 讲义,文件包含同步讲义苏教版2019高中数学选修第二册911变量的相关性原卷版docx、同步讲义苏教版2019高中数学选修第二册911变量的相关性解析版docx等2份试卷配套教学资源,其中试卷共47页, 欢迎下载使用。
高中数学苏教版 (2019)选择性必修第二册8.2离散型随机变量及其分布列习题: 这是一份高中数学苏教版 (2019)选择性必修第二册8.2离散型随机变量及其分布列习题,文件包含824超几何分布解析版docx、824超几何分布原卷版docx等2份试卷配套教学资源,其中试卷共33页, 欢迎下载使用。