所属成套资源:数学苏教版 (2019)选择性必修第二册整册试卷同步训练题
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析同步测试题
展开
这是一份高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析同步测试题,共18页。试卷主要包含了1 线性回归分析,有以下五组变量等内容,欢迎下载使用。
9.1.1 变量的相关性
9.1.2 线性回归方程
基础过关练
题组一 变量间的相关关系
1.有以下五组变量:
①某商品的销售价格与销售量;
②学生的学籍号与学生的数学成绩;
③坚持每天吃早餐的人数与患胃病的人数;
④气温与冷饮的销售量;
⑤电瓶车的质量和行驶每千米的耗电量.
其中两个变量具有正相关关系的是( )
A.①③B.②④C.②⑤D.④⑤
2.(2021湖南郴州高一期末)在下列各散点图中,两个变量具有正相关关系的是( )
3.下表给出了5组数据,选出4组数据使得x与y的线性相关程度最大,且保留第1组数据(-5,-3),则在余下的4组数据中应去掉( )
A.第2组数据B.第3组数据
C.第4组数据D.第5组数据
题组二 相关系数
4.(2021陕西咸阳高二期末)在变量y与x的回归模型中,它们对应的相关系数r的值如下表,其中拟合效果最好的模型是( )
A.模型1B.模型2C.模型3D.模型4
5.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-13x+2上,则这组样本数据的样本相关系数r为( )
A.-1B.0C.-13D.1
6.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A.r2a^2
10.(2020山东日照实验中学高二下阶段性考试)若根据5名儿童的年龄x(岁)和体重y(kg)的数据用最小二乘法得到体重关于年龄的线性回归方程是y^=2x+18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是 kg.
11.(2021江苏南京师大附中高二期末)近年来,国家对西部发展出台了很多优惠政策,为了更有效地促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x(吨)对价格y(万元/吨)和年利润z(万元)的影响,有关部门对近五年此种材料的年产量和价格进行统计,统计结果如下表,若y=5.5.
(1)求表格中c的值;
(2)求y关于x的线性回归方程y^=b^x+a^;
(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z取得最大值.
参考公式:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx 2,a^=y-b^x.
题组四 非线性回归分析
12.某种微生物的繁殖速度y与生长环境中的营养物质浓度x相关,在一定条件下可用回归模型y=2lg x进行拟合.在这个条件下,要使y增加2个单位,则应该使x( )
A.增加1个单位B.增加2个单位
C.增加到原来的2倍D.增加到原来的10倍
13.以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=ln y,将其变换后得到线性回归方程z=0.2x+3,则c,k的值分别是( )
A.e2,0.6B.e2,0.3C.e3,0.2D.e4,0.6
14.(2021江西景德镇一中高二期末)某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,选取了20间大棚(每间一亩)进行试点,将得到的各间大棚产量数据绘制成散点图如图所示.光照时长为x(单位:小时),大棚蔬菜产量为y(单位:千斤/亩),记w=ln x.
(1)根据散点图判断y=a+bx与y=c+d·ln x,哪一个适宜作为大棚蔬菜产量y关于光照时长x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;(结果保留小数点后两位)
(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为e2小时(自然对数的底e≈2.718 28)时,大棚蔬菜亩产量为多少.
参考数据:
参考公式:β关于α的线性回归方程β^=m^·α+n^中,
m^=∑i=1nαiβi-nα·β∑i=1nαi2-nα2,n^=β-m^·α.
能力提升练
题组一 线性回归方程及其应用
1.(2021湖南长沙高三月考,)已知两个变量具有线性相关关系,现通过最小二乘法求回归直线方程y^=b^x+a^,将已知数据代入公式Q=∑i=1n(yi-bxi-a)2,计算后得到的代数式为3a2+13b2+12ab-2b+3,使上述代数式取值最小的a,b的值即为回归方程的系数,则回归直线方程为( )
A.y^=-x+2B.y^=-x-2
C.y^=x+2D.y^=x-2
2.(多选)(2021江苏镇江高三期中,)已知由样本数据点集合{(xi,yi)|i=1,2,3,…,n},求得回归直线方程为y^=1.5x+0.5,且x=3,现发现两个数据点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后y的估计值增加速度变快
C.去除后与去除前均值x,y不变
D.去除后的回归方程为y^=1.2x+1.4
3.(2020四川成都高二期末,)某国企进行节能降耗技术改造,下面是该国企节能降耗技术改造后连续五年的生产利润:
预测第8年该国企的生产利润为( )
参考公式及数据:b^=∑i=1nxiyi-nxy∑i=1nxi2-nx2,a^=y-b^x,∑i=15xiyi-5x y=1.7,∑i=15xi2-5x2=10.
千万元千万元
千万元千万元
4.(2021江苏淮安马坝中学高二月考,)FEV1(第一秒用力呼气容积)是肺功能的一个重要指标.为了研究某地区10~15岁男孩群体的FEV1与身高的关系,现从该地区A、B、C三个社区10~15岁男孩中随机抽取600名进行FEV1与身高数据的相关分析.
(1)若A、B、C三个社区10~15岁男孩人数比例为1∶3∶2,按分层随机抽样进行抽取,请求出三个社区应抽取的男孩人数;
(2)经过数据处理后,得到该地区10~15岁男孩身高x(cm)与FEV1 y(L)对应的10组数据(xi,yi)(i=1,2,…,10),并作出如图所示的散点图:
经计算得:∑i=110(xi-x)2≈1 320,∑i=110(yi-y)2≈3,x=152,y=2.464,(xi,yi)(i=1,2,…,10)的相关系数r≈0.987.
①请你利用所给公式与数据建立y关于x的线性回归方程,并估计身高160 cm的男孩的FEV1的预报值y0;
②若①中回归模型误差的标准差为s,则该地区身高160 cm的男孩的FEV1的实际值落在(y0-3s,y0+3s)内的概率为99.74%.现已求得s=0.1,若该地区有两个身高160 cm的12岁男孩M和N,测得FEV1值分别为2.8 L和2.3 L,请结合概率统计知识对这两个男孩的FEV1指标作出一个合理的推断与建议.
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,其回归方程y^=a^+b^x的斜率和截距的最小二乘法估计分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x,110≈10.5.
5.(2021江苏南京高三月考,)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某市为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得∑i=120xi=80,∑i=120yi=4 000,∑i=120(xi-x)2=80,∑i=120(yi-y)2=8 000,∑i=120(xi-x)(yi-y)=700.
(1)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合;
(2)求y关于x的线性回归方程;
(3)某科研机构研发了两款垃圾处理机器,其中甲款机器每台售价100万元,乙款机器每台售价80万元,下表是以往两款垃圾处理机器的使用年限(整年)统计表:
根据以往经验可知,某县城每年可获得政府支持的垃圾处理费用为50万元,若仅考虑购买机器的成本和每台机器的使用年限(使用年限均为整年).某县城环保机构若考虑购买其中一款垃圾处理器,以使用年限的频率估计概率,该机构选择购买哪一款垃圾处理机器更划算?
参考公式:相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2∑i=1n(yi-y)2,
对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),其回归方程y^=b^x+a^的斜率和截距的最小二乘估计分别为b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2,a^=y-b^x.
题组二 非线性回归分析及其应用
6.(2021江苏扬州中学高三月考,)某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每批产品的非原料总成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
根据以上数据,绘制如图所示的散点图.
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型y=a+bln x和指数函数模型y=c·dx分别对两个变量的关系进行拟合.
(1)根据散点图判断,y=a+bln x与y=c·dx(c,d均为大于零的常数)哪一个适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,建立y关于x的回归方程;
(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123 470元,请估计最多能生产多少千件产品.
参考数据:
其中vi=lg yi,v=17∑i=1nvi.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v^=α^+β^u的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nuv∑i=1nui2-nu 2,α^=v-β^u.
第9章 统计
9.1 线性回归分析
9.1.1 变量的相关性
9.1.2 线性回归方程
基础过关练
1.D ①销售价格越高,销售量通常会越低,所以不是正相关关系;②学生的数学成绩与学籍号无关;③医学证明不吃早餐的人容易患胃病,因此吃早餐的人数和患胃病的人数之间是负相关关系;④气温越高,冷饮销量越高,是正相关关系;⑤电瓶车的质量越大,行驶每千米的耗电量越大,所以是正相关关系.故选D.
2.B 四个选项中只有选项B中总体上变量y随着x的增大而增大,因此只有B中具有正相关关系,故选B.
3.B 画出散点图如图所示,应去掉第3组数据(-3,4),故选B.
4.C 在线性回归分析中,相关系数为r,|r|越接近于1,y与x相关程度越强;|r|越接近于0,y与x相关程度越弱.∵|0.96|>|0.90|>|0.48|>|0.15|,∴模型3的拟合效果最好,故选C.
5.A 因为回归直线方程是y=-13x+2,所以这两个变量是负相关,故这组样本数据的样本相关系数为负值,又所有样本点(xi,yi)(i=1,2,…,n)都在直线上,所以|r|=1,所以相关系数r=-1,故选A.
6.A 由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,题图2和题图4是负相关,相关系数小于0,题图1和题图2的点相对更加集中,所以相关性更强,所以|r1|接近于1,|r2|接近于-1,由此可得r2a^1.
10.答案 26
解析 由题意得x=3+5+2+6+45=4,
由于回归直线过样本点的中心(x,y),所以y=2x+18=2×4+18=26,
故这5名儿童的平均体重是26 kg.
11.解析 (1)y=15(8+7+6+4+c)=5.5,解得c=2.5.
(2)∵∑i=15xiyi=8+14+18+16+12.5=68.5,
∑i=15xi2=12+22+32+42+52=55,
x=1+2+3+4+55=3,y=5.5,
∴b^=∑i=15xiyi-5xy∑i=15xi2-5x2=68.5-5×3×5.555-5×9=-1.4.
a^=y-b^x=5.5-(-1.4)×3=9.7,
∴y关于x的线性回归方程为y^=-1.4x+9.7.
(3)年利润z=(-1.4x+9.7-2)x=-1.4x2+7.7x,
∴当x=-7.7-2.8=2.75时,年利润z取得最大值.
故当年产量为2.75吨时,年利润z取得最大值.
12.D 设y的增加量为Δy=y2-y1,x的增加量为Δx=x2-x1,故可得Δy=2lg x2-2lg x1=2lg x2x1=2,解得x2x1=10,故要使得y增加2个单位,x应增加到原来的10倍.
13.C 对y=cekx两边同时取以e为底的对数可得ln y=ln(cekx)=ln c+ln ekx=kx+ln c,因为z=ln y,所以z=kx+ln c,又z=0.2x+3,所以k=0.2,ln c=3,所以c=e3.
14.信息提取 ①散点图的形状;②w=ln x和题表中的数据;③利用回归方程估计当光照时长为e2小时时大棚蔬菜的亩产量.
数学建模 先以大型现代化农场在种植某种大棚有机无公害的蔬菜的散点图的形状确定函数模型,然后通过w=ln x将非线性回归方程转化为线性回归方程,将y,x与参考公式中的β,α进行对应,利用公式求出c,d,最后回代求出y关于x的回归方程.
解析 (1)根据题中散点图可知,开始的点在某条直线附近,但后面的点会越来越偏离这条直线,因此y=c+d·ln x更适宜作为回归方程.
(2)因为w=ln x,所以y=c+d·ln x=c+d·w,y=∑i=120yi20=102.420=5.12,w=∑i=120wi20=5220=2.6,
d^=272.1-20×5.12×2.6137-20×2.62≈3.26,
c^=5.12-3.26×2.6≈-3.36,
所以y=3.26w-3.36,即y=3.26ln x-3.36.
(3)由(2),知当x=e2时,y=3.26ln e2-3.36=3.16.
故估计当光照时长为e2小时时,大棚蔬菜亩产量为3.16千斤.
方法总结
建立非线性回归方程的步骤:(1)选取合适的函数进行拟合;(2)通过换元将非线性回归方程模型转化为线性回归模型;(3)找好换元后的字母与参考公式中字母的对应关系,代入公式求出线性回归方程中的参数;(4)消去新元,得到非线性回归方程.
能力提升练
1.D 3a2+13b2+12ab-2b+3=3(a+2b)2+(b-1)2+2,当a+2b=0,b-1=0,即a=-2,b=1时,上式取值最小,故y^=x-2.
2.ACD ∵y关于x的线性回归方程为y^=1.5x+0.5,回归系数1.5>0,∴变量x与y具有正相关关系,故A正确;去除两个数据点后重新求得回归直线l的斜率为1.2,由1.2E(Y),所以该机构选择购买一台甲款垃圾处理机器更划算.
6.解析 (1)根据题中的散点图判断,y=c·dx适宜作为非原料总成本y关于生产该产品的数量x的回归方程类型.
(2)由y=c·dx,两边同时取常用对数得lg y=lg(c·dx)=lg c+xlg d.
设lg y=v,∴v=lg c+xlg d,
∵x=4,v=1.54,∑i=17xi2=140,∑i=17xivi=50.12,
∴lg d=∑i=17xivi-7xv∑i=17xi2-7x 2=50.12-7×4×1.54140-7×42=728=0.25.
把(4,1.54)代入v=lg c+xlg d,得lg c=0.54,
∴v^=0.54+0.25x,∴lg y^=0.54+0.25x,
∴y^=100.54+0.25x=3.47×100.25x,
即y关于x的回归方程为y^=3.47×100.25x.
(3)设生产了x千件该产品,则生产总成本为g(x)=3.47×100.25x+x×10×1 000,
又g(x)=3.47×100.25x+10 000x在其定义域内单调递增,且g(12)=3.47×103+120 000=123 470,
所以估计最多能生产12千件产品.
方法总结
两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换将其转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z^=b^x+a^(a^=ln c1,b^=c2)的附近.
第i组
1
2
3
4
5
xi
-5
-4
-3
-2
4
yi
-3
-2
4
-1
6
模型
1
2
3
4
r
0.48
0.15
0.96
0.90
x
88
83
117
92
108
100
112
y
94
91
108
96
104
101
106
x
1
2
3
4
5
y
8
7
6
4
c
∑i=120xi
∑i=120yi
∑i=120wi
∑i=120xi2
∑i=120yi2
∑i=120wi2
∑i=120xiyi
∑i=120wiyi
290
102.4
52
4 870
540.28
137
1 578.2
272.1
年号x
1
2
3
4
5
年生产利润y
(单位:千万元)
0.7
0.8
1
1.1
1.4
使用年限台数款式
1年
2年
3年
4年
总计
甲款
5
20
15
10
50
乙款
15
20
10
5
50
x/千件
1
2
3
4
5
6
7
y/元
6
11
21
34
66
101
196
x
y
v
∑i=17xi2
∑i=17xiyi
∑i=17xivi
100.54
4
62.14
1.54
140
2 535
50.12
3.47
X
-50
0
50
100
P
0.1
0.4
0.3
0.2
Y
-30
20
70
120
P
0.3
0.4
0.2
0.1
相关试卷
这是一份高中数学9.1线性回归分析优秀巩固练习,文件包含高二数学下学期第二次月考模拟试卷选择性必修第二册含数列和导数原卷版docx、高二数学下学期第二次月考模拟试卷选择性必修第二册含数列和导数解析版docx等2份试卷配套教学资源,其中试卷共20页, 欢迎下载使用。
这是一份高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析优秀习题,文件包含912线性回归方程原卷版docx、912线性回归方程解析版docx等2份试卷配套教学资源,其中试卷共29页, 欢迎下载使用。
这是一份苏教版 (2019)选择性必修第二册9.1线性回归分析优秀综合训练题,文件包含911变量的相关性原卷版docx、911变量的相关性解析版docx等2份试卷配套教学资源,其中试卷共19页, 欢迎下载使用。