所属成套资源:全套人教版高中数学选择性必修第三册习题+测评含答案
人教版高中数学选择性必修第八章第三册8-2-1一元线性回归模型8-2-2一元线性回归模型参数的最小二乘估计习题含答案
展开
这是一份人教版高中数学选择性必修第八章第三册8-2-1一元线性回归模型8-2-2一元线性回归模型参数的最小二乘估计习题含答案,共19页。
8.2 一元线性回归模型及其应用
8.2.1 一元线性回归模型 8.2.2 一元线性回归模型参数的最小二乘估计
A级 必备知识基础练
1.为了研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据,并分析可得经验回归方程为y^=0.85x-0.25.由以上信息,得到下表中c的值为( )
天数x/天
3
4
5
6
7
繁殖个数y/千个
2.5
3
4
4.5
c
A.5 B.6 C.7 D.8
2.红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观测数据,用4种模型分别进行拟合.由此得到相应的回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是( )
A.模型一 B.模型二 C.模型三 D.模型四
3.某咖啡厅为了解热饮的销售量y(单位:杯)与气温x(单位:℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温/℃
18
13
10
-1
销售量/杯
24
34
38
64
由表中数据分析,可得经验回归方程y^=-2x+a.当气温为-4 ℃时,预测销售量约为( )
A.68杯 B.66杯 C.72杯 D.77杯
4.关于残差图的描述错误的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或响应变量
C.残差分布的带状区域的宽度越窄R2越小
D.残差分布的带状区域的宽度越窄残差平方和越小
5.由一组观测数据(x1,y1),(x2,y2),…,(xn,yn),经分析可得经验回归方程为y^=3x+a^,若x=1.5,y=2,则a^= .
6.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x/元
8
8.2
8.4
8.6
8.8
9
销量y/件
90
84
83
80
75
68
(1)求销量y关于单价x的经验回归方程y^=b^x+a^,其中b^=-20,a^=y-b^x;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
7.在一段时间内,某网店一种商品的销售价格x(单位:元)和日销售量y(单位:件)之间的一组数据如下表:
价格x/元
22
20
18
16
14
日销售量y/件
37
41
43
50
56
求出y关于x的经验回归方程,并用R2说明拟合效果.
参考数据:∑i=15xiyi=3 992,∑i=15xi2=1 660.
B级 关键能力提升练
8.研究表明蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程y^=0.25x+k,则下列说法不正确的是( )
x/(次数/分钟)
20
30
40
50
60
y/℃
25
27.5
29
32.5
36
A.k的值是20
B.变量x,y正相关
C.若x的值增加1,则y的值约增加0.25
D.当蟋蟀52次/分钟鸣叫时,该地当时的气温预测值为33.5 ℃
9.(多选题)下列说法正确的是( )
A.经验回归直线一定经过点(x,y)
B.若两个具有线性相关关系的变量的相关程度越强,则样本相关系数r的值越接近于1
C.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
D.在线性回归模型中,决定系数R2越接近于1,说明回归模型的拟合效果越好
10.(2022甘肃兰州期末)某研究所为了研究近几年留学生回国人数的情况,对2017至2021年留学生回国人数进行了统计,数据如表:
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
留学生回
国人数/万
36.5
40.9
43.3
48.1
51.9
根据上述统计数据求得留学生回国人数y(单位:万)与年份代码x满足的经验回归方程为y^=b^x+32.74,利用经验回归方程预测2022年留学生回国人数为( )
A.63.14万 B.64.72万
C.66.81万 D.55.54万
11.已知蝗虫的产卵量y与温度x的关系可以用模型y=c1ec2x拟合,设z=ln y,其变换后得到一组数据:
x
20
23
25
27
30
z
2
2.4
3
3
4.6
由上表可得经验回归方程z=0.2x+a,则c1=( )
A.-2 B.e-2
C.3 D.e3
12.某工厂为研究某种产品产量x(单位:吨)与所需某种原材料y(单位:吨)的相关关系,在生产过程中收集了4组对应数据(x,y)如下表所示:
x
3
4
5
6
y
2.5
3
4
m
根据表中数据,得出y关于x的经验回归方程为y^=0.7x+a.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为 .
13.某品牌服装专卖店为了解保暖衬衣的销售量y(单位:件)与平均气温x(单位:℃)之间的关系,随机统计了连续四旬的销售量与当旬平均气温,其数据如下表:
时间
二月上旬
二月中旬
二月下旬
三月上旬
旬平均
气温x/℃
3
8
12
17
旬销售
量y/件
55
m
33
24
由表中数据算出经验回归方程y^=b^x+a^中的b^=-2,x=10,y=38.
(1)表中数据m= .
(2)气象部门预测三月中旬的平均气温约为22 ℃,据此估计,该品牌的保暖衬衣在三月中旬的销售量约为 件.
14.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:
年龄x
2
3
4
5
6
患病人数y
22
22
17
14
10
(1)求y关于x的经验回归方程;
(2)计算样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强?(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.25],则x,y相关性较弱)
参考数据:30≈5.477.
参考公式:b^=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2=∑i=1nxiyi-nxy∑i=1nxi2-nx2,样本相关系数r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2·∑i=1n(yi-y)2.
15.为了防控疫情,某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原
料成本及非原料成本组成,每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,根据已经生产的统计数据,绘制了如右的散点图:观察散点图,两个变量不具有线性相关关系,现考虑用函数y=a+bx对两个变量的关系进行拟合.参考数据如下其中ui=1xi:
u
u2
∑i=16ui2
∑i=16yi
∑i=16yi2
∑i=16uiyi
0.483 4×5 252.44
0.41
0.168 1
1.492
306
20 858.44
173.8
50.39
(1)求y关于x的经验回归方程,并求y关于u的样本相关系数(精确到0.01);
(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为30元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元?请说明理由.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和截距的最小二乘估计分别为β^=∑i=1nuivi-nuv∑i=1nui2-nu2,α^=v-β^u,相关系数r=∑i=1nuivi-nuv(∑i=1nui2-nu2)(∑i=1nvi2-nv2) .
C级 学科素养创新练
16.某市某小区2020年11月至2021年11月期间的在售二手房均价(单位:万元/平方米)的散点图如图所示.(图中月份代码1~13分别对应2020年11月~2021年11月)
根据散点图选择y=a+bx和y=c+dln x两个模型进行拟合,经过数据处理得到两个经验回归方程分别为 y^=0.936 9+0.028 5x 和 y^=0.955 4+0.030 6ln x,并得到以下一些统计量的值:
类型
y^=0.936 9+
0.028 5x
y^=0.955 4+
0.030 6ln x
∑i=113(yi-y^i)2
0.000 591
0.000 164
∑i=113(yi-y)2
0.006 050
(1)请利用R2判断哪个模型的拟合效果更好.
(2)某位购房者拟于2022年4月购买这个小区m(70≤m≤160)平方米的二手房(欲购房为其家庭首套房).
若购房时该小区所有住房的房产证均已满2年但未满5年,请你利用(1)中拟合效果更好的模型解决以下问题:
①估算该购房者应支付的购房金额;(购房金额=房款+税费,房屋均价精确到0.001万元/平方米)
②若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格=房款)进行征收的.
房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为1%;首套面积90平方米以上且140平方米以内(含140平方米)为1.5%;首套面积140平方米以上或非首套为3%.
参考数据:ln 2≈0.69,ln 3≈1.10,ln 17≈2.83,ln 19≈2.94,2≈1.41,3≈1.73,17≈4.12,19≈4.36.
参考公式:R2=1-∑i=1n(yi-y^i)2∑i=1n(yi-y)2.
8.2.1 一元线性回归模型
8.2.2 一元线性回归模型参数的最小二乘估计
1.B ∵x=3+4+5+6+75=5,且(x,y)在经验回归直线上,∴y=0.85x-0.25=0.85×5-0.25=4.
∴2.5+3+4+4.5+c=4×5=20,解得c=6.
故选B.
2.D 当残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合效果越好,对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.
3.A ∵x=18+13+10-14=10,y=24+34+38+644=40,又(x,y)在经验回归直线上,
∴y=-2x+a,即a=40+2×10=60.
∴经验回归方程为y^=-2x+60.
∴当x=-4时,y^=68.故选A.
4.C 残差分布的带状区域的宽度越窄,说明模型拟合精度越高,则残差平方和越小,此时R2的值越大,故描述错误的是选项C.
5.-2.5 因为x=1.5,y=2,经验回归方程为y^=3x+a^,
所以2=3×1.5+a^,解得a^=-2.5.
6.解(1)因为x=16×(8+8.2+8.4+8.6+8.8+9)=8.5,y=16×(90+84+83+80+75+68)=80.
所以a^=y-b^x=80+20×8.5=250.所以经验回归方程为y^=-20x+250.
(2)设工厂获得的利润为L(单位:元),依题意得
L=x(-20x+250)-4(-20x+250)
=-20x2+330x-1 000
=-20x-3342+361.25.
当且仅当x=334=8.25时,L取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
7.解作出散点图(图略),观察散点图可知这些点散布在一条直线的附近,故可知x与y线性相关.
因为x=22+20+18+16+145=18,
y=37+41+43+50+565=45.4.
所以b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=∑i=15xiyi-5x y∑i=15xi2-5x2=3 992-5×18×45.41 660-5×182=-2.35,
a^=45.4-(-2.35)×18=87.7.
所以经验回归方程为y^=-2.35x+87.7.
yi-y^i与yi-y的值如下表:
yi-y^i
1
0.3
-2.4
-0.1
1.2
yi-y
-8.4
-4.4
-2.4
4.6
10.6
计算得∑i=15(yi-y^i)2=8.3,
∑i=15(yi-y)2=229.2,
所以R2=1-8.3229.2≈0.964.
因为0.964很接近于1,所以该模型的拟合效果比较好.
8.D 由题意,得x=15×(20+30+40+50+60)=40,y=15×(25+27.5+29+32.5+36)=30,
则k=y-0.25x=30-0.25×40=20,故A正确;
由经验回归方程可知,b^=0.25>0,变量x,y呈正相关关系,故B正确;
若x的值增加1,则y的值约增加0.25,故C正确;
当x=52时,y^=0.25×52+20=33(℃),故D错误.
9.ACD 对于选项A,因为经验回归直线一定经过点(x,y),故选项A正确;
对于选项B,由样本相关系数的绝对值越趋近于1,相关程度越强可知,若两个变量负线性相关,其线性相关程度越强,则样本相关系数r的值越接近于-1,故选项B错误;
对于选项C,因为在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故选项C正确;
对于选项D,因为在线性回归模型中,决定系数R2越接近于1,说明线性回归模型的拟合效果越好,故选项D正确.
10.D 由表中数据可得,x=1+2+3+4+55=3,y=36.5+40.9+43.3+48.1+51.95=44.14,
∵留学生回国人数y(单位:万)与年份代码x满足的线性回归方程为y^=b^x+32.74,
∴44.14=b^×3+32.74,解得b^=3.8,
故y^=3.8x+32.74,
2022年对应的年份代码为6,令x=6,则y^=3.8×6+32.74=55.54,
故预测2022年留学生回国人数为55.54万.
故选D.
11.B 由已知可得,x=15×(20+23+25+27+30)=25,
z=15×(2+2.4+3+3+4.6)=3,
代入z=0.2x+a,得a=3-0.2×25=-2,
z=ln y=ln(c1ec2x)=c2x+ln c1,
则ln c1=-2,即c1=e-2.
12.4.5 由在样本(4,3)处的残差为-0.15,可得y^=3.15.故3.15=0.7×4+a,解得a=0.35.
由题意可知产量x的平均值为x=14×(3+4+5+6)=4.5.
因为经验回归直线过点(x,y),
所以y=0.7x+0.35=0.7×4.5+0.35=3.5.又因为y=14(9.5+m),
所以m=4.5.
13.(1)40 (2)14 (1)由y=14(55+m+33+24)=38,解得m=40.
(2)由a^=y-b^x,得a^=58.
故y^=-2x+58.
当x=22时,y^=14.
故三月中旬的销售量约为14件.
14.解(1)由题意可得x=2+3+4+5+65=4,y=22+22+17+14+105=17,
b^=∑i=15(xi-x)(yi-y)∑i=15(xi-x)2=
(-2)×5+(-1)×5+0×0+1×(-3)+2×(-7)(-2)2+(-1)2+02+12+22=-3.2,
a^=y-b^x=17+3.2×4=29.8.
故y关于x的经验回归方程为y^=-3.2x+29.8.
(2)r=∑i=1n(xi-x)(yi-y)∑i=1n(xi-x)2·∑i=1n(yi-y)2=
-3210×108=-16330≈-0.97,
由rE(Y),故企业要想获得更高利润,产品单价应选择80元.
(方法二)(ⅰ)若产品单价为80元,记企业的产量为X(单位:千件),其分布列为
X
9
10
P
0.7
0.3
所以E(X)=9×0.7+10×0.3=9.3,
企业的利润为80-40+1009.3×9 300=272 000(元).
(ⅱ)若产品单价为70元,记企业的产量为Y(单位:千件),其分布列为
Y
10
11
P
0.3
0.7
所以E(Y)=10×0.3+11×0.7=10.7,
企业的利润为70-40+10010.7×10 700=221 000(元).
因为272 000>221 000,
所以企业要想获得更高利润,产品单价应选择80元.
16.解(1)y^=0.936 9+0.028 5x的R12=1-0.000 5910.006 050≈0.902;
y^=0.955 4+0.030 6ln x的R22=1-0.000 1640.006 050≈0.973.
由R12