


还剩12页未读,
继续阅读
所属成套资源:人教a版数学选择性必修第三册习题全套
成套系列资料,整套一键下载
高中数学(人教A版2019) 选择性必修第三册 人教A版(2019)选择性必修第三册《第八章 成对数据的统计分析》章节练习(含答案)
展开
这是一份高中数学(人教A版2019) 选择性必修第三册 人教A版(2019)选择性必修第三册《第八章 成对数据的统计分析》章节练习(含答案),共15页。
人教A版(2019)选择性必修第三册《第八章 成对数据的统计分析》章节练习
一 、单选题(本大题共8小题,共40分)
1.(5分)以下四个命题中:
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②若数据x1,x2,x3,…xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为2;
③两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;
④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关”的把握越大.
其中真命题的个数为( )
A. 1 B. 2 C. 3 D. 4
2.(5分)工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为∧ y=50+80x,下列判断不正确的是( )
A. 劳动生产率为1000元时,工资约为130元
B. 工人月工资与劳动者生产率具有正相关关系
C. 劳动生产率提高1000元时,则工资约提高130元
D. 当月工资为210元时,劳动生产率约为2000元
3.(5分)已知某种商品的广告费支出x(单位;万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
m
70
根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为ŷ=6.5x+17.5,则表中m的值为( )
A. 45 B. 50 C. 55 D. 60
4.(5分)2020年初,新型冠状病毒(COVID-19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
周数(x)
1
2
3
4
5
治愈人数(y)
2
17
36
93
142
由表格可得y关于x的二次回归方程为̂y=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为( )
A. 5 B. 4 C. 1 D. 0
5.(5分)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),则下列结论正确的是( )
A. x和y成正相关
B. 若直线l方程为̂y=̂bx+̂a,则̂b>0
C. 最小二乘法是使尽量多的样本点落在直线上的方法
D. 直线l过点(x,y)
6.(5分)对具有线性相关关系的变量x,y,测得一组数据如表所示,由最小二乘法求得回归方程为̂y=0.95x+2.6,则表中看不清的数据为( )
x
0
1
3
4
y
2.2
4.3
■
6.7
A. 4.8 B. 5.2 C. 5.8 D. 6.2
7.(5分)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
60
70
根据上表可得回归方程\hat y=\hat bx+\hat a,计算得\hat b=7,则当投入12万元广告费时,销售额的预报值为( )
A. 75万元 B. 85万元 C. 99万元 D. 105万元
8.(5分)人们眼中的天才之所以优秀卓越,并非是他们的天赋异禀,而是付出了持续不断的努力.一万小时的锤炼是任何人从平庸变成非凡,从困境走向成功的必要条件.某个学生为提高自己的数学做题准确率和速度,决定坚持每天刷题,刷题时间x与做题正确率y的统计数据如表:
刷题时间x个单位(10分钟为1个单位)
2
3
4
5
准确率y(%)
26
39
49
54
根据上表可得回归方程\hat y=\hat bx+\hat a中的\hat b为9.4,据此模型预报刷题时间为6个单位的准确率为( )
A. 72.0% B. 67.7% C. 65.5% D. 63.6%
二 、多选题(本大题共5小题,共25分)
9.(5分)已知变量x,y之间的线性回归方程为ŷ=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A. 变量x, y之间呈负相关关系 B. 可以预测,当x=20时,ŷ=-3.7
C. m=4 D. 该回归直线必过点(9,4)
10.(5分)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到回归直线方程为ŷ=2x-0.4且x=2,去除其中两个点A(-2,7)和B(2,-7)后,得到新的回归直线的\hatb=3.则下列说法正确的是( )(附:样本点(xi,yi)的残差\hatei=yi-\hatyi)
A. 相关变量x,y具有正相关关系
B. 去除点A,B后的回归直线方程为ŷ=3x-3.2
C. 去除点A,B后,随x值增加相关变量y值增加速度变小
D. 去除点A,B后,样本点(4,8.9)的残差为0.1
11.(5分)某车间加工的零件数x与加工时间y的统计数据如下表:
零件数x(个)
10
20
30
加工时间y(分钟)
22
29
m
现已求得上表数据的回归方程为y^=0.85x+13,则
A. 变量x和y成正线性相关
B. 变量x和y成非线性相关
C. m=38.5
D. 根据此回归模型可以预测,加工100个零件所需要的加工时间约为98分钟
12.(5分)给出下列四个命题:
①线性相关系数r的绝对值越大,两个变量的线性相关性越弱;反之,线性相关性越强;
②将一组数据中的每个数据都加上或减去同一个常数后,平均值不变
③将一组数据中的每个数据都加上或减去同一个常数后,方差不变
④在回归方程ŷ=4x+4中,变量x每增加一个单位时,ŷ平均增加4个单位.
其中错误命题的序号是( )
A. ① B. ② C. ③ D. ④
13.(5分)下列命题中正确的有 ( )
A. 对立事件一定是互斥事件,但互斥事件不一定是对立事件
B. 两个随机变量的线性相关系数越大,则两个变量的线性相关性越强
C. 回归直线\widehaty=\widehatbx+\widehata必过样本点的中心
D. 相关指数R2越大,则模型的拟合效果越好
三 、填空题(本大题共5小题,共25分)
14.(5分)研究身高和体重的关系时,求得相关指数R2≈______ ,可以叙述为“身高解释了76%的体重变化,而随机误差贡献了剩余的24%”所以身高对体重的效应比随机误差的效应大得多.
15.(5分)已知x,y的取值如下表所示,若x与y线性相关,且回归直线方程为ŷ=\hatbx+132,则\hatb的值为__________________
x
2
3
4
y
6
4
5
16.(5分)某公司统计了第x年(2013年是第一年)的经济效益为y(千万元),得到如下表格:
x
3
4
5
6
y
2.5
3
4
4.5
若由表中数据得到的线性回归方程是ŷ=mx+0.35,则可预测2020年经济效益大约是________千万元.
17.(5分)(仅文科生做)对具有线性相关关系的变量x和y,测得一组数据如下:
x
2
4
5
6
8
y
30
40
60
50
70
若已求得它们的回归方程的̂b为6.5,则这条直线的回归方程为 ______ .
18.(5分)在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是______ .
四 、解答题(本大题共5小题,共60分)
19.(12分)通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示:
资金投入 x
2
3
4
5
6
利润 y
2
3
5
6
9
(1)根据上表提供的数据,用最小二乘法求线性回归直线方程ŷ=\hatbx+â;
(2)计算x=6时的残差\widehate; (残差公式:\widehatei=yi-\widehatyi)
(3)现投入资金10(万元),求估计获得的利润为多少万元.
(附:\hatb=i=1nxiyi-nøverlinex yi=1nxi2-nx2,â=y-\hatbx)
20.(12分)“双十一网购狂欢节”源于淘宝商城(天猫)2009年11月11日举办的促销活动,当时参与的商家数量和促销力度均有限,但营业额远超预想的效果,于是11月11日成为天猫举办大规模促销活动的固定日期.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某淘宝电商为分析近8年“双十一”期间的宣传费用x(单位:万元)和利润y(单位:十万元)之间的关系,搜集了相关数据,得到下列表格:
x(万元)
2
3
4
5
6
8
9
11
y(十万元)
1
2
3
3
4
5
6
8
(1)请用相关系数r说明y与x之间是否存在线性相关关系(当|r|>0.81时,说明y与x之间具有线性相关关系);
(2)建立y关于x的线性回归方程(系数精确到0.1),预测当宣传费用为30万元时的利润,
附参考公式:回归方程\hat y=\hat bx+\hat a中\hat b和\hat a最小二乘估计公式分别为\hat b=i=1nxiyi-n- x.- y i=1nxi2-n- x2,\hat a=- y-\hat b- x,相关系数r=i=1nxiyi-n- x.- y i=1n(xi-- x)2.i=1n(yi-- y)2
参考数据:i=18xiyi=241,i=18xi2=356,i=18(xi-- x)2≈8.25,i=18(yi-- y)2=6
21.(12分)如表是某位文科生连续5次月考的历史、政治的成绩,结果如下:
月份
9
10
11
12
1
历史(x分)
79
81
83
85
87
政治(y分)
77
79
79
82
83
参考公式:\hat b=i=1n(xi-- x)(yi-- y) i=1n(xi-- x)2=i=1nxiyi-n- xy i=1nxi2-n- x2,\hat a=- y-\hat b- x,- x,- y表示样本均值.
(1)求该生5次月考历史成绩的平均分和政治成绩的平均数;
(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x,y的线性回归方程.
22.(12分)物理学中常用“伏安法”测量电阻值(单位:欧姆),现用仪器测量某一定值电阻在不同电压下的电流值测得一组数据(xi,yi)(i=1,2,⋅⋅⋅,10),其中,xi和yi分别表示第i次测量数据的电流(单位:安培)和电压(单位:伏特),计算得i=110xi=2.4,i=110yi=12,i=110xiyi=3.196,i=110xi2=0.6432.
(1)用最小二乘法求出回归直线方程(\hat b与\hat a精确到0.01);
(2)由“伏安法”可知,直线的斜率是电阻的估计值,请用计算得到的数据说明电阻的估计值.
附:回归直线的斜率和截距的最小二乘估计公式分别为:\hat b=i=1nxiyi-n- x- y i=1nxi2-n- x2,\hat a=- - y-\hat b- x.
23.(12分)2019年,中国的国内生产总值(GDP)已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没.实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如表数据:
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
根据以上数据,绘制了如图的散点图.
现考虑用反比例函数模型y=a+bx和指数函数模型y=cedx分别对两个变量的关系进行拟合.为此变换如下:
令μ=1x,则y=a+bu,即y与u满足线性关系;令v=lny,则v=lnc+dx,即v与x也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为̂y=96.54edx,v与x的相关系数r1=-0.94,其他参考数据如表(其中ui=1xi,vi=lnyi):
i=18uiyi
- u
- u2
i=18ui2
i=18yi
i=18yi2
0.61×6185.5
e-2
ln96.54
- v
183.4
0.34
0.115
1.53
360
22385.5
61.4
0.135
4.6
3.7
(1)求指数函数模型和反比例函数模型中y关于x的回归方程;
(2)试计算y与u的相关系数r2,并用相关系数判断选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?
参考公式:
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:\hat β=i=1nμivi-n- μ- v i=1nμi2-n- μ2,̂α=- v-̂β- u,相关系数r=i=1nuivi-n- u- v (i=1nui2-n- u2)(i=1nvi2-n- v2).
答案和解析
1.【答案】A;
【解析】解:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,故①错误,
②若数据x1,x2,x3,…xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为4;故②错误
③根据线性相关系数r的意义可知,当两个随机变量线性相关性越强,r的绝对值越接近于1,故③正确;
④根据两个分类变量X与Y的随机变量k2的观测值k来说,k越大,判断“x与y有关”的把握程度越大,得④是假命题.故④错误,
故正确的是③,
故选:A
①根据抽样方法的定义和特点即可判断;
②根据变量方差关系进行判断,
③用相关性系数r的意义去判断;
④根据随机变量k2的观测值k越大,“x与y有关系”的把握程度越大,判断④是否为真命题.
该题考查命题的真假判断,涉及抽样方法的概念、相关系数的意义以及方差的关系,是一道基础题.
2.【答案】C;
【解析】
该题考查了线性回归方程的应用问题,是基础题目.
根据线性回归方程∧ y=50+80x的意义,对选项中的命题进行分析、判断即可.
解:根据线性回归方程为∧ y=50+80x,得;
劳动生产率为1000元时,工资约为50+80×1=130元,A正确;
∵∧ b=80>0,∴工人月工资与劳动者生产率具有正相关关系,B正确;
劳动生产率提高1000元时,工资约提高∧ b=80元,C错误;
当月工资为210元时,210=50+80x,解得x=2,
此时劳动生产率约为2000元,D正确.
故选:C.
3.【答案】D;
【解析】解:由表中数据,计算- x=1 5×(2+4+5+6+8)=5,
- y=1 5×(30+40+50+m+70)=38+m 5,
∵回归直线方程ŷ=6.5x+17.5过样本中心,
∴38+m 5=6.5×5+17.5,
解得m=60.
故选:D.
由表中数据计算- x、- y,根据回归直线方程过样本中心点,求出m的值.
该题考查了回归直线方程过样本中心点的应用问题,是基础题.
4.【答案】A;
【解析】
此题主要考查非线性回归分析和残差问题,属于中档题.
可通过换元转化为线性回归分析问题来解本题.
解:令t=x2,
则y关于x的二次回归方程为ŷ=6x2+a可化为线性回归方程ŷ=6t+a,
因x依次取值为1、2、3、4、5;
则t依次取值为1、4、9、16、25.
t=1+4+9+16+255=11,y=2+17+36+93+1425=58.
因回归直线方程ŷ=6t+a过样本中心点(11,58),
故有58=66+a,得a=-8,
故回归直线方程为ŷ=6t-8,
所以y关于x的二次回归方程为ŷ=6x2-8.
当x=4时,y的实际值等于93,y的预报值等于6×42-8=88,
∴则此回归模型第4周的残差=93-88=5.
故选A.
5.【答案】D;
【解析】解:由图可知x和y成负相关,故A错误;
̂b表示回归直线的斜率,所以̂b<0,故B错误;
最小二乘法是求到样本点的平均距离最小的直线的方法,故C错误;
回归直线过样本中心点(x,y),正确.
故选:D.
对4个选项,分别进行判断,即可得出结论.
此题主要考查线性回归方程,考查学生分析解决问题的能力,比较基础.
6.【答案】A;
【解析】解:x=0+1+3+44=2,∴y=0.95×2+2.6=4.5.
设看不清的数值为a,则y=2.2+4.3+a+6.74=4.5.
解得a=4.8.
故选:A.
求出x代入回归方程解出y,根据平均数公式列方程解出.
此题主要考查了线性回归方程的性质,属于基础题.
7.【答案】C;
【解析】解:由题意可得,- x=2+4+5+6+8 5=5,- y=30+40+50+60+70 5=50,
因为样本中心(5,50)在回归方程\hat y=7x+\hat a上,
则50=7×5+\hat a,解得\hat a=15,
所以回归方程为\hat y=7x+15,
当x=12时,\hat y=7×12+15=99,
所以当投入12万元广告费时,销售额的预报值为99万元.
故选:C.
先求出样本中心,利用样本中心在回归方程上,求出\hat a,从而得到回归方程,将x=12代入求解即可.
此题主要考查了线性回归方程的求解与应用,要掌握线性回归方程必过样本中心这一知识点,考查了逻辑推理能力与运算能力,属于中档题.
8.【答案】C;
【解析】解:∵- x=2+3+4+5 4=3.5,- y=26+39+49+54 4=42,
∴样本点的中心的坐标为(3.5,42),代入\hat y=\hat bx+\hat a,
得42=3.5×9.4+\hat a,则\hat a=9.1,
∴\hat y=9.4x+9.1,取x=6,得\hat y=9.4×6+9.1=65.5.
∴预报刷题时间为6个单位的准确率为65.5%.
故选:C.
由已知求得样本点的中心的坐标,代入线性回归方程求得\hat a,在线性回归方程中,取x=6求得\hat y值即可.
此题主要考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.
9.【答案】ABD;
【解析】
此题主要考查了线性回归方程的求法及应用,属于基础题.
根据线性回归方程的性质依次判断各选项即可.
解:对于A:根据\hatb的正负即可判断正负相关关系,
线性回归方程为ŷ=-0.7x+10.3,\hatb=-0.7<0,负相关,A正确;
对于B,当x=20时,代入可得ŷ=-3.7,B正确;
对于C:根据表中数据:- x=1 4(6+8+10+12)=9,
可得y=-0.7×9+10.3= 4,
即1 4(6+m+3+2)=4,解得:m=5,C错误;
对于D:回归直线一定过点- x,- y,即过点(9,4),D正确.
故选ABD.
10.【答案】ABD;
【解析】
此题主要考查回归分析的理解, 还考查了理解辨析的能力, 属于基础题
A.根据回归直线方程的x系数的正负判断.B.求去除前后样本点判断即可.C.根据去除前后x的系数大小判断.D.根据残差的计算公式\widehatei=yi-\widehatyi判断.
解:因为回归直线方程为\widehaty=2x-0.4,
所以变量x与y具有正相关关系.故A正确.
当x=2时,y=2×2-0.4=3.6,样本点为(2,3.6),
去掉两个数据点(-2,7)和(2,-7)后,样本点为83,4.8,
又因为去除后重新求得的回归直线的斜率为3,
所以4.8=3×83+a,解得a=-3.2,
所以去除后的回归方程为\widehaty=3x-3.2,故B正确.
因为3>2,所以去除点A,B后,
由样本估计总体的y值增加的速度变大,故C错误;
由\widehatyi=3xi-3.2=3×4-3.2=8.8,
得\widehatei=yi-\widehatyi=8.9-8.8=0.1,故D正确.
故选:ABD.
11.【答案】AD;
【解析】
此题主要考查线性回归方程的求法和应用,属于基础题.
求出样本数据的中心坐标(x,y),代入回归直线方程,求出m,然后求解加工100个零件所需要的加工时间.
解: 因为b^=0.85>0,故变量x和y成正相关,且为线性相关.
x=13×(10+20+30)=20,
又回归直线y^=0.85x+13恒过样本点的中心(x,y),y=0.85×20+13=30,所以22+29+m=3y=90,解得m=39.当x=100时,y^=0.85×100+13=98,由此可以预测,加工100个零件所需要的加工时间约为98分钟.
12.【答案】AB;
【解析】
此题主要考查了相关系数,方差,回归方程,平均数等知识,属于中档题.
根据相关系数判断①;根据平均数的性质判断②;根据方差的性质判断③;根据所给线性回归方程判断④.
解:①因为相关系数r的绝对值越大,说明两个变量间相关性越强,所以①不正确;
②给一组数据的每一个数同时加上或减去同一个常数,平均数会相应的增加或减小所加或减的常数,所以②不正确;
③方差反映一组数据的波动的大小,由方差公式知将一组数据中的每个数据都加上或减去同一个常数后,方差不变,所以③正确;
④当x每增加一个单位时,可计算得ŷ平均增加4个单位,所以④正确;
故选AB.
13.【答案】ACD;
【解析】
此题主要考查互斥事件与对立事件、相关系数、相关指数和回归直线方程的问题,属于基础题.
根据互斥事件与对立事件、相关系数、相关指数和回归直线方程的相关知识逐项分析即可.
解:根据互斥事件与对立事件的概念可知,A正确;
两个随机变量的线性相关系数的绝对值越接近于1,则两个变量的线性相关性越强,B错误;
回归直线ŷ=\hatbx+â必过样本点的中心,C正确;
相关指数R2越大,则模型的拟合效果越好,D正确.
故选ACD.
14.【答案】0.76;
【解析】解:在研究身高与体重的关系时,
∵身高解释了76%的体重变化,而随机误差贡献了剩余的24%,
∴求得的相关指数R2=0.76.
故答案为:0.76.
根据身高解释了76%的体重变化,而随机误差贡献了剩余的24%,可得相关指数的值.
此题主要考查了两个变量的相关性分析及相关系数的意义,熟练掌握相关系数的含义是关键.
15.【答案】-12;
【解析】
此题主要考查线性回归方程,考查样本中心点和线性回归直线的关系,属于基础题.
根据所给的三组数据,求出这组数据的平均数,得到这组数据的样本中心点,根据线性回归直线一定过样本中心点,把样本中心点代入所给的方程,得到结果.
解:根据所给的三对数据,得到x=2+3+43=3,y=6+4+53=5,
∴这组数据的样本中心点是(3,5)
∵线性回归直线的方程一定过样本中心点,
∴5=3\hatb+132,
解得\hatb=-12.
故答案为-12.
16.【答案】5.95;
【解析】
此题主要考查线性回归方程的应用,属于基础题.
先根据线性回归方程经过样本中心,求出m的值,得到线性回归方程为ŷ=0.7x+0.35,再令x=8,求出ŷ的值即可.
解:由表格中的数据求得x=3+4+5+64=4.5,
y=2.5+3+4+4.54=3.5,
所以样本点的中心坐标为(4.5,3.5),
代入ŷ=mx+0.35,得3.5=4.5m+0.35,解得m=0.7,
∴线性回归方程为ŷ=0.7x+0.35,
取x=8,得ŷ=5.95.
故答案为5.95.
17.【答案】̂y=6.5x+17.5;
【解析】解:∵øverlinex=15(2+4+5+6+8)=5,
øverliney=15(30+40+60+50+70)=50,
̂a=øverliney-6.5øverlinex=50-6.5×5=17.55,
故线性回归方程为:̂y=6.5x+17.5;
故答案为:̂y=6.5x+17.5
根据横标和纵标的平均数,得到这组数据的样本中心点,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.
该题考查线性回归方程的求法和应用,本题解答该题的关键是利用最小二乘法求出线性回归方程的系数,这是解答正确的主要环节.
18.【答案】甲;
【解析】
在线性回归模型中,R2解释变量对于预报变量变化的贡献率,它的值越接近于1表示回归的效果越好,如果对于某组数据可以采用几种不同的回归方程进行分析,可以通过比较它的值选择较大的模型作为这组数据的模型.
根据相关指数R2取值越大,说明残差平方和越小,模型的拟合效果越好,又有甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,可以看出甲模型的拟合效果好.
解:∵相关指数R2取值越大,说明残差平方和越小,模型的拟合效果越好,
又∵甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,
0.96>0.85
∴甲模型的拟合效果好,
故答案为甲.
19.【答案】 解:(1)x=2+3+4+5+65=4,y=2+3+5+6+95=5.
\hatb=i=15xiyi-5øverlinex yi=15xi2-5x2=2×2+3×3+4×5+5×6+6×9-5×4×54+9+16+25+36-5×16=1.7
∴â=y-\hatbx=-1.8,
∴ŷ=1.7x-1.8.
(2)当x=6(万元)时,ŷ=1.7×6-1.8=8.4,
所以ê=9-8.4=0.6.
(3)当x=10(万元)时,ŷ=1.7×10-1.8=15.2(万元);
【解析】此题主要考查回归直线方程及其应用,属于基础题.
(1)根据所给的五对数据,利用最小二乘法求出线性回归方程的系数,得到方程;
(2)根据(1)直接代入残差公式计算即得;
(3)把所给的x的值代入线性回归方程,求出y的预报值,得到投入资金10(万元),估计获得的利润.
20.【答案】解:(1)由题意得- x=6,- y=4…(2分)
又i=18xiyi=241,i=18xi2=356,i=18(xi-- x)2≈8.25,i=18(yi-- y)2=6,
所以r=i=18xiyi-8- x.- y i=18(xi-- x)2.i=18(yi-- y)2≈241-8×6×48.25×6≈0.99>0.81…(4分)
所以,y与x之间具有线性相关关系…(5分)
(2)因为̂ b=i=18xiyi-8- x.- y i=18xi2-8- x2=241-8×6×4 356-8×62=49 68≈0.72,…(7分)
̂ a=- y-̂ b- x=4-0.72×6≈-0.3
…(9分)
所以y关于x的线性回归方程为̂ y=0.7x-0.3.
当x=30时,̂ y=0.7×30-0.3=20.7
故可预测当宣传费用为30万元时的利润为20.7十万元(或207万元)…(12分);
【解析】
(1)相关系数的绝对值越大,相关性越强,求出相关系数,判断即可.
(2)根据公式,将对应值代入公式,再将x代成30即可预测当宣传费用为30万元时的利润,
该题考查了相关性的判断,回归方程的求法,属于基础题.
21.【答案】(1)根据题意,计算- x=1 5×(79+81+83+85+87)=83,- y=1 5×(77+79+79+82+83)=80;
(2)计算i=15(xi-- x)(yi-- y)=30,i=15(xi-- x)2=40,
∴回归系数为̂ b=i=1n(xi-- x)(yi-- y) i=1n(xi-- x)2=3040=0.75,
̂ a=- y-̂ b- x=80-0.75×83=17.75,
故所求的线性回归方程为̂ y=0.75x+17.75.;
【解析】
(1)直接由表格中的数据结合平均数公式求解;
(2)求出\hat b与\hat a的值,则线性回归方程可求.
该题考查线性回归方程的求法,考查计算能力,是中档题.
22.【答案】解:(1)i=110xi=2.4,- x=2.410=0.24,
i=110yi=12,- y=1210=1.2,
̂ b=i=1nxiyi-n- x- y i=1nxi2-n- x2=3.196-10×0.24×1.20.6432-10×0.242
=0.3160.0672≈4.70,
̂ a=1.2-4.70×0.24=0.072≈0.07.
所以,回归直线方程为̂ y=4.70x+0.07.
(2)由“伏安法”可知,直线的斜率是电阻的估计值,所以电阻的估计值为4.70欧姆.;
【解析】
(1)利用已知条件求出样本中心坐标,求出回归直线方程的系数,得到回归直线方程.
(2)由“伏安法”可知,直线的斜率是电阻的估计值,推出结果.
此题主要考查回归直线方程的应用,是基本知识的考查.
23.【答案】解:(1)因为̂y=96.54cdx,所以lny=ln96.54+dx⇔v=4.6+dx,
将- v=3.7,- x=4.5代入上式,得d=-0.2,所以̂y=96.54e-0.2x,
令u=1x,则y=a+bu,
因为- y=360 8=45,所以̂b=i=18uiyi-8- u.- y i=18ui2-8- u2=183.4-8×0.34×45 1.53-8×0.115=100,
则̂a=- y-̂b.- u=45-100×0.34=11,
所以̂y=11+100u,所以y关于x的回归方程为̂y=11+100x.
综上,指数模型回归方程为̂y=96.54e-0.2r,反比例函数回归方程为̂y=11+100x.
(2)y与u的相关系数为r2=i=18uiyi-8- u.- y (i=18ui2-8- u2)(i=18yi2-8- y2)=61 0.61×6185.5=61 61.4≈0.99,
因为|r1|<|r2|,所以用反比例函数模型拟合效果更好.;
【解析】
(1)利用̂y=96.54cdx,利用对数的运算法则,求解回归直线方程的系数,推出回归直线方程即可.
(2)求出y与u的相关系数,判断用反比例函数模型拟合效果更好.
该题考查回归直线方程的求法,考查转化思想以及计算能力,是中档题.
人教A版(2019)选择性必修第三册《第八章 成对数据的统计分析》章节练习
一 、单选题(本大题共8小题,共40分)
1.(5分)以下四个命题中:
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②若数据x1,x2,x3,…xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为2;
③两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;
④对分类变量x与y的随机变量K2的观测值k来说,k越小,判断“x与y有关”的把握越大.
其中真命题的个数为( )
A. 1 B. 2 C. 3 D. 4
2.(5分)工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为∧ y=50+80x,下列判断不正确的是( )
A. 劳动生产率为1000元时,工资约为130元
B. 工人月工资与劳动者生产率具有正相关关系
C. 劳动生产率提高1000元时,则工资约提高130元
D. 当月工资为210元时,劳动生产率约为2000元
3.(5分)已知某种商品的广告费支出x(单位;万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
m
70
根据表中提供的全部数据,用最小二乘法得出y与x的线性回归方程为ŷ=6.5x+17.5,则表中m的值为( )
A. 45 B. 50 C. 55 D. 60
4.(5分)2020年初,新型冠状病毒(COVID-19)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
周数(x)
1
2
3
4
5
治愈人数(y)
2
17
36
93
142
由表格可得y关于x的二次回归方程为̂y=6x2+a,则此回归模型第4周的残差(实际值与预报值之差)为( )
A. 5 B. 4 C. 1 D. 0
5.(5分)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),则下列结论正确的是( )
A. x和y成正相关
B. 若直线l方程为̂y=̂bx+̂a,则̂b>0
C. 最小二乘法是使尽量多的样本点落在直线上的方法
D. 直线l过点(x,y)
6.(5分)对具有线性相关关系的变量x,y,测得一组数据如表所示,由最小二乘法求得回归方程为̂y=0.95x+2.6,则表中看不清的数据为( )
x
0
1
3
4
y
2.2
4.3
■
6.7
A. 4.8 B. 5.2 C. 5.8 D. 6.2
7.(5分)已知某种商品的广告费支出x(单位:万元)与销售额y(单位:万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
60
70
根据上表可得回归方程\hat y=\hat bx+\hat a,计算得\hat b=7,则当投入12万元广告费时,销售额的预报值为( )
A. 75万元 B. 85万元 C. 99万元 D. 105万元
8.(5分)人们眼中的天才之所以优秀卓越,并非是他们的天赋异禀,而是付出了持续不断的努力.一万小时的锤炼是任何人从平庸变成非凡,从困境走向成功的必要条件.某个学生为提高自己的数学做题准确率和速度,决定坚持每天刷题,刷题时间x与做题正确率y的统计数据如表:
刷题时间x个单位(10分钟为1个单位)
2
3
4
5
准确率y(%)
26
39
49
54
根据上表可得回归方程\hat y=\hat bx+\hat a中的\hat b为9.4,据此模型预报刷题时间为6个单位的准确率为( )
A. 72.0% B. 67.7% C. 65.5% D. 63.6%
二 、多选题(本大题共5小题,共25分)
9.(5分)已知变量x,y之间的线性回归方程为ŷ=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A. 变量x, y之间呈负相关关系 B. 可以预测,当x=20时,ŷ=-3.7
C. m=4 D. 该回归直线必过点(9,4)
10.(5分)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到回归直线方程为ŷ=2x-0.4且x=2,去除其中两个点A(-2,7)和B(2,-7)后,得到新的回归直线的\hatb=3.则下列说法正确的是( )(附:样本点(xi,yi)的残差\hatei=yi-\hatyi)
A. 相关变量x,y具有正相关关系
B. 去除点A,B后的回归直线方程为ŷ=3x-3.2
C. 去除点A,B后,随x值增加相关变量y值增加速度变小
D. 去除点A,B后,样本点(4,8.9)的残差为0.1
11.(5分)某车间加工的零件数x与加工时间y的统计数据如下表:
零件数x(个)
10
20
30
加工时间y(分钟)
22
29
m
现已求得上表数据的回归方程为y^=0.85x+13,则
A. 变量x和y成正线性相关
B. 变量x和y成非线性相关
C. m=38.5
D. 根据此回归模型可以预测,加工100个零件所需要的加工时间约为98分钟
12.(5分)给出下列四个命题:
①线性相关系数r的绝对值越大,两个变量的线性相关性越弱;反之,线性相关性越强;
②将一组数据中的每个数据都加上或减去同一个常数后,平均值不变
③将一组数据中的每个数据都加上或减去同一个常数后,方差不变
④在回归方程ŷ=4x+4中,变量x每增加一个单位时,ŷ平均增加4个单位.
其中错误命题的序号是( )
A. ① B. ② C. ③ D. ④
13.(5分)下列命题中正确的有 ( )
A. 对立事件一定是互斥事件,但互斥事件不一定是对立事件
B. 两个随机变量的线性相关系数越大,则两个变量的线性相关性越强
C. 回归直线\widehaty=\widehatbx+\widehata必过样本点的中心
D. 相关指数R2越大,则模型的拟合效果越好
三 、填空题(本大题共5小题,共25分)
14.(5分)研究身高和体重的关系时,求得相关指数R2≈______ ,可以叙述为“身高解释了76%的体重变化,而随机误差贡献了剩余的24%”所以身高对体重的效应比随机误差的效应大得多.
15.(5分)已知x,y的取值如下表所示,若x与y线性相关,且回归直线方程为ŷ=\hatbx+132,则\hatb的值为__________________
x
2
3
4
y
6
4
5
16.(5分)某公司统计了第x年(2013年是第一年)的经济效益为y(千万元),得到如下表格:
x
3
4
5
6
y
2.5
3
4
4.5
若由表中数据得到的线性回归方程是ŷ=mx+0.35,则可预测2020年经济效益大约是________千万元.
17.(5分)(仅文科生做)对具有线性相关关系的变量x和y,测得一组数据如下:
x
2
4
5
6
8
y
30
40
60
50
70
若已求得它们的回归方程的̂b为6.5,则这条直线的回归方程为 ______ .
18.(5分)在比较两个模型的拟合效果时,甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,则拟合效果好的模型是______ .
四 、解答题(本大题共5小题,共60分)
19.(12分)通过市场调查,得到某产品的资金投入x(万元)与获得的利润y(万元)的数据,如下表所示:
资金投入 x
2
3
4
5
6
利润 y
2
3
5
6
9
(1)根据上表提供的数据,用最小二乘法求线性回归直线方程ŷ=\hatbx+â;
(2)计算x=6时的残差\widehate; (残差公式:\widehatei=yi-\widehatyi)
(3)现投入资金10(万元),求估计获得的利润为多少万元.
(附:\hatb=i=1nxiyi-nøverlinex yi=1nxi2-nx2,â=y-\hatbx)
20.(12分)“双十一网购狂欢节”源于淘宝商城(天猫)2009年11月11日举办的促销活动,当时参与的商家数量和促销力度均有限,但营业额远超预想的效果,于是11月11日成为天猫举办大规模促销活动的固定日期.如今,中国的“双十一”已经从一个节日变成了全民狂欢的“电商购物日”.某淘宝电商为分析近8年“双十一”期间的宣传费用x(单位:万元)和利润y(单位:十万元)之间的关系,搜集了相关数据,得到下列表格:
x(万元)
2
3
4
5
6
8
9
11
y(十万元)
1
2
3
3
4
5
6
8
(1)请用相关系数r说明y与x之间是否存在线性相关关系(当|r|>0.81时,说明y与x之间具有线性相关关系);
(2)建立y关于x的线性回归方程(系数精确到0.1),预测当宣传费用为30万元时的利润,
附参考公式:回归方程\hat y=\hat bx+\hat a中\hat b和\hat a最小二乘估计公式分别为\hat b=i=1nxiyi-n- x.- y i=1nxi2-n- x2,\hat a=- y-\hat b- x,相关系数r=i=1nxiyi-n- x.- y i=1n(xi-- x)2.i=1n(yi-- y)2
参考数据:i=18xiyi=241,i=18xi2=356,i=18(xi-- x)2≈8.25,i=18(yi-- y)2=6
21.(12分)如表是某位文科生连续5次月考的历史、政治的成绩,结果如下:
月份
9
10
11
12
1
历史(x分)
79
81
83
85
87
政治(y分)
77
79
79
82
83
参考公式:\hat b=i=1n(xi-- x)(yi-- y) i=1n(xi-- x)2=i=1nxiyi-n- xy i=1nxi2-n- x2,\hat a=- y-\hat b- x,- x,- y表示样本均值.
(1)求该生5次月考历史成绩的平均分和政治成绩的平均数;
(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x,y的线性回归方程.
22.(12分)物理学中常用“伏安法”测量电阻值(单位:欧姆),现用仪器测量某一定值电阻在不同电压下的电流值测得一组数据(xi,yi)(i=1,2,⋅⋅⋅,10),其中,xi和yi分别表示第i次测量数据的电流(单位:安培)和电压(单位:伏特),计算得i=110xi=2.4,i=110yi=12,i=110xiyi=3.196,i=110xi2=0.6432.
(1)用最小二乘法求出回归直线方程(\hat b与\hat a精确到0.01);
(2)由“伏安法”可知,直线的斜率是电阻的估计值,请用计算得到的数据说明电阻的估计值.
附:回归直线的斜率和截距的最小二乘估计公式分别为:\hat b=i=1nxiyi-n- x- y i=1nxi2-n- x2,\hat a=- - y-\hat b- x.
23.(12分)2019年,中国的国内生产总值(GDP)已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没.实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如表数据:
x
1
2
3
4
5
6
7
8
y
112
61
44.5
35
30.5
28
25
24
根据以上数据,绘制了如图的散点图.
现考虑用反比例函数模型y=a+bx和指数函数模型y=cedx分别对两个变量的关系进行拟合.为此变换如下:
令μ=1x,则y=a+bu,即y与u满足线性关系;令v=lny,则v=lnc+dx,即v与x也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为̂y=96.54edx,v与x的相关系数r1=-0.94,其他参考数据如表(其中ui=1xi,vi=lnyi):
i=18uiyi
- u
- u2
i=18ui2
i=18yi
i=18yi2
0.61×6185.5
e-2
ln96.54
- v
183.4
0.34
0.115
1.53
360
22385.5
61.4
0.135
4.6
3.7
(1)求指数函数模型和反比例函数模型中y关于x的回归方程;
(2)试计算y与u的相关系数r2,并用相关系数判断选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?
参考公式:
对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为:\hat β=i=1nμivi-n- μ- v i=1nμi2-n- μ2,̂α=- v-̂β- u,相关系数r=i=1nuivi-n- u- v (i=1nui2-n- u2)(i=1nvi2-n- v2).
答案和解析
1.【答案】A;
【解析】解:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是系统抽样,故①错误,
②若数据x1,x2,x3,…xn的方差为1,则2x1,2x2,2x3,…,2xn的方差为4;故②错误
③根据线性相关系数r的意义可知,当两个随机变量线性相关性越强,r的绝对值越接近于1,故③正确;
④根据两个分类变量X与Y的随机变量k2的观测值k来说,k越大,判断“x与y有关”的把握程度越大,得④是假命题.故④错误,
故正确的是③,
故选:A
①根据抽样方法的定义和特点即可判断;
②根据变量方差关系进行判断,
③用相关性系数r的意义去判断;
④根据随机变量k2的观测值k越大,“x与y有关系”的把握程度越大,判断④是否为真命题.
该题考查命题的真假判断,涉及抽样方法的概念、相关系数的意义以及方差的关系,是一道基础题.
2.【答案】C;
【解析】
该题考查了线性回归方程的应用问题,是基础题目.
根据线性回归方程∧ y=50+80x的意义,对选项中的命题进行分析、判断即可.
解:根据线性回归方程为∧ y=50+80x,得;
劳动生产率为1000元时,工资约为50+80×1=130元,A正确;
∵∧ b=80>0,∴工人月工资与劳动者生产率具有正相关关系,B正确;
劳动生产率提高1000元时,工资约提高∧ b=80元,C错误;
当月工资为210元时,210=50+80x,解得x=2,
此时劳动生产率约为2000元,D正确.
故选:C.
3.【答案】D;
【解析】解:由表中数据,计算- x=1 5×(2+4+5+6+8)=5,
- y=1 5×(30+40+50+m+70)=38+m 5,
∵回归直线方程ŷ=6.5x+17.5过样本中心,
∴38+m 5=6.5×5+17.5,
解得m=60.
故选:D.
由表中数据计算- x、- y,根据回归直线方程过样本中心点,求出m的值.
该题考查了回归直线方程过样本中心点的应用问题,是基础题.
4.【答案】A;
【解析】
此题主要考查非线性回归分析和残差问题,属于中档题.
可通过换元转化为线性回归分析问题来解本题.
解:令t=x2,
则y关于x的二次回归方程为ŷ=6x2+a可化为线性回归方程ŷ=6t+a,
因x依次取值为1、2、3、4、5;
则t依次取值为1、4、9、16、25.
t=1+4+9+16+255=11,y=2+17+36+93+1425=58.
因回归直线方程ŷ=6t+a过样本中心点(11,58),
故有58=66+a,得a=-8,
故回归直线方程为ŷ=6t-8,
所以y关于x的二次回归方程为ŷ=6x2-8.
当x=4时,y的实际值等于93,y的预报值等于6×42-8=88,
∴则此回归模型第4周的残差=93-88=5.
故选A.
5.【答案】D;
【解析】解:由图可知x和y成负相关,故A错误;
̂b表示回归直线的斜率,所以̂b<0,故B错误;
最小二乘法是求到样本点的平均距离最小的直线的方法,故C错误;
回归直线过样本中心点(x,y),正确.
故选:D.
对4个选项,分别进行判断,即可得出结论.
此题主要考查线性回归方程,考查学生分析解决问题的能力,比较基础.
6.【答案】A;
【解析】解:x=0+1+3+44=2,∴y=0.95×2+2.6=4.5.
设看不清的数值为a,则y=2.2+4.3+a+6.74=4.5.
解得a=4.8.
故选:A.
求出x代入回归方程解出y,根据平均数公式列方程解出.
此题主要考查了线性回归方程的性质,属于基础题.
7.【答案】C;
【解析】解:由题意可得,- x=2+4+5+6+8 5=5,- y=30+40+50+60+70 5=50,
因为样本中心(5,50)在回归方程\hat y=7x+\hat a上,
则50=7×5+\hat a,解得\hat a=15,
所以回归方程为\hat y=7x+15,
当x=12时,\hat y=7×12+15=99,
所以当投入12万元广告费时,销售额的预报值为99万元.
故选:C.
先求出样本中心,利用样本中心在回归方程上,求出\hat a,从而得到回归方程,将x=12代入求解即可.
此题主要考查了线性回归方程的求解与应用,要掌握线性回归方程必过样本中心这一知识点,考查了逻辑推理能力与运算能力,属于中档题.
8.【答案】C;
【解析】解:∵- x=2+3+4+5 4=3.5,- y=26+39+49+54 4=42,
∴样本点的中心的坐标为(3.5,42),代入\hat y=\hat bx+\hat a,
得42=3.5×9.4+\hat a,则\hat a=9.1,
∴\hat y=9.4x+9.1,取x=6,得\hat y=9.4×6+9.1=65.5.
∴预报刷题时间为6个单位的准确率为65.5%.
故选:C.
由已知求得样本点的中心的坐标,代入线性回归方程求得\hat a,在线性回归方程中,取x=6求得\hat y值即可.
此题主要考查线性回归方程,明确线性回归方程恒过样本点的中心是关键,是基础题.
9.【答案】ABD;
【解析】
此题主要考查了线性回归方程的求法及应用,属于基础题.
根据线性回归方程的性质依次判断各选项即可.
解:对于A:根据\hatb的正负即可判断正负相关关系,
线性回归方程为ŷ=-0.7x+10.3,\hatb=-0.7<0,负相关,A正确;
对于B,当x=20时,代入可得ŷ=-3.7,B正确;
对于C:根据表中数据:- x=1 4(6+8+10+12)=9,
可得y=-0.7×9+10.3= 4,
即1 4(6+m+3+2)=4,解得:m=5,C错误;
对于D:回归直线一定过点- x,- y,即过点(9,4),D正确.
故选ABD.
10.【答案】ABD;
【解析】
此题主要考查回归分析的理解, 还考查了理解辨析的能力, 属于基础题
A.根据回归直线方程的x系数的正负判断.B.求去除前后样本点判断即可.C.根据去除前后x的系数大小判断.D.根据残差的计算公式\widehatei=yi-\widehatyi判断.
解:因为回归直线方程为\widehaty=2x-0.4,
所以变量x与y具有正相关关系.故A正确.
当x=2时,y=2×2-0.4=3.6,样本点为(2,3.6),
去掉两个数据点(-2,7)和(2,-7)后,样本点为83,4.8,
又因为去除后重新求得的回归直线的斜率为3,
所以4.8=3×83+a,解得a=-3.2,
所以去除后的回归方程为\widehaty=3x-3.2,故B正确.
因为3>2,所以去除点A,B后,
由样本估计总体的y值增加的速度变大,故C错误;
由\widehatyi=3xi-3.2=3×4-3.2=8.8,
得\widehatei=yi-\widehatyi=8.9-8.8=0.1,故D正确.
故选:ABD.
11.【答案】AD;
【解析】
此题主要考查线性回归方程的求法和应用,属于基础题.
求出样本数据的中心坐标(x,y),代入回归直线方程,求出m,然后求解加工100个零件所需要的加工时间.
解: 因为b^=0.85>0,故变量x和y成正相关,且为线性相关.
x=13×(10+20+30)=20,
又回归直线y^=0.85x+13恒过样本点的中心(x,y),y=0.85×20+13=30,所以22+29+m=3y=90,解得m=39.当x=100时,y^=0.85×100+13=98,由此可以预测,加工100个零件所需要的加工时间约为98分钟.
12.【答案】AB;
【解析】
此题主要考查了相关系数,方差,回归方程,平均数等知识,属于中档题.
根据相关系数判断①;根据平均数的性质判断②;根据方差的性质判断③;根据所给线性回归方程判断④.
解:①因为相关系数r的绝对值越大,说明两个变量间相关性越强,所以①不正确;
②给一组数据的每一个数同时加上或减去同一个常数,平均数会相应的增加或减小所加或减的常数,所以②不正确;
③方差反映一组数据的波动的大小,由方差公式知将一组数据中的每个数据都加上或减去同一个常数后,方差不变,所以③正确;
④当x每增加一个单位时,可计算得ŷ平均增加4个单位,所以④正确;
故选AB.
13.【答案】ACD;
【解析】
此题主要考查互斥事件与对立事件、相关系数、相关指数和回归直线方程的问题,属于基础题.
根据互斥事件与对立事件、相关系数、相关指数和回归直线方程的相关知识逐项分析即可.
解:根据互斥事件与对立事件的概念可知,A正确;
两个随机变量的线性相关系数的绝对值越接近于1,则两个变量的线性相关性越强,B错误;
回归直线ŷ=\hatbx+â必过样本点的中心,C正确;
相关指数R2越大,则模型的拟合效果越好,D正确.
故选ACD.
14.【答案】0.76;
【解析】解:在研究身高与体重的关系时,
∵身高解释了76%的体重变化,而随机误差贡献了剩余的24%,
∴求得的相关指数R2=0.76.
故答案为:0.76.
根据身高解释了76%的体重变化,而随机误差贡献了剩余的24%,可得相关指数的值.
此题主要考查了两个变量的相关性分析及相关系数的意义,熟练掌握相关系数的含义是关键.
15.【答案】-12;
【解析】
此题主要考查线性回归方程,考查样本中心点和线性回归直线的关系,属于基础题.
根据所给的三组数据,求出这组数据的平均数,得到这组数据的样本中心点,根据线性回归直线一定过样本中心点,把样本中心点代入所给的方程,得到结果.
解:根据所给的三对数据,得到x=2+3+43=3,y=6+4+53=5,
∴这组数据的样本中心点是(3,5)
∵线性回归直线的方程一定过样本中心点,
∴5=3\hatb+132,
解得\hatb=-12.
故答案为-12.
16.【答案】5.95;
【解析】
此题主要考查线性回归方程的应用,属于基础题.
先根据线性回归方程经过样本中心,求出m的值,得到线性回归方程为ŷ=0.7x+0.35,再令x=8,求出ŷ的值即可.
解:由表格中的数据求得x=3+4+5+64=4.5,
y=2.5+3+4+4.54=3.5,
所以样本点的中心坐标为(4.5,3.5),
代入ŷ=mx+0.35,得3.5=4.5m+0.35,解得m=0.7,
∴线性回归方程为ŷ=0.7x+0.35,
取x=8,得ŷ=5.95.
故答案为5.95.
17.【答案】̂y=6.5x+17.5;
【解析】解:∵øverlinex=15(2+4+5+6+8)=5,
øverliney=15(30+40+60+50+70)=50,
̂a=øverliney-6.5øverlinex=50-6.5×5=17.55,
故线性回归方程为:̂y=6.5x+17.5;
故答案为:̂y=6.5x+17.5
根据横标和纵标的平均数,得到这组数据的样本中心点,利用最小二乘法求出线性回归方程的系数,代入样本中心点求出a的值,写出线性回归方程.
该题考查线性回归方程的求法和应用,本题解答该题的关键是利用最小二乘法求出线性回归方程的系数,这是解答正确的主要环节.
18.【答案】甲;
【解析】
在线性回归模型中,R2解释变量对于预报变量变化的贡献率,它的值越接近于1表示回归的效果越好,如果对于某组数据可以采用几种不同的回归方程进行分析,可以通过比较它的值选择较大的模型作为这组数据的模型.
根据相关指数R2取值越大,说明残差平方和越小,模型的拟合效果越好,又有甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,可以看出甲模型的拟合效果好.
解:∵相关指数R2取值越大,说明残差平方和越小,模型的拟合效果越好,
又∵甲、乙两个模型的相关指数R2的值分别约为0.96和0.85,
0.96>0.85
∴甲模型的拟合效果好,
故答案为甲.
19.【答案】 解:(1)x=2+3+4+5+65=4,y=2+3+5+6+95=5.
\hatb=i=15xiyi-5øverlinex yi=15xi2-5x2=2×2+3×3+4×5+5×6+6×9-5×4×54+9+16+25+36-5×16=1.7
∴â=y-\hatbx=-1.8,
∴ŷ=1.7x-1.8.
(2)当x=6(万元)时,ŷ=1.7×6-1.8=8.4,
所以ê=9-8.4=0.6.
(3)当x=10(万元)时,ŷ=1.7×10-1.8=15.2(万元);
【解析】此题主要考查回归直线方程及其应用,属于基础题.
(1)根据所给的五对数据,利用最小二乘法求出线性回归方程的系数,得到方程;
(2)根据(1)直接代入残差公式计算即得;
(3)把所给的x的值代入线性回归方程,求出y的预报值,得到投入资金10(万元),估计获得的利润.
20.【答案】解:(1)由题意得- x=6,- y=4…(2分)
又i=18xiyi=241,i=18xi2=356,i=18(xi-- x)2≈8.25,i=18(yi-- y)2=6,
所以r=i=18xiyi-8- x.- y i=18(xi-- x)2.i=18(yi-- y)2≈241-8×6×48.25×6≈0.99>0.81…(4分)
所以,y与x之间具有线性相关关系…(5分)
(2)因为̂ b=i=18xiyi-8- x.- y i=18xi2-8- x2=241-8×6×4 356-8×62=49 68≈0.72,…(7分)
̂ a=- y-̂ b- x=4-0.72×6≈-0.3
…(9分)
所以y关于x的线性回归方程为̂ y=0.7x-0.3.
当x=30时,̂ y=0.7×30-0.3=20.7
故可预测当宣传费用为30万元时的利润为20.7十万元(或207万元)…(12分);
【解析】
(1)相关系数的绝对值越大,相关性越强,求出相关系数,判断即可.
(2)根据公式,将对应值代入公式,再将x代成30即可预测当宣传费用为30万元时的利润,
该题考查了相关性的判断,回归方程的求法,属于基础题.
21.【答案】(1)根据题意,计算- x=1 5×(79+81+83+85+87)=83,- y=1 5×(77+79+79+82+83)=80;
(2)计算i=15(xi-- x)(yi-- y)=30,i=15(xi-- x)2=40,
∴回归系数为̂ b=i=1n(xi-- x)(yi-- y) i=1n(xi-- x)2=3040=0.75,
̂ a=- y-̂ b- x=80-0.75×83=17.75,
故所求的线性回归方程为̂ y=0.75x+17.75.;
【解析】
(1)直接由表格中的数据结合平均数公式求解;
(2)求出\hat b与\hat a的值,则线性回归方程可求.
该题考查线性回归方程的求法,考查计算能力,是中档题.
22.【答案】解:(1)i=110xi=2.4,- x=2.410=0.24,
i=110yi=12,- y=1210=1.2,
̂ b=i=1nxiyi-n- x- y i=1nxi2-n- x2=3.196-10×0.24×1.20.6432-10×0.242
=0.3160.0672≈4.70,
̂ a=1.2-4.70×0.24=0.072≈0.07.
所以,回归直线方程为̂ y=4.70x+0.07.
(2)由“伏安法”可知,直线的斜率是电阻的估计值,所以电阻的估计值为4.70欧姆.;
【解析】
(1)利用已知条件求出样本中心坐标,求出回归直线方程的系数,得到回归直线方程.
(2)由“伏安法”可知,直线的斜率是电阻的估计值,推出结果.
此题主要考查回归直线方程的应用,是基本知识的考查.
23.【答案】解:(1)因为̂y=96.54cdx,所以lny=ln96.54+dx⇔v=4.6+dx,
将- v=3.7,- x=4.5代入上式,得d=-0.2,所以̂y=96.54e-0.2x,
令u=1x,则y=a+bu,
因为- y=360 8=45,所以̂b=i=18uiyi-8- u.- y i=18ui2-8- u2=183.4-8×0.34×45 1.53-8×0.115=100,
则̂a=- y-̂b.- u=45-100×0.34=11,
所以̂y=11+100u,所以y关于x的回归方程为̂y=11+100x.
综上,指数模型回归方程为̂y=96.54e-0.2r,反比例函数回归方程为̂y=11+100x.
(2)y与u的相关系数为r2=i=18uiyi-8- u.- y (i=18ui2-8- u2)(i=18yi2-8- y2)=61 0.61×6185.5=61 61.4≈0.99,
因为|r1|<|r2|,所以用反比例函数模型拟合效果更好.;
【解析】
(1)利用̂y=96.54cdx,利用对数的运算法则,求解回归直线方程的系数,推出回归直线方程即可.
(2)求出y与u的相关系数,判断用反比例函数模型拟合效果更好.
该题考查回归直线方程的求法,考查转化思想以及计算能力,是中档题.
相关资料
更多