


北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性复习练习题
展开
这是一份北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性复习练习题,共18页。试卷主要包含了选择题,填空题,解答题等内容,欢迎下载使用。
一、选择题
1. 对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( A )
A.模型Ⅰ的相关系数r为0. 98
B.模型Ⅱ的相关系数r为0. 80
C.模型Ⅲ的相关系数r为0. 50
D.模型Ⅳ的相关系数r为0. 25
2. 在一组样本数据(x1,y1),(x2,y2),…,(xn,yn),(n≥2,x1,x2,……,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1B.
C.D.1关系数为1,故选D.
3. 变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( C )
A.1B.-0. 5
C.0D.0. 5
近的值应为0. 故选C.
4. 变量X与Y相对应的一组数据为(10,1),(11. 3,2),(11. 8,3),(12. 5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11. 3,4),(11. 8,3),(12. 5,2),(13,1). r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( B )
A.r2<r1<0
B.r2<0<r1
C.0<r2<r1
D.r2=r1
5. 如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则( C )
A.r1=r2B.r1<r2
C.r1>r2D.无法判定
6. 相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性相关系数为r2. 则( D )
A.0<r1<r2<1
B.0<r2<r1<1
C.-1<r1<r2<0
D.-1<r2<r1<0
7. (多选题)下面的散点图与相关系数 一定不符合的是( ACD )
A B C DACD.
8. (多选题)对相关系数r来说,下列说法错误的有( ABD )
A.|r|≤1,|r|越接近0,线性相关程度越大;|r|越接近1,线性相关程度越小
B.|r|≥1,|r|越接近1,线性相关程度越大;|r|越大,线性相关程度越小
C.|r|≤1,|r|越接近1,线性相关程度越大;|r|越接近0,线性相关程度越小
D.|r|≥1,|r|越接近1 ,线性相关程度越小;|r|越大,线性相关程度越大小”,C正确,故选ABD.
二、填空题
9. 在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图. 如果根据可靠性要求能够作出变量x,y具有线性相关的结论,则操作顺序正确的是②⑤④③①.
10. 如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是E.
最大.
11. 大学生是国家的未来,代表着国家可持续发展的实力,能够促进国家综合实力的提高. 据统计,2016年至2020年我国高校毕业生人数y(单位:万人)的数据如下表:
根据上表数据,计算可得y与x的相关系数r约等于0. 99. (保留两位有效数字)
参考数据:=(xi-)2=10,=(yi-)2=6 733. 2,=259. 5.
三、解答题
12. 某市教育局为了监控某校高一年级的素质教育过程,从该校高一年级16个班随机抽取了16个样本成绩,制表如下:
令xi为抽取的第i个学生的素质教育测评成绩,i=1,2,…,16,经计算得xi≈96. 31,s=≈2. 08,≈18. 44,(xi-)(i-8. 5)=68. 5,以下计算精确到0. 01.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答xi与i是否可以认为具有较强的相关性;
(2)在抽取的样本成绩中,如果出现了在(-3s,+3s)之外的成绩,就认为本学期的素质教育过程可能出现了异常情况,需对本学期的素质教学过程进行反思,同时对下学期的素质教育过程提出指导性的建议,从该校抽样的结果来看,是否需对本学期的素质教学过程进行反思,同时对下学期的素质教育过程提出指导性的建议?
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=,若|r|>0. 75,则可以认为两个变量具有较强的线性相关性.
13. 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得年龄和脂肪含量的样本数据,如下表:
根据上表中的样本数据得到如下的散点图.
(1)根据上表中的样本数据及散点图:
①求;
②计算样本的相关系数(精确到0. 01),并推断脂肪含量和年龄的相关程度;
(2)若y关于x的线性回归方程为Y=1. 56+X,求的值(精确到0. 01),并根据回归方程估计年龄为50岁时人体的脂肪含量.
附:参考数据:=27,xiyi=13 527. 8,=23 638,=7 759. 6,≈6. 56,≈54. 18.
参考公式:相关系数
r==,
回归直线Y=X中斜率和截距的最小二乘估计分别为
.
.
14. 已知x与y之间的几组数据如下表:
上表数据中y的平均值为2. 5,若某同学对m赋了三个值分别为1. 5,2,2. 5得到三个线性回归方程分别为Y=b1X+a1,Y=b2X+a2,Y=b3X+a3,对应的相关系数分别为r1,r2,r3,下列结论中错误的是( D )
参考公式:线性回归方程Y=,其中;
相关系数r=.
A.三条回归直线有共同交点
B.相关系数中,r2最大
C.b1>b2
D.a1>a2
15. 在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为-1 .
北师大高中数学选择性必修第一册
第七章课时作业50成对数据的线性相关性(解析版)
一、选择题
1. 对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( A )
A.模型Ⅰ的相关系数r为0. 98
B.模型Ⅱ的相关系数r为0. 80
C.模型Ⅲ的相关系数r为0. 50
D.模型Ⅳ的相关系数r为0. 25
解析:根据相关系数的定义,相关系数r的绝对值越接近于1,拟合效果越好,因此模型Ⅰ最好. 故选A.
2. 在一组样本数据(x1,y1),(x2,y2),…,(xn,yn),(n≥2,x1,x2,……,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1B.
C.D.1
解析:因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,所以这组样本数据的样本相关系数为1,故选D.
3. 变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( C )
A.1B.-0. 5
C.0D.0. 5
解析:根据变量x,y的散点图,得x,y之间的样本相关关系非常不明显,所以相关系数r最接近的值应为0. 故选C.
4. 变量X与Y相对应的一组数据为(10,1),(11. 3,2),(11. 8,3),(12. 5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11. 3,4),(11. 8,3),(12. 5,2),(13,1). r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( B )
A.r2<r1<0
B.r2<0<r1
C.0<r2<r1
D.r2=r1
解析:∵变量X与Y相对应的一组数据为(10,1),(11. 3,2),(11. 8,3),(12. 5,4),(13,5),可得变量Y与X之间成正相关,因此r1>0;变量U与V相对应的一组数据为(10,5),(11. 3,4),(11. 8,3),(12. 5,2),(13,1),可得变量V与U之间成负相关,因此r2<0. ∴第一组数据的相关系数大于0,第二组数据的相关系数小于0. 故选B.
5. 如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则( C )
A.r1=r2B.r1<r2
C.r1>r2D.无法判定
解析:根据A,B两组样本数据的散点图知,A组样本数据几乎在一条直线上,且成正相关,所以相关系数r1应最接近1,B组数据分散在一条直线附近,也成正相关,所以相关系数为r2,满足r2<r1,即r1>r2,故选C.
6. 相关变量x,y的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性相关系数为r2. 则( D )
A.0<r1<r2<1
B.0<r2<r1<1
C.-1<r1<r2<0
D.-1<r2<r1<0
解析:由散点图得负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下数据点更具有线性相关性,|r2|更接近1,所以-1<r2<r1<0. 故选D.
7. (多选题)下面的散点图与相关系数 一定不符合的是( ACD )
A B C D
解析:对于A,变量x,y的散点图从左向右是下降的,所以相关系数r<0,A错误;对于B,变量x,y的散点图从左向右是上升的,所以相关系数r>0,B正确;对于C,变量x,y的散点图从左到右是向下的带状分布,所以相关系数r<0,C错误;对于D,变量 x,y的散点图从左向右是上升的带状分布,所以相关系数0<r<1,D错误. 综上,散点图与相关系数r一定不符合的是ACD.故选ACD.
8. (多选题)对相关系数r来说,下列说法错误的有( ABD )
A.|r|≤1,|r|越接近0,线性相关程度越大;|r|越接近1,线性相关程度越小
B.|r|≥1,|r|越接近1,线性相关程度越大;|r|越大,线性相关程度越小
C.|r|≤1,|r|越接近1,线性相关程度越大;|r|越接近0,线性相关程度越小
D.|r|≥1,|r|越接近1 ,线性相关程度越小;|r|越大,线性相关程度越大
解析:用相关系数r可以衡量两个变量之间的线性相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在线性相关关系,故“对于相关系数r来说,|r|≤1,|r|越接近1,相关程度越大;|r|越接近0,线性相关程度越小”,C正确,故选ABD.
二、填空题
9. 在对两个变量x,y进行线性回归分析时有下列步骤:①对所求出的回归方程作出解释;②收集数据;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图. 如果根据可靠性要求能够作出变量x,y具有线性相关的结论,则操作顺序正确的是②⑤④③①.
解析:进行线性回归分析一般经历以下几个过程:首先对相关数据进行收集,根据收集的数据作出散点图,根据散点图作出线性相关或非线性相关或不相关的判断,进行相关系数计算从数量角度分析,以确定相关程度大小,这样可以提高回归分析的可信度. 最后求出回归方程并结合方程进行实际意义说明. 故操作顺序正确的是②⑤④③①.
10. 如图是具有相关关系的两个变量的一组数据的散点图和回归直线,若去掉一个点使得余下的5个点所对应的数据的相关系数最大,则应当去掉的点是E.
解析:因为相关系数的绝对值越大,越接近1,则说明两个变量的相关性越强. 因为点E到回归直线的距离最远,所以去掉点E, 余下的5个点所对应的数据的相关系数最大.
11. 大学生是国家的未来,代表着国家可持续发展的实力,能够促进国家综合实力的提高. 据统计,2016年至2020年我国高校毕业生人数y(单位:万人)的数据如下表:
根据上表数据,计算可得y与x的相关系数r约等于0. 99. (保留两位有效数字)
参考数据:=(xi-)2=10,=(yi-)2=6 733. 2,=259. 5.
解析:由题得=18,=817. 6.
所以(xi-)(yi-)=(-2)×(-52. 6)+(-1)×(-22. 6)+16. 4+2×56. 4=257.
所以r==
≈0. 99.
三、解答题
12. 某市教育局为了监控某校高一年级的素质教育过程,从该校高一年级16个班随机抽取了16个样本成绩,制表如下:
令xi为抽取的第i个学生的素质教育测评成绩,i=1,2,…,16,经计算得xi≈96. 31,s=≈2. 08,≈18. 44,(xi-)(i-8. 5)=68. 5,以下计算精确到0. 01.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答xi与i是否可以认为具有较强的相关性;
(2)在抽取的样本成绩中,如果出现了在(-3s,+3s)之外的成绩,就认为本学期的素质教育过程可能出现了异常情况,需对本学期的素质教学过程进行反思,同时对下学期的素质教育过程提出指导性的建议,从该校抽样的结果来看,是否需对本学期的素质教学过程进行反思,同时对下学期的素质教育过程提出指导性的建议?
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=,若|r|>0. 75,则可以认为两个变量具有较强的线性相关性.
解:(1)由样本数据得(xi,i)(i=1,2,…,16)的相关系数为
r==≈0. 45,
因为|r|≈0. 45≤0. 75,所以可以认为xi与i不具有较强的线性相关性.
(2)由已知xi≈96. 31,
s=≈2. 08,得(-3s,+3s)=(90. 07,102. 55),
由样本数据可以看出抽取的第4个测评成绩90在(+3s)=(90. 07,102. 55)以外,因此需对本学期的素质教学过程进行反思,同时对下学期的素质教育过程提出指导性的建议.
13. 科研人员在对人体脂肪含量和年龄之间关系的研究中,获得年龄和脂肪含量的样本数据,如下表:
根据上表中的样本数据得到如下的散点图.
(1)根据上表中的样本数据及散点图:
①求;
②计算样本的相关系数(精确到0. 01),并推断脂肪含量和年龄的相关程度;
(2)若y关于x的线性回归方程为Y=1. 56+X,求的值(精确到0. 01),并根据回归方程估计年龄为50岁时人体的脂肪含量.
附:参考数据:=27,xiyi=13 527. 8,=23 638,=7 759. 6,≈6. 56,≈54. 18.
参考公式:相关系数
r==,
回归直线Y=X中斜率和截距的最小二乘估计分别为
.
解:(1)①==47.
②样本的相关系数r=
=
=
=
=.
因为≈6. 56,≈54. 18,所以r≈0. 98.
由样本的相关系数r≈0. 98,可以推断脂肪含量和年龄的相关程度很强.
(2)因为y关于x的线性回归方程为Y=1. 56+X,所以=1. 56,所以≈0. 54,或利用=≈0. 54.
所以y关于x的线性回归方程为Y=0. 54X+1. 56.
将x=50代入线性回归方程得Y=0. 54×50+1. 56=28. 56.
所以根据回归方程估计年龄为50岁时人体的脂肪含量为28. 56%.
14. 已知x与y之间的几组数据如下表:
上表数据中y的平均值为2. 5,若某同学对m赋了三个值分别为1. 5,2,2. 5得到三个线性回归方程分别为Y=b1X+a1,Y=b2X+a2,Y=b3X+a3,对应的相关系数分别为r1,r2,r3,下列结论中错误的是( D )
参考公式:线性回归方程Y=,其中;
相关系数r=.
A.三条回归直线有共同交点
B.相关系数中,r2最大
C.b1>b2
D.a1>a2
解析:由题意,1+m+n+4=10,即m+n=5. 若m=1. 5,则n=3. 5,此时=2. 5,=2. 5.
(xi-)(yi-)=(1-2. 5)(1-2. 5)+(2-2. 5)·(1. 5-2. 5)+(3-2. 5)(3. 5-2. 5)+(4-2. 5)(4-2. 5)=5. 5,
(xi-)2=(-1. 5)2+(-0. 5)2+0. 52+1. 52=5,(yi-)2=(-1. 5)2+(-1)2+12+1. 52=6. 5.
则b1==1. 1,a1=2. 5-1. 1×2. 5=-0. 25,r1=;
若m=2,则n=3,此时=2. 5,=2. 5.
(xi-)(yi-)=(1-2. 5)(1-2. 5)+(2-2. 5)(2-2. 5)+(3-2. 5)(3-2. 5)+(4-2. 5)(4-2. 5)=5,
(xi-)2=5,(yi-)2=(-1. 5)2+(-0. 5)2+0. 52+1. 52=5.
b2==1,a2=2. 5-1×2. 5=0,r2==1;
若m=2. 5,则n=2. 5,此时=2. 5,=2. 5.
(xi-)(yi-)=(1-2. 5)(1-2. 5)+(2-2. 5)·(2. 5-2. 5)+(3-2. 5)(2. 5-2. 5)+(4-2. 5)(4-2. 5)=4. 5,
(xi-)2=5,(yi-)2=(-1. 5)2+1. 52=4. 5,r3=.
由相同,故A正确;
由以上计算可得,相关系数中,r2最大,b1>b2,a1<a2,故B,C正确,D错误. 故选D.
15. 在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为-1.
解析:因为=1. 5,=1,=22,=56,xiyi=-20,
所以相关系数r==-1.
年份
2016
2017
2018
2019
2020
年份代号x
16
17
18
19
20
高校毕业生人数
y(单位:万人)
765
795
820
834
874
抽取次序
1
2
3
4
5
6
7
8
测评成绩
95
96
96
90
95
98
98
97
抽取次序
9
10
11
12
13
14
15
16
测评成绩
97
95
96
98
99
96
99
96
年龄X/岁
26
27
39
41
49
53
56
58
60
61
脂肪含量
Y/%
14. 5
17. 8
21. 2
25. 9
26. 3
29. 6
31. 4
33. 5
35. 2
34. 6
x
1
2
3
4
y
1
m
n
4
年份
2016
2017
2018
2019
2020
年份代号x
16
17
18
19
20
高校毕业生人数
y(单位:万人)
765
795
820
834
874
抽取次序
1
2
3
4
5
6
7
8
测评成绩
95
96
96
90
95
98
98
97
抽取次序
9
10
11
12
13
14
15
16
测评成绩
97
95
96
98
99
96
99
96
年龄X/岁
26
27
39
41
49
53
56
58
60
61
脂肪含量
Y/%
14. 5
17. 8
21. 2
25. 9
26. 3
29. 6
31. 4
33. 5
35. 2
34. 6
x
1
2
3
4
y
1
m
n
4
相关试卷
这是一份高中数学北师大版 (2019)选择性必修 第一册2.2 成对数据的线性相关性课后练习题,共18页。
这是一份高中数学北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性精练,共10页。试卷主要包含了1 相关系数 2等内容,欢迎下载使用。
这是一份北师大版 (2019)选择性必修 第一册第七章 统计案例2 成对数据的线性相关性2.2 成对数据的线性相关性同步达标检测题,共3页。试卷主要包含了5≈0,315等内容,欢迎下载使用。