- 4.2.2 离散型随机变量的分布列——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练 试卷 0 次下载
- 4.2.3 二项分布与超几何分布——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练 试卷 0 次下载
- 4.2.4 随机变量的数字特征——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练 试卷 0 次下载
- 4.2.5 正态分布——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练 试卷 0 次下载
- 4.3.2 独立性检验——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练 试卷 0 次下载
高中数学人教B版 (2019)选择性必修 第二册4.3.1 一元线性回归模型同步测试题
展开4.3.1 一元线性回归模型——2022-2023学年高二数学人教B版(2019)选择性必修第二册同步课时训练
一、概念练习
1.变量X与Y相对应的一组数据为;变量U与V相对应的一组数据为,表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则( )
A. B. C. D.
2.设两个变量和之间具有线性相关关系,它们的相关系数为关于的回归直线方程为,则( )
A.与的符号相同 B.与的符号相同 C.与的符号相反 D.与的符号相反
3.某种产品的广告支出x(单位:万元)与销售额y(单位:万元)之间的关系如下表:
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 60 | 50 | 70 |
若已知y关于x的经验回归方程为,那么当广告支出为6万元时,随机误差的效应(残差)为_________万元(残差=观测值-预测值)( )
A.17.5 B.-6.5 C.24.5 D.-56.5
4.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1). 为变量Y与X之间的样本相关系数,为变量U与V之间的样本相关系数,则( )
A. B. C. D.
5.对于样本相关系数r,下列说法中正确的是( )
A.r越大,线性相关程度越强
B.越小,线性相关程度越强
C.越大,线性相关程度越弱
D.,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱
二、能力提升
6.下列关于残差图的描述错误的是( )
A.残差图的纵坐标只能是残差
B.残差图的横坐标可以是编号、解释变量和响应变量
C.残差点分布的带状区域的宽度越窄残差平方和越小
D.残差点分布的带状区域的宽度越窄决定系数越小
7.某工厂为了确定工效进行了5次试验,收集数据如下:
加工零件个数x | 10 | 20 | 30 | 40 | 50 |
加工时间y(分钟) | 64 | 69 | 75 | 82 | 90 |
经检验,这组样本数据的两个变量x与y具有线性相关关系,那么对于加工零件个数x与加工时间y这两个变量,下列判断中正确的是( )
A.负相关,其经验回归直线经过点
B.正相关,其经验回归直线经过点
C.负相关,其经验回归直线经过点
D.正相关,其经验回归直线经过点
8. (多选)已知由样本数据,n求得的经验回归方程为,且,现发现两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )
A.变量x与y具有正相关关系
B.去除后的经验回归方程为
C.去除后y的估计值增加速度变快
D.去除后样本点(2,3.75)的残差为005
9. (多选)下列说法正确的是( )
A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系
B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好
C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好
D.在经验回归方程中,当解释变量x每增加1个单位时,响应变量增加0.1个单位
10. (多选)下列说法中正确的有( )
A.在对分类变量X和Y进行独立性检验时,随机变量的值越大,则“X与Y有关”可信程度越小
B.在经验回归方程中,当解释变量x每增加一个单位时,响应变量y增加0.1个单位
C.两个变量的线性相关性越强,相关系数的绝对值越接近于1
D.在回归分析模型中,若决定系数越大,则残差平方和越小,模型的拟合效果越好
11.某工厂为研究某种产品的产量x(吨)与所需某种原材料的质量y(吨)的相关性,在生产过程中收集4组对应数据,如下表所示.(残差=观测值-预测值)
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | m |
根据表中数据,得出y关于x的经验回归方程为.据此计算出在样本处的残差为-0.15,则表中m的值为__________.
12.若对甲、乙、丙3组不同的成对数据作线性相关性检验,得到这3组成对数据的样本相关系数依次为0.83,0.72,-0.90,则线性相关程度最强的组是________(填“甲”“乙”或“丙”)
13.某工厂为研究某种产品产量(吨)与所需某种原材料(吨)的相关性,在生产过程中收集4组对应数据如表所示:(残差=真实值预测值)
3 | 4 | 5 | 6 | |
2.5 | 3 | 4 |
根据表中数据,得出关于的线性回归方程为.据此计算出在样本点处的残差为,则表中的值为______________.
14.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 总和 |
根部横截面积 | 0.04 | 0.06 | 0.04 | 0.08 | 0.08 | 0.05 | 0.05 | 0.07 | 0.07 | 0.06 | 0.6 |
材积量 | 0.25 | 0.40 | 0.22 | 0.54 | 0.51 | 0.34 | 0.36 | 0.46 | 0.42 | 0.40 | 3.9 |
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
15.某种产品的月广告宣传费用x和月销售额y的统计数据如下表:
月份i | 1 | 2 | 3 | 4 | 5 |
月广告宣传费用(万元) | 8 | 9 | 10 | 11 | 12 |
月销售额(万元) | 60 | 65 | 69 | 70 | 71 |
(1)根据1至5月份的数据,已知变量y与x呈线性相关,求出回归方程;
(2)由线性回归方程得到的估计数据(结果保留整数)与实际数据的误差不超过2万元,则认为得到的线性回归方程是可靠的,试问所得的线性回归方程是否可靠?
参考数据:,.
附:,.
答案以及解析
1.答案:C
解析:由变量X与Y相对应的一组数据为,可得变量Y与X正相关,所以.
而由变量U与V相对应的一组数据为,可知变量V与U负相关,所以.因此与的大小关系是.
2.答案:A
解析:若样本相关系数r为正,则两个变量呈现正相关,经验回归直线呈上升趋势;若样本相关系数r为负,则两个变量呈现负相关,经验回归直线呈下降趋势,与的符号相同.故选A.
3.答案:B
解析:取,得, 当广告支出为6万元时,随机误差的效应(残差)为.故选B.
4.答案:B
解析:由变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),可得变量Y与X之间成正相关,因此;
由变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),可得变量U与V之间成负相关,因此.故.
5.答案:D
解析:对于选项A,越大,线性相关程度越强,A错误;
对于选项B,越小,线性相关程度越弱,B错误;
对于选项C,越大,线性相关程度越强,C错误;
对于选项D,,且越接近1,线性相关程度越强,越接近0,线性相关程度越弱,D正确.
故选D.
6.答案:D
解析:根据残差图的定义和图象即可得到结论.可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高,则对应决定系数越大,故选项D错误.故选D.
7.答案:D
解析:由表中数据可得y随x的增大而增大,故y与x正相关.又
,所以样本点的中心为,而经验回归直线过样本点的中心,因此其经验回归直线经过点,故选D.
8.答案:AB
解析:,经验回归方程为,重新求得的经验回归直线l的斜率为1.2,变量x与y具有正相关关系,设新的数据的所有横坐标的平均值为,纵坐标的平均值为,则,,故,
.
故新的经验回归方程为,故A, B正确;
因为斜率为1.2不变,所以去除后y的估计值增长速度不变,C错误;
把代入新的经验回归方程中,得,故D错误.故选AB.
9.答案:ABD
解析:对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以正确;
对于B,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,所以正确;
对于C,样本相关系数的绝对值越大,只能说明两个变量具有较强的相关性,不能作为分析模型的拟合效果好坏的依据,应该是越大,模型的拟合效果越好,所以错误;
对于D,在经验回归方程中,当解释变量x每增加1个单位时,响应变量增加0.1个单位,所以正确.
故选ABD.
10.答案:CD
解析:由题意得,根据的值越大,分类变量的有关联的可信度就越大,所以A是错误的;根据经验回归方程中回归系数的含义,可知在经验回归方程中,当解释变量x每增加一个单位时,响应变量y平均增加0.1个单位,B是错误的;根据相关系数的计算公式可知,相关系数的绝对值越接近1,两个变量的相关性就越强,所以C是正确的;根据回归分析的基本思想可知决定系数越大,则残差平方和越小,模型的拟合效果越好,D是正确的.故选CD.
11.答案:4.5
解析:由在样本处的残差为,可得,则,解得.
由题表可知,,产量x的平均数为,
由经验回归方程为过点,
可得.则,
解得.
12.答案:丙
解析:样本相关系数越接近1,成对数据的线性相关程度就越强,结合题中所给的3组成对数据的样本相关系数知,-0.90的绝对值最接近1,所以丙组成对数据的线性相关程度最强.
13.答案:4.5
解析:由在样本点处的残差为,可得,则,解得,由题意可知,产量的平均数为,由线性回归方程过点,则,则,解得.
14.答案:(1)0.06,0.39
(2)0.97
(3)1209
解析:(1)估计该林区这种树木平均一棵的根部横截面积,
估计该林区这种树木平均一棵的材积量,
(2),
,
,
所以,
所以样本相关系数.
(3)设该林区这种树木的总材积量的估计值为Y,
由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以,
所以,
即该林区这种树木的总材积量的估计值为1209.
15.答案:(1)
(2)所得的线性回归方程是可靠的
解析:(1)由数据统计表得
,,
则.
又,,
,
,
关于x的线性回归方程为.
(2)由(1)知线性回归方程为,得到五组估计数据如下表:
月广告宣传费用(万元) | 8 | 9 | 10 | 11 | 12 |
月销售额(万元) | 60 | 65 | 69 | 70 | 71 |
估计月销售额(万元) | 61.6 | 64.3 | 67 | 69.7 | 72.4 |
1.6 | 0.7 | 2 | 0.3 | 1.4 |
由上表可知,估计数据与实际数据的误差都不超过2万元,
所得的线性回归方程是可靠的.
数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题: 这是一份数学第四章 概率与统计4.3 统计模型4.3.1 一元线性回归模型优秀课后练习题,共4页。试卷主要包含了3统计模型,54元 D,4X+2,[多选题]设某大学的女生体重Y等内容,欢迎下载使用。
人教B版 (2019)选择性必修 第二册4.2.5 正态分布当堂达标检测题: 这是一份人教B版 (2019)选择性必修 第二册4.2.5 正态分布当堂达标检测题,共7页。试卷主要包含了概念练习,能力提升等内容,欢迎下载使用。
数学选择性必修 第二册3.1.2 排列与排列数同步达标检测题: 这是一份数学选择性必修 第二册3.1.2 排列与排列数同步达标检测题,共5页。试卷主要包含了概念练习,能力提升等内容,欢迎下载使用。