- 7.5 正态分布 (专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册 试卷 6 次下载
- 第7章 随机变量及其分布(专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册 试卷 5 次下载
- 8.2 一元线性回归模型及其应用 (专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册 试卷 4 次下载
- 8.3 列联表与独立性检验 (专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册 试卷 3 次下载
- 第8章 成对数据的统计分析(专项训练)-【新教材】2020-2021学年人教A版(2019)高中数学选择性必修第三册 试卷 3 次下载
2021学年8.1 成对数据的相关关系达标测试
展开2020—2021学年高二数学下学期
8.1成对数据的统计相关性
专项训练
一、单选题(共12题;共60分)
1.以下四个命题中:
①函数关系是一种确定性关系;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;
③独立性检验中的统计假设就是假设相关事件、相互独立;
④某项测量结果服从正态分布,且,则.
以上命题中,真命题的个数为( )
A.1个 B.2个 C.3个 D.4个
2.下列说法正确的是( )
A.若残差平方和越小,则相关指数越小
B.将一组数据中每一个数据都加上或减去同一常数,方差不变
C.若的观测值越大,则判断两个分类变量有关系的把握程度越小
D.若所有样本点均落在回归直线上,则相关系数
3.下列说法:①越小,X与Y有关联的可信度越小;②若两个随机变量的线性相关性越强,则相关系数r的值越接近于1;③“若,则类比推出,“若,则;④命题“有些有理数是无限循环小数,整数是有理数,所以整数是无限循环小数”是假命题,推理错误的原因是使用了“三段论”,推理形式错误.其中说法正确的有个
A.0 B.1 C.2 D.3
4.根据最小二乘法由一组样本点(其中),求得的回归方程是,则下列说法正确的是
A.至少有一个样本点落在回归直线上
B.若所有样本点都在回归直线上,则变量同的相关系数为1
C.对所有的解释变量(),的值一定与有误差
D.若回归直线的斜率,则变量x与y正相关
5.有一散点图如图所示,在5个数据中去掉(3,10)后,下列说法正确的是( )
A.残差平方和变小 B.方差变大
C.相关指数变小 D.解释变量与预报变量的相关性变弱
6.某同学将收集到的六组数据制作成散点图如图所示,并得到其回归直线的方程为,计算其相关系数为,相关指数为.经过分析确定点为“离群点”,把它去掉后,再利用剩下的5组数据计算得到回归直线的方程为,相关系数为,相关指数为.以下结论中,不正确的是
A. B.
C. D.
7.某次测量发现一组数据具有较强的相关性,并计算得,其中数据因书写不清楚,只记得是上的一个值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为( )
A. B. C. D.
8.有一散点图如图所示,在5个数据中去掉后,下列说法正确的是
A.残差平方和变小 B.相关系数变小
C.相关指数变小 D.解释变量与预报变量的相关性变弱
9.下面给出四种说法:
①设、、分别表示数据、、、、、、、、、的平均数、中位数、众数,则;
②在线性回归模型中,相关指数表示解释变量对于预报变量变化的贡献率,越接近于,表示回归的效果越好;
③绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;
④设随机变量服从正态分布,则.
其中不正确的是( ).
A.① B.② C.③ D.④
10.下列说法中正确的个数是
①相关系数用来衡量两个变量之间线性关系的强弱,越接近于1,相关性越弱;
②回归直线过样本点中心;
③相关指数用来刻画回归的效果,越小,说明模型的拟合效果越不好.
A.0 B.1 C.2 D.3
11.已知下列命题:
①回归直线恒过样本点的中心,且至少过一个样本点;
②两个变量相关性越强,则相关系数r就越接近于1;
③将一组数据的每个数据都加一个相同的常数后,方差不变;
④在回归直线方程 中,当解释变量x增加一个单位时,预报变量平均减少0.5;
⑤在线性回归模型中,相关指数表示解释变量对于预报变量的贡献率,越接近于1,表示回归效果越好;
⑥对分类变量与,它们的随机变量的观测值来说, 越小,“与有关系”的把握程度越大.
⑦两个模型中残差平方和越小的模型拟合的效果越好.
则正确命题的个数是( )
A.3 B.4 C.5 D.6
12.下列说法中正确的是
①相关系数用来衡量两个变量之间线性关系的强弱, 越接近于,相关性越弱;
②回归直线一定经过样本点的中心;
③随机误差满足,其方差的大小用来衡量预报的精确度;
④相关指数用来刻画回归的效果, 越小,说明模型的拟合效果越好.
A.①② B.③④ C.①④ D.②③
二、填空题(共4题;共20分)
13.下列说法正确的是:
①在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越差;
②回归分析模型中,残差平方和越小,说明模型的拟合效果越好;
③在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.1个单位
④若,,则;
⑤已知正方体,为底面内一动点,到平面的距离与到直线的距离相等,则点的轨迹是抛物线的一部分.
正确的序号是:______.
14.和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
15.给出下列命题:
①已知,是正数,且,则;
②命题“,使得”的否定是真命题;
③将化成二进位制数是;
④某同学研究变量,之间的相关关系,并求得回归直线方程,他得出一个结论:与 负相关且,
其中正确的命题的序号是__________(把你认为正确的序号都填上).
16.给出下列命题:
①线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱;
②由变量和的数据得到其回归直线方程,则一定经过点;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
④将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,
其中真命题的序号是_________.
三、解答题(共4题;共20分)
17.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸之间近似满足关系式(、为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品.现随机抽取件合格产品,测得数据如下:
尺寸 | 38 | 48 | 58 | 68 | 78 | 88 |
质量 | 16.8 | 18.8 | 20.7 | 22.4 | 24 | 25.5 |
质量与尺寸的比 | 0.442 | 0.392 | 0.357 | 0.329 | 0.308 | 0.290 |
(1)现从抽取的件合格产品中再任选件,记为取到优等品的件数,试求随机变量的期望;
(2)根据测得数据作了初步处理,得相关统计量的值如表:
(i)根据所给统计量,求关于的回归方程;
(ii)已知优等品的收益(单位:千元)与、的关系为,则当优等品的尺寸为何值时,收益的预报值最大?
附:对于样本,其回归直线的斜率和截距的最小二乘估计公式分别为:,,.
18.某地一公司的市场研究人员为了解公司生产的某产品的使用情况,从两个方面进行了调查统计,一是产品的质量参数x,二是产品的使用时间t(单位:千小时),经统计分析,质量参数x服从正态分布,使用时间t与质量参数x之间有如下关系:
质量参数x | 0.65 | 0.70 | 0.75 | 0.80 | 0.85 | 0.90 | 0.95 |
使用时间t | 2.60 | 2.81 | 3.05 | 3.10 | 3.25 | 3.35 | 3.54 |
(1)该地监管部门对该公司的该产品进行检查,要求质量参数在0.785以上的产品为合格产品.现抽取20件该产品进行校验,求合格产品的件数的数学期望;
(2)该公司研究人员根据最小二乘法求得线性回归方程为,请用相关系数说明使用时间t与质量参数x之间的关系是否可用线性回归模型拟合.
附:参考数据:.若,则
参考公式:相关系数;
回归直线方程为,其中.
19.某机构为了解某大学中男生的体重单位:)与身高x(单位:)是否存在较好的线性关系,该机构搜集了7位该校男生的数据,得到如下表格:
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
身高() | 161 | 175 | 169 | 178 | 173 | 168 | 180 |
体重() | 52 | 62 | 54 | 70 | 66 | 57 | 73 |
根据表中数据计算得到关于的线性同归方程为
(1)求
(2)已知且当时,回归方程的拟合效果非常好;当时,回归方程的拟合效果良好.试问该线性回归方程的拟合效果是非常好还是良好?说明你的理由.参考数据:
20.某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,,得到相关数据如表所示:
(1)从①;②;③三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出与的回归方程;
(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?(结果保留到万元)
参考数据:,.
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为,.
参考答案
1.D
【详解】
①函数关系是一种确定性关系,所以①是正确的;
②回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,
所以②是正确的;
③独立性检验中的统计假设就是假设相关事件、相互独立,所以③是正确的;
④某项测量结果服从正态分布,由正态分布定义可知它的图像是关于对称,
因为,则,
所以,所以④是正确的;
故选:D
2.B
【详解】
对于,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,相关指数越大,故错误;
对于,将一组数据的每一个数据都加上或减去同一常数后,由方差的性质可得方差不变,故正确;
对于,对分类变量与,它们的随机变量的观测值越大,“与有关系”的把握程度越大,故错误;
对于,若所有样本点均落在回归直线上,则相关系数,故错误.
故选:B.
3.C
【详解】
①中因为越大,X与Y有关联的可信度越大,所以越小,X与Y有关联的可信度越小,正确;
②中因为若两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,故错误;
③中因为虚数不能比较大小,可知错误;
④中因为大前提的形式:“有些有理数是无限循环小数”,不是全称命题,故推理形式错误判断正确.
故选:C
4.D
【详解】
回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;
所有样本点都在回归直线上,则变量间的相关系数为,故B错误;
若所有的样本点都在回归直线上,则的值与相等,故C错误;
相关系数r与符号相同,若回归直线的斜率,则,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.
故选D.
5.A
【详解】
由散点图可知,去掉后,与的线性相关性加强,且为正相关,
所以变大,变大,残差平方和变小,
故选A.
6.B
【详解】
由图可知两变量呈现正相关,故,且,故,
故正确,不正确.
又回归直线必经过样本中心点,所以,正确.
回归直线必经过样本中心点,所以,
所以,也可直接根据图象判断(比较两直线的倾斜程度),故正确.故选B.
7.C
【详解】
依题意可知,估计值为,残差为,依题意得,解得,根据几何概型概率计算公式可得所求概率为,故选C.
8.A
【详解】
∵从散点图可分析得出:
只有点偏离直线远,去掉点,变量与变量的线性相关性变强,
∴相关系数变大,相关指数变大,残差的平方和变小,故选A.
9.C
【详解】
解:①将数据按从小到大的顺序排列为:
、、、、、、、、、,
中位数:;
;
这组数据的平均数是.
因为此组数据中出现次数最多的数是,
所以是此组数据的众数;
则;
②越接近于,表示回归的效果越好,正确;
③根据频率分布直方图的意义,因为小矩形的面积之和等于,频率之和也为,
所以有各小长方形的面积等于相应各组的频率;故③错;
④∵随机变量服从正态分布,
∴正态曲线的对称轴是,
∴.故④正确.
故选.
10.C
【详解】
①线性相关关系是衡量两个变量之间线性关系强弱的量,越接近于1,这两个变量线性相关关系越强,越接近于0,线性相关关系越弱,故①错误;
②回归直线过样本点中心,故②正确;
③用相关指数来刻画回归的效果,越大,说明模型的拟合效果越好;越小,说明模型的拟合效果越不好,故③正确.
综上,说法中正确的个数是2.故选C.
11.B
【详解】
对于①,回归直线恒过样本点的中心(),可以不过任一个样本点,故①错误;
对于②,两个变量相关性越强,则相关系数r的绝对值就越接近于1,故②错误;
对于③,将一组数据的每个数据都加一个相同的常数后,由方差的性质可得方差不变,故③正确;
对于④,在回归直线方程2﹣0.5x中,当解释变量x每增加一个单位时,
预报变量平均减少0.5个单位,故④正确;
对于⑤,在线性回归模型中,相关指数R2表示解释变量x对于预报变量y的贡献率,
R2越接近于1,表示回归效果越好,故⑤正确;
对于⑥,对分类变量X与Y,它们的随机变量K2的观测值k来说,k越大,
“X与Y有关系”的把握程度越大,故⑥错误;
对于⑦,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故⑦正确.
其中正确个数为4.
故选B.
12.D
【详解】
①相关系数用来衡量两个变量之间线性关系的强弱,越接近于,相关性越强,故错误
②回归直线一定经过样本点的中心,故正确
③随机误差满足,其方差的大小用来衡量预报的精确度,故正确
④相关指数用来刻画回归的效果,越大,说明模型的拟合效果越好,故错误
综上,说法正确的是②③
故选
13.②③④⑤
【详解】
对于①中,在做回归分析时,由残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,所以①不正确;
对于②中,回归分析模型中,残差平方和越小,说明模型的拟合效果越好是正确的,所以②是正确的;
对于③中,在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.1个单位,所以③是正确的.
对于④中,若,,
可得,,
解得,所以,所以④是正确的;
⑤在正方体,则是点到直线的距离,过作垂直于直线,则到平面的距离为,
因为到平面的距离到直线的距离,所以,
根据抛物线的定义,可得点的轨迹是抛物线的一部分,所以⑤是正确的.
故答案为:②③④⑤.
14.①③
【详解】
在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
15.②③④
【详解】
①中作差法可知:
∵a,b是正数,
∴,可知①错;
②中命题的否定为:“,使得”,
即“,使得”显然为真命题,故②正确;
③中则,∵,故③正确;
④中,∵y与x负相关,
∴所求回归直线方程中前面的系数为负数,符合常理,故④正确.
故答案为:②③④.
16.②④⑤
【详解】
①线性相关系数越大,两个变量的线性相关性越强,故①不正确;
②由变量和的数据得到其回归直线方程,其点为样本中心点,一定在回归直线方程上,故②正确;
③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样不是分层抽样,而是系统抽样,故③错误;
④由方差的公式,将一组数据中的每个数据都加上或减去同一个常数后,其平均数也相应的增加或减少同一个常数,故方差不变,故④正确;
⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量平均增加0.1个单位,故⑤正确.
故答案为:②④⑤.
17.(1);(2)(i);(ii)当优等品的尺寸为时,收益的预报值最大.
【详解】
(1)由表可知,抽取的件合格产品中有件优等品,
所以,的所有可能取值为、、、,
,,,
,
所以,随机变量的期望为;
(2)(i),,
,,
,,
,
,,所以,,
故关于的回归方程为;
(ii)由(i)知,,
,
当,即时,取得最大值,
故当优等品的尺寸为时,收益的预报值最大.
18.(1);(2)答案见解析.
【详解】
解:(1)一件产品的质量参数在0.785以上的概率,
设抽取20件该产品中为合格产品的件数为,则,
则.
(2),
同理,,
,,
所以使用时间与质量参数之间具有较强的线性相关关系,可用线性回归模型拟合.
19.(1);(2)该线性回归方程的拟合效果是良好,理由见解析.
【详解】
解析:(1)∵
将(172,62)代入回归方程得:
∴
(2)
y关于x的线性同归方程为
∴
∴
故该线性回归方程的拟合效果是良好.
20.(1)选择回归类型更好;(2);(3)下一年应至少投入万元广告费用.
【详解】
解:(1)由散点图知,年广告费用和年利润额的回归类型并不是直线型的,而是曲线型的,且与呈正相关.
所以选择回归类型更好;
(2)对两边取自然对数,得,
,,则,
由表中数据得,,
所以,所以,
所以年广告费用和年利润额的回归方程为;
(3)由(2),知,令,得,得,
所以, 所以(十万元).
故下一年应至少投入万元广告费用.
【同步讲义】(人教A版2019)高中数学选修第三册:8.1 成对数据的统计相关性 讲义: 这是一份【同步讲义】(人教A版2019)高中数学选修第三册:8.1 成对数据的统计相关性 讲义,文件包含同步讲义人教A版2019高中数学选修第三册81成对数据的统计相关性原卷版docx、同步讲义人教A版2019高中数学选修第三册81成对数据的统计相关性解析版docx等2份试卷配套教学资源,其中试卷共43页, 欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系同步测试题: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系同步测试题,共6页。试卷主要包含了1 成对数据的统计相关性,下列两个变量具有相关关系的是等内容,欢迎下载使用。
高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系练习题: 这是一份高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系练习题,共4页。试卷主要包含了以下关于相关关系的说法错误的是,下列关系属于线性负相关的是,有下列关系等内容,欢迎下载使用。