高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系优秀课后练习题
展开【夯实基础】
题型1 线性相关性的检验
1.下列说法错误的是( )
A.在回归直线方程中,y与x具有负线性相关关系
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.在回归直线方程中,当解释变量x每增加1个单位时,预报变量平均增加个单位
D.对分类变量与,随机变量的观测值越大,则判断“与有关系”的把握程度越小
2.对四对变量与进行线性相关检验,已知是观测值组数,是相关系数,若已知①,;②,;③,;④,;则变量和具有线性相关关系的是 .
3.对两个变量,的几组观测数据统计如下表,则这两个相关变量的关系是
A.负相关B.正相关C.先正后负相关D.先负后正相关
4.已知下列说法:
①分类变量A与B的随机变量越大,说明“A与B有关系”的可信度越大;
②以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和;
③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为,若,,,则.
其中说法正确的为 .(填序号)
5.四名同学根据各自的样本数据研究变量,之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①与负相关,且;
②与负相关,且;
③与正相关,且;
④与正相关,且.
其中一定不正确的结论的序号是
A.①②B.②③C.③④D.①④
题型2 判断线性相关的强弱
1.下列说法错误的是( )
A.回归直线过样本点的中心
B.两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
C.对分类变量与,随机变量的观测值越大,则判断“与有关系”的把握程度越小
D.在回归直线方程中,当解释变量每增加1个单位时,预报变量平均增加0.2个单位
2.以下四个命题中:
①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;
③某项测量结果服从正态分布,,则;
④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.
以上命题中其中真命题的个数为 .
3.下列说法中,正确的个数为( )
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性同归方程,变量x增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量x,y的相关系数为r,则 越接近于1,x和y之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大
A.3B.2C.1D.0
4.以下四个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|越大,模拟的拟合效果越好;②在一组样本数据不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;③对分类变量x与y的随机变量来说,越小,判断“x与y有关系”的把握程度越大.其中真命题的个数为 .
5.对两个变量的相关系数,有下列说法:(1)越大,相关程度越大;(2)越小,相关程度越大;(3)趋近于0时,没有非线性相关系数;(4)越接近于1时,线性相关程度越强,其中正确的是 .
题型3 样本相关系数的计算
1.已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数 .
2.若线性回归方程中的回归系数,则相关系数 .
3.某种机械设备随着使用年限的增加,它的使用功能逐渐减退,使用价值逐年减少,通常把它使用价值逐年减少的“量”换算成费用,称之为“失效费”.某种机械设备的使用年限x(单位:年)与失效费y(单位:万元)的统计数据如下表所示:
由上表数据可知,y与x的相关系数为 .
(精确到0.01,参考公式和数据:,,,)
4.某部门所属的10个工业企业的固定资产价值x与工业增加值y资料如下表(单位:百万元):
根据上表资料计算的相关系数约为 .
5.下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?
【能力提升】
单选题
1.下面的散点图与相关系数一定不符合的是( )
A.①②③B.①②④C.①③④D.②③④
2.如图是一组实验数据构成的散点图,以下函数中适合作为与的回归方程的类型是( )
A.B.C.D.
3.已知变量X和变量Y的线性相关系数为,变量U和变量V的线性相关系数为,且,则( )
A.X和Y之间呈正线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
B.X和Y之间呈负线性相关关系,且X和Y的线性相关程度强于U和V的线性相关程度
C.U和V之间呈负线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
D.U和V之间呈正线性相关关系,且X和Y的线性相关程度弱于U和V的线性相关程度
4.下列说法中错误的是
A.从某社区65户高收入家庭,28户中等收入家庭,105户低收入家庭中选出100户调查社会购买力的某一项指标,应采用的最佳抽样为分层抽样.
B.线性回归直线一定过样本中心点
C.若两个随机变量的线性相关性越强,则相关系数的值越接近于
D.若一组数据的众数是,则这组数据的中位数是
5.下列说法错误的是
A.相关关系是一种非确定性关系
B.线性回归方程对应的直线,至少经过其样本数据点中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,为的模型比为的模型拟合的效果好
6.下列说法正确的是( )
A.对于非零,,若,则与的夹角为锐角;
B.不等式的解集;
C.已知随机变量,且,则;
D.相关系数越接近于1,表示变量之间的线性相关程度越低.
7.下列说法正确的是( )
A.线性回归模型是一次函数
B.在线性回归模型中,因变量是由自变量唯一确定的
C.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适
D.用来刻画回归方程,越小,拟合的效果越好
8.下列判断正确的是( )
A.若样本数据的方差为3,则的方差为11
B.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归方程为,若样本中心点为,则
C.用相关指数来刻画回归的效果,的值越接近0,说明模型的拟合效果越好
D.从装有2个红球和2个黑球的口袋内任取2个球,至少有一个黑球与至少有一个红球是两个互斥而不对立的事件
多选题
9.下列说法正确的是( )
A.若样本数据的方差为4,则数据的方差为9
B.若随机变量,,则
C.若线性相关系数越接近1,则两个变量的线性相关性越弱
D.若事件A,B满足,,,则有
10.下列说法正确的是( )
A.相关系数的绝对值越接近1,两个随机变量的线性相关程度越强
B.若随机变量,且,则
C.若随机变量,则
D.一组数据12、17、8、13、10、22、16、15、6、19的第80百分位数为17
11.下列命题正确的是( ).
A.任意两个变量都具有相关关系
B.圆的周长与该圆的直径具有相关关系
C.某商品的需求量与该商品的价格是一种非确定性关系
D.当两个变量相关且样本相关系数时,表明两个变量正相关
12.已知具有相关关系的两个变量x,y的一组观测数据,,….,,由此得到的线性回归方程为,则下列说法中正确的是( )
A.回归直线至少经过点,,….,中的一个点
B.若,,则回归直线一定经过点
C.若点,,….,都落在直线上,则变量x,y的样本相关系数
D.若,,则相应于样本点的残差为
填空题
13.在研究两个变量的线性相关关系时,观察散点图发现样本点集中于某一条曲线的周围,令,求得回归直线方程,则该模型的回归方程为
14.已知成对样本数据,,…,中,,…,不全相等,且所有样本点都在直线上,则这组成对样本数据的样本相关系数 .
15.对相关系数r,
①r越大,线性相关程度越大;
②r越小,线性相关程度越大;
③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大;
④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小
以上说法中,正确说法的序号是 .
16.下面对于线性相关系数r的叙述中,正确的是 .
①,越大相关程度越大,反之相关程度越小;
②,r越大相关程度越大,反之相关程度越小;
③表示的两变量的相关程度大于表示的相关程度.
解答题
17.某市实施二手房新政一年多以来,为了了解新政对居民的影响,房屋管理部门调查了2018年6月至2019年6月期间购买二手房情况,首先随机抽取了其中的400名购房者,并对其购房面积(单位:平方米,)讲行了一次统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年6月至2019年6月期间当月在售二手房的均价(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年6月至2019年6月)
(1)试估计该市市民的平均购房面积(同一组中的数据用该组区间的中点值为代表);
(2)从该市2018年6月至2019年6月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为,求的分布列与数学期望;
(3)根据散点图选择和两个模型讲行拟合,经过数据处理得到两个回归方程,分别为和,并得到一些统计量的值,如表所示:
请利用相关系数判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年8月份的二手房购房均价(精确到0.001).
参考数据:,,,,,
参考公式:
18.在钢铁碳含量对于电阻的效应研究中,得到如下数据表:
求y与x的线性回归方程,并检验钢铁碳含量与电阻之间的相关关系的显著性.
19.2018年反映社会现实的电影《我不是药神》引起了很大的轰动,治疗特种病的创新药研发成了当务之急.为此,某药企加大了研发投入,市场上治疗一类慢性病的特效药品的研发费用(百万元)和销量(万盒)的统计数据如下:
(1)求与的相关系数(精确到,并判断与的关系是否可用线性回归方程模型拟合?(规定:时,可用线性回归方程模型拟合);
(2)该药企准备生产药品的三类不同的剂型,,,并对其进行两次检测,当第一次检测合格后,才能进行第二次检测.第一次检测时,三类剂型,,合格的概率分别为,,,第二次检测时,三类剂型,,合格的概率分别为,,.两次检测过程相互独立,设经过两次检测后,,三类剂型合格的种类数为,求的数学期望.
附:(1)相关系数
(2),,,.
20.下表为某宝网站店主统计的月促销费用(万元)与月净利润(万元)数据表:
(1)根据数据绘制的散点图能够看出可用线性回归模型拟合与的关系,请用相关系数加以说明;(系数精确到);(2)建立关于的回归方程(系数精确到);如果该店主想月净利润超6万元,预测理论上至少需要投入促销费用多少万元(结果精确到).
参考数据:,,,
,,其中分别为月促销费用和月净利润,.
参考公式:(1)样本的相关系数.
(2)对于一组数据,其回归方程的斜率和截距的最小二乘估计分别为,.
21.春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:
(1)在下列网格纸中绘制出散点图;
(2)由(1)判断是否能用线性回归模型拟合y与x的关系,并用相关系数加以说明;
(3)记这5天的空气质量指数的平均数为,若从5天中任选2天的数据作调研,求这2天中恰有1天的空气质量指数高于的概率.
参考公式:相关系数.参考数据:,,.
22.某学校高三年级共有4个班,其中实验班和普通班各2个,且各班学生人数大致相当.在高三第一次数学统一测试成绩揭晓后,教师对这4个班的数学成绩进行了统计分析,其中涉及试题“难度”和“区分度”等指标.根据该校的实际情况,规定其具体含义如下:难度,区分度.
(1)现从这4个班中各随机抽取5名学生,根据这20名学生的数学成绩,绘制茎叶图如下:
请根据以上样本数据,估计该次考试试题的难度和区分度;
(2)为了研究试题的区分度与难度的关系,调取了该校上一届高三6次考试的成绩分析数据,得到下表:
①用公式计算区分度与难度之间的相关系数(精确到0.001);
②判断与之间相关关系的强与弱,并说明是否适宜用线性回归模型拟合与之间的关系.
参考数据:,.10
9
8
7
6
5
2
3
3.5
4
4.8
5
使用年限x(单位:年)
1
2
3
4
5
6
7
失效费y(单位:万元)
2.90
3.30
3.60
4.40
4.80
5.20
5.90
固定资产价值x
3
3
5
6
6
7
8
9
9
10
工业增加值y
15
17
25
28
30
36
37
42
40
45
地区
A
B
C
D
E
F
G
H
I
J
K
海拔/m
1250
1158
1067
457
701
731
610
670
1493
762
549
鸟的种类/种
36
30
37
11
11
13
17
13
29
4
15
0.005459
0.005886
0.006050
碳含量
x/%
0.10
0.30
0.40
0.55
0.70
0.80
0.95
20 ℃时
电阻/Ω
15
18
19
21
22.6
23.6
26
研发费用(百万元)
2
3
6
10
13
15
18
21
销量(万盒)
1
1
2
2.5
3.5
3.5
4.5
6
促销费用
2
3
6
10
13
21
15
18
月净利润
1
1
2
3
3.5
5
4
4.5
车流量x(万辆)
12
12.5
13
13.5
14
空气质量指数y
74
76
78
77
80
考试序号
1
2
3
4
5
6
难 度
0.65
0.71
0.73
0.76
0.77
0.82
区分度
0.12
0.16
0.16
0.19
0.20
0.13
人教A版 (2019)选择性必修 第三册7.1 条件概率与全概率公式优秀同步达标检测题: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000356_t7/?tag_id=28" target="_blank">7.1 条件概率与全概率公式优秀同步达标检测题</a>,文件包含人教A版数学高二选择性必修第三册711条件概率分层作业原卷版docx、人教A版数学高二选择性必修第三册711条件概率分层作业解析版docx等2份试卷配套教学资源,其中试卷共23页, 欢迎下载使用。
人教A版 (2019)选择性必修 第三册6.2 排列与组合优秀测试题: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000352_t7/?tag_id=28" target="_blank">6.2 排列与组合优秀测试题</a>,文件包含人教A版数学高二选择性必修第三册624组合数分层作业原卷版docx、人教A版数学高二选择性必修第三册624组合数分层作业解析版docx等2份试卷配套教学资源,其中试卷共25页, 欢迎下载使用。
人教A版 (2019)选择性必修 第三册6.2 排列与组合优秀练习题: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000352_t7/?tag_id=28" target="_blank">6.2 排列与组合优秀练习题</a>,文件包含人教A版数学高二选择性必修第三册623组合分层作业原卷版docx、人教A版数学高二选择性必修第三册623组合分层作业解析版docx等2份试卷配套教学资源,其中试卷共35页, 欢迎下载使用。