(通用版)高考数学(文数)一轮复习考点梳理与过关练习42《变量间的相关关系》(含详解)
展开考点42 变量间的相关关系
变量的相关性
(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
回归分析
了解回归分析的基本思想、方法及其简单应用.
1.相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.
【注意】相关关系与函数关系的异同点:
共同点:二者都是指两个变量间的关系.
不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.散点图
将样本中的n个数据点描在平面直角坐标系中,所得图形叫做散点图.
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为负相关.
具有正相关关系的两个变量的散点图如图1,具有负相关关系的两个变量的散点图如图2.
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距离的平方和最小.
若变量x与y具有线性相关关系,有n个样本数据,则回归方程中,.
其中,
称为样本点的中心.
(2)线性回归模型,其中称为随机误差,自变量称为解释变量,因变量称为预报变量.
【注意】①回归直线必过样本点的中心,这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.
②利用回归直线方程不但可以预测在x取某一个值时,y的估计值,同时也能知道x每增加1个单位,的变化量.
③在回归直线方程中,既表示直线的斜率,又表示自变量x的取值每增加一个单位时,函数y的改变量.
5.相关系数
(1)样本相关系数r的计算公式
我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为.
(2)样本相关系数r的性质
①;
②当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关;
③|r|越接近于1,表明两个变量的线性相关性越强;
④|r|越接近于0,表明两个变量的线性相关性越弱.
6.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究.
在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决.
7.刻画回归效果的方式
方式方法
计算公式
刻画效果
越接近于1,表示回归的效果越好
残差图
称为相应于点的残差,
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,其中这样的带状区域的宽度越窄,说明模型拟合精确度越高.
残差平方和
残差平方和越小,模型的拟合效果越好
考向一 相关关系的判断
判定两个变量正、负相关性的方法:
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关;
(2)相关系数:r>0时,正相关;r<0时,负相关;
(3)线性回归方程中:时,正相关;时,负相关.
典例1 给出下列有关线性回归分析的四个命题:
①线性回归直线未必过样本数据点的中心;
②回归直线就是散点图中经过样本数据点最多的那条直线;
③当相关系数时,两个变量正相关;
④如果两个变量的相关性越强,则相关系数就越接近于.
其中真命题的个数为
A. B.
C. D.
【答案】A
【解析】对于①,线性回归直线一定过样本数据点的中心,故①错误;
对于②,回归直线在散点图中可能不经过任何一个样本数据点,故②错误;
对于③,当相关系数时,两个变量正相关,故③正确;
对于④,如果两个变量的相关性越强,则相关性系数就越接近于或,故④错误.
故真命题的个数为1,故选A.
1.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
2.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则
A.r2
求回归直线方程的一般步骤:
(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系.
(2)当两变量具有线性相关关系时,求回归系数,写出回归直线方程.
(3)根据方程进行估计.
典例2 某车间加工的零件数与加工时间的统计数据如下表:
零件数(个)
10
20
30
加工时间(分钟)
21
30
39
现已求得上表数据的回归方程中的值为,则据此回归模型可以预测,加工个零件所需要的加工时间约为
A.分钟 B.分钟
C.分钟 D.分钟
【答案】C
【解析】因为,
又回归直线恒过样本点的中心,且知值为,
所以,
所以回归直线方程为,
从而当时,,
由此可以预测,加工个零件所需要的加工时间约为分钟,
故选C.
典例3 一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
(1)在给定的坐标系中画出表中数据的散点图,并由散点图判断销售件数与进店人数是否线性相关?(给出判断即可,不必说明理由)
(2)建立关于的回归方程(系数精确到0.01),并预测进店人数为80时,商品销售的件数(结果保留整数).
参考数据:,,,,,.
参考公式:回归方程,其中,.
【解析】(1)散点图如图所示:
由散点图可以判断,商品件数与进店人数线性相关.
(2)因为,,,
,,,
所以,
.
所以回归方程为,
当时,.
所以预测进店人数为80时,商品销售的件数为58.
3.已知的取值如下表,从散点图知,线性相关,且,则下列说法正确的是
1
2
3
4
1.4
1.8
2.4
3.2
A.回归直线一定过点
B.每增加1个单位,就增加1个单位
C.当时,的预报值为3.7
D.每增加1个单位,就增加0.7个单位
4.某学习小组在研究性学习中,对昼夜温差大小与绿豆种子一天内出芽数之间的关系进行研究,该小组在4月份记录了1日至6日每天昼夜最高、最低温度(如图1),以及浸泡的100颗绿豆种子当天内的出芽数(如图2).
根据上述数据作出散点图,可知绿豆种子出芽数(颗)和温差具有线性相关关系.
(1)求绿豆种子出芽数(颗)关于温差的回归方程;
(2)假如4月1日至7日的日温差的平均值为11℃,估计4月7日浸泡的10000颗绿豆种子一天内的出芽数.
附:.
考向三 非线性回归方程及应用
求非线性回归方程的步骤:
1.确定变量,作出散点图.
2.根据散点图,选择恰当的拟合函数.
3.变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
4.分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
5.根据相应的变换,写出非线性回归方程.
典例4 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度(单位:分贝)与声音能量I(单位:)之间的关系,将测量得到的声音强度和声音能量(=1,2,…,10)数据作了初步处理,得到如图散点图及一些统计量的值.
45.7
0.51
5.1
表中,.
(1)根据散点图判断,与哪一个适宜作为声音强度关于声音能量I的回归方程类型?(给出判断即可,不必说明理由)
(2)根据表中数据,求声音强度关于声音能量I的回归方程;
(3)当声音强度大于60分贝时属于噪音,会产生噪音污染,城市中某点共受到两个声源的影响,这两个声源的声音能量分别是和,且.已知点的声音能量等于声音能量与之和,请根据(1)中的回归方程,判断点是否受到噪音污染的干扰,并说明理由.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
【解析】(1)根据散点图,可知更适合.
(2)令,先建立关于的线性回归方程.
∵,
∴,
∴关于的线性回归方程是,
即关于I的回归方程是.
(3)点的声音能量,
∵,
∴
,
根据(2)中的回归方程,点的声音强度的预报值,
∴点会受到噪音污染的干扰.
5.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:
根据以上数据,绘制了如图所示的散点图.
(1)根据散点图判断,在推广期内,(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
其中.
参考公式:
对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:.
1.已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为=x+,则下列说法正确的是
A.>0,<0 B.>0,>0
C.<0,<0 D.<0,>0
2.下列说法错误的是
A.相关关系是一种非确定性关系
B.线性回归方程对应的直线,至少经过其样本数据点中的一个点
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,为的模型比为的模型拟合的效果好
3.在一组样本数据不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为
A.-1 B.0
C. D.1
4.已知5个学生的数学和英语成绩如下表:
学生
A
B
C
D
E
数学
80
75
70
65
60
英语
70
66
68
64
62
则数学与英语成绩之间
A.是函数关系 B.是相关关系,但相关性很弱
C.具有较好的相关关系,且是正相关 D.具有较好的相关关系,且是负相关
5.已知变量与负相关,且由观测数据算得样本平均数,则由该观测的数据算得的线性回归方程可能是
A. B.
C. D.
6.某考察团对全国10大城市的职工人均工资与居民人均消费进行统计调查,与具有相关关系,回归方程为(单位:千元),若某城市居民消费水平为千元,估计该城市消费额占人均工资收入的百分比约为
A. B.
C. D.
7.在2019年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:
价格元
9
9.5
10.5
11
销售量件
11
8
6
5
由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的
A.10 B.11
C.12 D.10.5
8.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响.对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:①;②;③;④;⑤,则较适宜作为年销售量关于年宣传费的回归方程的是
A.①② B.②③
C.②④ D.③⑤
9.下列四个结论:
①在回归分析模型中,残差平方和越大,说明模型的拟合效果越好;
②某学校有男教师60名、女教师40名,为了解教师的体育爱好情况,在全体教师中抽取20名调查,则宜采用的抽样方法是分层抽样;
③线性相关系数越大,两个变量的线性相关性越弱;反之,线性相关性越强;
④在回归方程中,当解释变量每增加一个单位时,预报变量增加0.5个单位.
其中正确的结论是
A.①② B.①④
C.②③ D.②④
10.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间x与数学成绩y进行数据收集如下表:
x
15
16
18
19
22
y
102
98
115
115
120
由表中样本数据求得回归方程为,则点与直线x+18y=100的位置关系是
A. B.
C. D.与的大小无法确定
11.以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则
A. B.
C. D.
12.千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,某校积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:
年份(届)
2014
2015
2017
学科竞赛获省级一等奖
及以上的学生人数x
51
49
55
57
被清华、北大等世界名校
录取的学生人数y
103
96
108
107
根据上表可得回归方程=x+中的为1.35,该校2018届同学在学科竞赛中获省级一等奖及以上的学生人数为63,据此模型预测该校今年被清华、北大等世界名校录取的学生人数为
A.111 B.117
C.118 D.123
13.由身高(cm)预报体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,________是在150 cm的人群中(填“一定”或“不一定”).
14.已知方程是根据女大学生的身高预报她的体重的回归方程,其中x的单位是cm,的单位是kg,那么针对某个体(160,53)的残差是________.
15.已知一组数据确定的回归直线方程为,且,发现两组数据,误差较大,去掉这两组数据后,重新求得回归直线的斜率为,当时,____________.
16.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算=11,=13,=21,则实数b的值为________.
17.下表是某学生在4月份开始进人冲刺复习至高考前的5次大型联考数学成绩(分).
(1)请画出上表数据的散点图;
(2)①请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
②若在4月份开始进入冲刺复习前,该生的数学分数最好为116分,并以此作为初始分数,利用上述回归方程预测高考的数学成绩,并以预测高考成绩作为最终成绩,求该生4月份后复习提高率.(复习提高率=,分数取整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为,.
18.某电视厂家准备在五一举行促销活动,现在根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万台)的数据如下:
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程(其中;参考方程:回归直线,)
(2)若用模型拟合y与x的关系,可得回归方程,经计算线性回归模型和该模型的分别约为0.75和0.88,请用说明选择哪个回归模型更好;
(3)已知利润z与x,y的关系为z=200y﹣x.根据(2)的结果回答:当广告费x=20时,销售量及利润的预报值是多少?(精确到0.01)
参考数据:.
19.二手车经销商小王对其所经营的型号二手汽车的使用年数(单位年)与销售价格(单位:万元/辆)进行整理,得到如下数据:
下面是关于的折线图.
(1)由折线图可以看出,可以用线性回归模型拟合与的关系,求关于的回归方程,并预测当某辆型号二手车使用年数为9年时售价约为多少?(小数点后保留两位有效数字)
(2)基于成本的考虑,该型号二手车的售价不得低于7118元,请根据(1)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:
,.
参考数据:.
20.某商场营销人员进行某商品的市场营销调查时发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:
反馈点数t(百分比)
1
2
3
4
5
销量(千件)/天
0.5
0.6
1
1.4
1.7
(1)经分析发现,可用线性回归模型拟合当地该商品销量(千件)与返还点数之间的相关关系,试预测若返回6个点时该商品每天的销量;
(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:
返还点数预期值区间
(百分比)
[1,3)
[3,5)
[5,7)
[7,9)
[9,11)
[11,13)
频数
20
60
60
30
20
10
将对返点点数的心理预期值在和的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,求抽出的3人中至少有1名“欲望膨胀型”消费者的概率.
21.《中华人民共和国道路交通安全法》第47条的相关规定:机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让斑马线”,《中华人民共和国道路交通安全法》第90条规定:对不礼让行人的驾驶员处以扣3分,罚款50元的处罚.下表是某市一主干路口监控设备所抓拍的5个月内驾驶员不“礼让斑马线”行为统计数据:
月份
1
2
3
4
5
违章驾驶员人数
120
105
100
90
85
(1)请利用所给数据求违章人数与月份之间的回归直线方程,并预测该路口7月份不“礼让斑马线”的违章驾驶员的人数;
(2)交警从这5个月内通过该路口的驾驶员中随机抽查了50人,调查驾驶员不“礼让斑马线”行为与驾龄的关系,得到如下列联表:
不礼让斑马线
礼让斑马线
合计
驾龄不超过1年
22
8
30
驾龄1年以上
8
12
20
合计
30
20
50
能否据此判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有关?
参考公式:在回归直线方程中,,,
参考公式:(其中).
临界值表:
0.150
0.100
0.050
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
22.为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):
(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程:,并预测2018年5月份参与竞拍的人数.
(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:
(i)求的值及这200位竟拍人员中报价大于5万元的人数;
(ii)若2018年5月份车牌配额数量为3000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①,其中;
②.
23.为利于分层教学,某学校根据学生的情况分成了A,B,C三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:
A类
第x次
1
2
3
4
5
分数y(满分150)
145
83
95
72
110
,;
B类
第x次
1
2
3
4
5
分数y(满分150)
85
93
90
76
101
,;
C类
第x次
1
2
3
4
5
分数y(满分150)
85
92
101
100
112
,;
(1)经计算已知A,B类学生成绩的相关系数分别为,,请计算出C类学生成绩的相关系数,并通过数据的分析回答抽到的哪类学生学习成绩最稳定;(结果保留两位有效数字,越大认为成绩越稳定)
(2)利用(1)中成绩最稳定的学生的样本数据,已知线性回归直线方程为,利用线性回归直线方程预测该生第十次的成绩.
附:相关系数,
线性回归直线方程中,,.
24.某互联网公司为了确定下一季度的前期广告投入计划,收集了近6个月广告投入量x(单位:万元)和收益y(单位:万元)的数据如下表:
月份
1
2
3
4
5
6
广告投入量/万元
2
4
6
8
10
12
收益/万元
14.21
20.31
31.8
31.18
37.83
44.67
他们用两种模型:①y=bx+a,②y=aebx分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
7
30
1464.24
364
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除;
(ⅰ)剔除异常数据后,求出(1)中所选模型的回归方程;
(ⅱ)广告投入量x=18时,(1)中所选模型收益的预报值是多少?
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘估计分别为,.
1.(2015新课标全国Ⅱ文科)根据下面给出的年至年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是
A.逐年比较,年减少二氧化硫排放量的效果最显著
B.年我国治理二氧化硫排放显现
C.年以来我国二氧化硫年排放量呈减少趋势
D.年以来我国二氧化硫年排放量与年份正相关
2.(2014湖北文科) 根据如下样本数据:
3
4
5
6
7
8
4.0
2.5
0.5
得到的回归方程为,则
A., B.,
C., D.,
3.(2018新课标全国Ⅱ文科)下图是某地区2000年至年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至年的数据(时间变量的值依次为)建立模型①:;根据2010年至年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
4.(2017新课标全国Ⅰ文科) 为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:
抽取次序
1
2
3
4
5
6
7
8
零件尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次序
9
10
11
12
13
14
15
16
零件尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
经计算得,,,,其中为抽取的第个零件的尺寸,.
(1)求的相关系数,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检零件中,如果出现了尺寸在之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.
(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?
(ⅱ)在之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)
附:样本的相关系数,.
5.(新课标全国Ⅲ文科)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测年我国生活垃圾无害化处理量.
附注:
参考数据:,,,.
参考公式:相关系数
回归方程中斜率和截距的最小二乘估计公式分别为:
6.(2015新课标全国Ⅰ文科)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6
563
6.8
289.8
1.6
1469
108.8
表中=,.
(1)根据散点图判断,与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;
(3)已知这种产品的年利润z与x,y的关系为,根据(2)的结果回答下列问题:
①年宣传费时,年销售量及年利润的预报值是多少?
②年宣传费为何值时,年利润的预报值最大?
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
7.(2015重庆文科)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2010
2011
2012
2013
2014
时间代号
1
2
3
4
5
储蓄存款(千亿元)
5
6
7
8
10
(1)求关于的回归方程;
(2)用所求回归方程预测该地区2015年()的人民币储蓄存款.
附:回归方程中,,.
变式拓展
1.【答案】C
【解析】因为y=-0.1x+1的斜率小于0,故x与y负相关.
因为y与z正相关,所以可设z=y+,>0,
则z=y+=-0.1x++,故x与z负相关.
2.【答案】C
【解析】根据题中提供的数据,变量Y随X的增大而增大,故Y与X正相关,即r1>0;
变量V随U的增大而减小,故V与U负相关,即r2<0,
故r2<0
【解析】由已知得,,,故A错误;
由回归直线恒过样本中心点(2.5,2.2),得,解得0.7.
∴回归直线方程为.
x每增加1个单位,y就增加0.6个单位,故B,D错误;
当x=5时,y的预测值为3.7,故C正确.
故选C.
4.【解析】(1)依照最高(低)温度折线图和出芽数条形图可得如下数据表:
日期
日
日
日
日
日
日
温差
出芽数
故,,
,
,
所以,,
则,
所以,绿豆种子出芽数(颗)关于温差的回归方程为;
(2)因为月1日至日温差的平均值为,
所以月日的温差,
所以,,
所以,月日浸泡的颗绿豆种子一天内的出芽数约为颗.
5.【解析】(1)根据散点图判断,适宜作为扫码支付的人数关于活动推出天数的回归方程类型.
(2),∴两边同时取常用对数得.
设,.
,
,
把样本点的中心代入,
得,
,∴,
则关于的回归方程为.
把代入上式,得.
故活动推出第天使用扫码支付的人次为.
考点冲关
1.【答案】D
【解析】由题图可知,回归直线的斜率是正数,即>0;回归直线在y轴上的截距是负数,即<0,故选D.
2.【答案】B
【解析】对于选项A,相关关系是一种非确定的关系,而函数关系是一种确定的关系,A选项正确;
对于选项B,回归直线过样本数据的中心,并不一定过样本数据中的某一个点,B选项错误;
对于C选项,在残差图中,残差点分布的带状区域的宽度越狭窄,说明数据越逼近回归直线,两个变量的相关关系越强,其拟合精确度越高,C选项正确;
对于D选项而言,越大,其拟合效果越好,D选项正确.
故选B.
3.【答案】D
【解析】所有样本点均在直线上,则样本相关系数最大,即为1.
4.【答案】C
【解析】画出散点图,通过散点图进行判断.设数学成绩和英语成绩分别为x,y,画出散点图,如图,从图上可以看出数学成绩和英语成绩具有较好的相关关系,且是正相关.故选C.
5.【答案】C
【解析】因为变量与负相关,所以 ,排除A、B选项;
因为,代入检验即可得到C正确.所以选C.
6.【答案】D
【解析】由题意知,,代入回归方程得,,
所以该城市消费额占人均工资收入的百分比约为,故选D.
7.【答案】A
【解析】由题意,可得,,
又由回归直线方程,得,即,
又因为,解得,故选A.
8.【答案】B
【解析】从散点图知,样本点分布在开口向右的抛物线(上支)附近或对数曲线(上部分)的附近,所以y=或y=p+qlnx较适宜,故选B.
9.【答案】D
【解析】根据残差的意义,可知当残差的平方和越小,模拟效果越好,所以①错误;
当个体差异明显时,选用分层抽样法抽样,所以②正确;
根据线性相关系数特征,当相关系数越大,两个变量的线性相关性越强,所以③错误;
根据回归方程的系数为0.5,可知当解释变量每增加一个单位时,预报变量增加0.5个单位.
综上,②④正确,故选D.
10.【答案】B
【解析】=(15+16+18+19+22)×=18,=(102+98+115+115+120)×=110,
所以样本点的中心为(18,110),
所以有,
即点满足=110>100.
11.【答案】D
【解析】因为,所以两边同时取对数得,
设,得,
又因为变换后得到线性回归方程,
所以,解得.
12.【答案】B
【解析】因为=53,=103.5,所以=-=103.5-1.35×53=31.95,所以回归直线方程为=1.35x+31.95.当x=63时,代入解得=117,故选B.
13.【答案】不一定
【解析】由回归分析可知,体重为41.638kg的人的身高多数在150cm左右.故答案为:不一定.
14.【答案】
【解析】把代入,得,
所以残差.
15.【答案】5
【解析】∵一组数据确定的回归直线方程为,且,
∴,解得,
∴原样本点的中心为(2,4).
由题意得去掉数据后新数据的样本点的中心为(2,4),重新求得的回归直线的斜率估计值为,
∴可设新的回归直线方程为,
将点(2,4)代入上式后得,
解得,
∴新的回归直线的方程为,
将代入回归直线方程求得.
16.【答案】
【解析】令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,==,代入y=bt-,得=b×-,解得b=.
17.【解析】(1)散点图如图:
(2)①计算得,
,
,,,,
所以,,
故关于的线性回归方程为.
②由上述回归方程可得高考应该是第六次考试,故,
则 (分),
故净提高分为(分),
所以该生的复习提高率为.
18.【解析】(1)由题意有,,
,,
∴,
则,
∴y关于x的线性回归方程为;
(2)R2越接近于1,模型的拟合效果越好,故选用;
(3)广告费x=20时,销售量预报值(万台),
故利润的预报值(万元).
19.【解析】(1)由题意,计算得,
,
且,,
计算得 ,
∴,
∴z关于x的线性回归方程是,
又,
∴y关于x的回归方程是.
令,解得,
即预测当某辆A型号二手车使用年数为9年时,售价约1.46万元.
(2)当时,,
∴,
解得,
因此预测在收购该型号二手车时,车辆的使用年数不得超过11年.
20.【解析】(1)易知,
所以1.04=+0.08, 所以.
则y关于t的线性回归方程为,
当时,,即返回6个点时该商品每天销量约为2千件.
(2)设从“欲望膨胀型”消费者中抽取x人,从“欲望紧缩型”消费者中抽取y人,
由分层抽样的定义可知,解得,
在抽取的6人中,2名“欲望膨胀型”消费者分别记为,
4名“欲望紧缩型”消费者分别记为,
则所有的抽样情况共20种,其中至少有1名“欲望膨胀型”消费者的情况有16种,
记事件A为“抽出的3人中至少有1名‘欲望膨胀型’消费者”,则.
21.【解析】(1)利用所给数据,计算得=×(1+2+3+4+5)=3,
=×(120+105+100+90+85)=100,
则==,
=100﹣(﹣8.5)×3=125.5,
∴与之间的回归直线方程为,
当时,,
即预测该路口7月份不“礼让斑马线”的违章驾驶员有66人.
(2)由列联表中数据,计算得,
由此能判断有97.5%的把握认为“礼让斑马线”的行为与驾龄有关.
22.【解析】(1)易知,,
计算得 ,
则,
则关于的线性回归方程为,
当时,,
即2018年5月份参与竞拍的人数估计为2万人.
(2)(i)由,解得.
由频率和为1,得,
解得,
则200位竞拍人员报价大于5万元的人数为.
(ii)2018年5月份实际发放车牌数量为3000,
根据竞价规则,报价在最低成交价以上人数占总人数比例为.
又由频率分布直方图知竞拍报价大于6万元的频率为,
所以根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.
23.【解析】(1)根据所给数据,可得对于C类学生:,,
则,
所以,
又,,
则从C类学生抽到的学生的成绩最稳定.
(2)由(1)知,,
所以,
所以
当时,,
所以预测第10次的成绩为分.
24.【解析】(1)应该选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,且模型①的带状区域比模型②的带状区域窄,所以模型①的拟合精度高,回归方程的预报精度高.
(2)(ⅰ)剔除异常数据,即3月份的数据后,得=×(7×6-6)=7.2,=×(30×6-31.8)=29.64.
=1464.24-6×31.8=1273.44,=364-62=328.
则,
=-=29.64-3×7.2=8.04.
所以y关于x的回归方程为=3x+8.04.
(ⅱ)把x=18代入(ⅰ)中所求回归方程,得=3×18+8.04=62.04,
故预报值为62.04万元.
直通高考
1.【答案】D
【解析】由柱形图得,从年以来,我国二氧化硫排放量呈下降趋势,故年排放量与年份负相关,故选D.
2.【答案】B
【解析】依题意,画散点图知,两个变量负相关,所以,.选B.
3.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为
=–30.4+13.5×19=226.1(亿元).
利用模型②,该地区2018年的环境基础设施投资额的预测值为
=99+17.5×9=256.5(亿元).
(2)利用模型②得到的预测值更可靠.
理由如下:
(i)从折线图可以看出,2000年至年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.
(ii)从计算结果看,相对于年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.
4.【解析】(1)由样本数据得的相关系数为
.
由于,
因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.
(2)(i)由于,
由样本数据可以看出抽取的第13个零件的尺寸在以外,
因此需对当天的生产过程进行检查.
(ii)剔除离群值,即第13个数据,剩下数据的平均数为,这条生产线当天生产的零件尺寸的均值的估计值为10.02.
,
剔除第13个数据,剩下数据的样本方差为,
这条生产线当天生产的零件尺寸的标准差的估计值为.
【考点】相关系数,方差、均值的计算
【名师点睛】解答新颖的数学题时,一是通过转化,化“新”为“旧”;二是通过深入分析,多方联想,以“旧”攻“新”;三是创造性地运用数学思想方法,以“新”制“新”,应特别关注创新题型的切入点和生长点.
5.【解析】(1)由折线图中数据和附注中参考数据得
,,,
,
.
因为与的相关系数近似为0.99,说明与的线性相关程度相当高,
从而可以用线性回归模型拟合与的关系.
(2)由及(1)得,
.
所以,关于的回归方程为:.
将年对应的代入回归方程得:.
所以预测年我国生活垃圾无害化处理量将约为亿吨.
【解题必备】判断两个变量是否线性相关以及相关程度的大小通常有两种方法:
(1)利用散点图直观判断;
(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时要严格按照公式求解,一定要注意计算的准确性.
6.【解析】(1)由散点图可以判断,适宜作为年销售量关于年宣传费的回归方程类型.
(2)令,先建立关于的线性回归方程,
由于,
.
所以关于的线性回归方程为,
因此关于的回归方程为.
(3)①由(2)知,当时,年销售量的预报值,
年利润的预报值.
②根据(2)的结果知,年利润的预报值,
∴当,即时,取得最大值.
故年宣传费为千元时,年利润的预报值最大.
7.【解析】(1)列表计算如下:
i
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
15
36
55
120
这里
又
从而.
故所求回归方程为.
(2)将代入回归方程可预测该地区2015年的人民币储蓄存款为
(通用版)高考数学(理数)一轮复习考点梳理与过关练习42《曲线与方程》(含详解): 这是一份(通用版)高考数学(理数)一轮复习考点梳理与过关练习42《曲线与方程》(含详解),共39页。试卷主要包含了曲线与方程的概念,坐标法求曲线方程的步骤,两曲线的交点等内容,欢迎下载使用。
(通用版)高考数学(理数)一轮复习考点梳理与过关练习45《变量间的相关关系》(含详解): 这是一份(通用版)高考数学(理数)一轮复习考点梳理与过关练习45《变量间的相关关系》(含详解),共46页。试卷主要包含了相关关系,散点图,回归分析,回归方程的求解,相关系数,非线性回归分析,刻画回归效果的方式,下列四个结论等内容,欢迎下载使用。
(通用版)高考数学(文数)一轮复习考点梳理与过关练习48《推理与证明》(含详解): 这是一份(通用版)高考数学(文数)一轮复习考点梳理与过关练习48《推理与证明》(含详解),共27页。试卷主要包含了合情推理与演绎推理,直接证明与间接证明,演绎推理,A4纸是生活中最常用的纸规格等内容,欢迎下载使用。