


高中数学《变量间的相关关系》文字素材1 新人教A版必修3教案
展开变量间的相关性——知识导学
一、课标要求
1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;
2.经历用不同估算方法描述两个变量线性相关的过程,知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二、要点清点
(一)变量间的相关关系
1.变量间的相关关系
变量与变量之间的关系常见的有两类:一类是确定性的函数关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,此时我们称两个变量具有相关关系。
注:相关关系与函数关系的异同点:
(1)相同点:两者均是指两个变量的关系。
(2)不同点:①函数关系是一种确定的关系;相关关系是一种非确定的关系。
②函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系。
2.散点图
把两个变量作为横、纵坐标,在平面直角坐标系中描点作出两个变量的对应点,这样的图形叫做散点图。
注:散点图中变量的对应点如果分布在某条直线的周围,我们就可以得出结论:这两个变量具有相关关系;如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关关系。
3.正相关、负相关
具有相关关系的两个变量,如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关;反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关。
(二)两个变量的线性相关
1.线性相关、回归直线
如果散点图中,相应于具有相关关系的两个变量所有观察值的数据点,分布在一条直线附近,我们就称这两个变量之间具有线性相关关系,这样的直线可以画出许多条,其中“最贴近”这些数据点的一条,我们称之为回归直线。
2.用最小二乘法求回归直线方程。
记回归直线方程为,,叫做回归系数。利用最小二乘法可以求得回归系数:
, 。
其中,。
注:(1)我们知道,回归直线是数据点最贴近的直线,反映贴近程度的数据是离差的平方和,即总离差,这样,回归直线就是所有直线中取最小值的那一条,这种使“离差平方和为最小”的方法,叫做最小二乘法。
(2)利用最小二乘法求回归系数,时,是将离差的平方和转化为关于或的二次函数,利用二次函数知识求得的。
3.求回归直线方程的步骤
(1)作出给出数据的散点图,并直观地判断是否是线性相关的;
(2)求出,;
(3)求出,;
(4)求出和,写出回归直线方程。
4.回归直线方程的应用
(1)描述两变量之间的依存关系:利用回归直线方程即可定量描述两个变量间依存的数量关系;
(2)利用回归方程进行预测:把预报因子(即自变量)代入回归方程对预报量(即因变量)进行估计,即可得到个体值的容许区间。
(3)利用回归方程进行统计控制规定值的变化,通过控制的范围来实现统计控制的目标。如已经得到了空气中的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中的浓度。
5.利用散点图和回归直线方程的注意事项
(1)做回归分析要有实际意义;
(2)回归分析前,最好先作出散点图,以判断是否是线性相关关系;
(3)回归直线不要外延。
三、范例剖析
例1 下列两个变量之间的关系不具有线性关系的是( )
.小麦产量与施肥值
.球的体积与表面积
.蛋鸭产蛋个数与饲养天数
.甘蔗的含糖量与生长期的日照天数
分析:设球的半径为,则球的体积为,球的表面积,显然这两者不是线性关系。
解析:
评注:线性关系是一种函数关系,因此具有确定性。本题中的两者之间有相关关系,但不具有线性关系。
例2 要分析学生初中升学的数学成绩对高一学习情况的影响,在高一年级学生中随机抽取了10名学生,他们的入学成绩与期末考试成绩如下表:
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
入学成绩 | 63 | 67 | 45 | 88 | 81 | 71 | 52 | 99 | 58 | 76 |
期末成绩 | 65 | 78 | 52 | 82 | 92 | 89 | 73 | 98 | 56 | 75 |
(1)若变量与之间具有线性相关关系,求出回归直线方程;
(2)若某学生的入学成绩为80分,试估计他的期末成绩。
解析:(1),
。
∴,,
∴所求线性回归直线方程为。
(2)某学生的入学成绩为80分,代入上式可求得,即这个学生期末成绩的预测值为84分。
评注:知道与呈线性相关关系,无须进行相关性检验。否则,应首先进行相关性检验,如果本身两个变量不具备相关关系,或者说,它们之间相关关系不显著,即使求出回归直线方程也是毫无意义的,而且用其估计和预测的量也是不可信的。
例3 下表是我国居民生活污水排放量的一组数据:
年份 | 1995 | 1996 | 1997 | 1998 | 1999 | 2000 | 2001 | 2002 |
排放量 | 151 |
| 189.1 | 194.8 | 203.8 | 220.9 | 227.7 | 232.3 |
试估计1996年我国居民生活污水的排放量,并预测2004年生活污水的排放量(单位:)。
分析:要估计或预测,可考虑先求回归直线方程,将年份与污水的排放量的相关关系表达出来,可先剔除1996年,样本容量为7。
解析:设1995年为第1年,…2002年为第8年,列表,用科学计算器进行有关计算:
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
1 | 3 | 4 | 5 | 6 | 7 | 8 | |
151 | 189.1 | 194.8 | 203.8 | 220.9 | 227.7 | 232.3 | |
151 | 1019 | ||||||
, ,, |
∴,
。
∴所求回归直线方程为,从而当时,;当时,。
∴1996年污水排放量估计为,2004年污水排放量估计为。
评注:灵活选取数据可以简化运算,当只要求分析两变量相关关系用其解决实际问题时,可选取恰当的变量进行分析。
例3 以下是某地搜集到的新房屋的销售价格和房屋的面积的数据:
房屋面积 | 115 | 110 | 80 | 135 | 105 |
销售价格(万元) | 24.8 | 18.4 | 29.2 | 22 |
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150时的销售价格。
分析:将表中各对数据在平面直角坐标系中描点,便得到具有相关关系的两个变量的一组数据的图形,即得散点图;按照求回归直线方程的步骤和公式,写出回归直线方程。
解析:(1)数据对应的散点图如下图所示:
(2),,,。
设所求回归直线方程为,则
,
。
故所求回归直线方程为。
(3)当x=150时,销售价格的估计值为(万元)。
评注:研究变量间的相关关系,求得回归直线方程,能帮助我们发现事物发展的一些规律,补充积累资料的不足,估计预测某些数据,为我们的判断和决策提供依据。