高二数学教案 第一章 概率与统计(第12课)《线性回归》(2) 湘教版选修2
展开课 题: 1.6线性回归(二)
教学目的:
1 进一步熟悉回归直线方程的求法
2.加深对回归直线方程意义的理解
3. 增强学生应用回归直线方程解决相关实际问题的意识掌握样本相关系数显著性检验的方法
教学重点:准确求出回归直线方程
教学难点:样本相关系数显著性检验的方法
授课类型:新授课
课时安排:1课时
教 具:多媒体、实物投影仪
教学过程:
一、复习引入:
1.相关关系的概念
当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系
相关关系是非随机变量与随机变量之间的关系,函数关系是两个非随机变量之间的关系,是一种因果关系,而相关关系不一定是因果关系,所以相关关系与函数关系不同,其变量具有随机性,因此相关关系是一种非确定性关系(有因果关系,也有伴随关系).因此,相关关系与函数关系的异同点如下:
相同点:均是指两个变量的关系
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系.
2.回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性
3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.散点图形象地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律
4. 回归直线
设所求的直线方程为,其中a、b是待定系数.
, ,
相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析
二、讲解新课:
1.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把
=
叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度.
2.相关系数的性质: ≤1,且越接近1,相关程度越大;且越接近0,相关程度越小.
3.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值它必须在每一次统计检验之前确定
4. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0 05或r0 01;例如n=7时,r0.05=0.754,r0.01=0.874 求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当≤r0 05或r0 01,认为线性关系不显著
结论:讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;
通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;
我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到
三、讲解范例:
例1.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)
施化肥量x | 15 | 20 | 25 | 30 | 35 | 40 | 45 |
水稻产量y | 330 | 345 | 365 | 405 | 445 | 450 | 455 |
1)画出散点图如下:
2)检验相关系数r的显著性水平:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
xi | 15 | 20 | 25 | 30 | 35 | 40 | 45 |
yi | 330 | 345 | 365 | 405 | 445 | 450 | 455 |
xiyi | 4950 | 6950 | 9125 | 12150 | 15575 | 18000 | 20475 |
=30,=399.3,=7000,=1132725,=87175 |
r==≈0.9733,在“相关系数检验的临界值表”查出与显著性水平0.05及自由度7-2=5相应的相关数临界值r0 05=0.754<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系.
3)设回归直线方程,利用
计算a,b, 得b=
a=399.3-4.75×30≈257,则回归直线方程
例2.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:
x | 1.08 | 1.12 | 1.19 | 1.28 | 1.36 | 1.48 | 1.59 | 1.68 | 1.80 | 1.87 | 1.98 | 2.07 |
y | 2.25 | 2.37 | 2.40 | 2.55 | 2.64 | 2.75 | 2.92 | 3.03 | 3.14 | 3.26 | 3.36 | 3.50 |
1)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程.
解:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
xi | 1.08 | 1.12 | 1.19 | 1.28 | 1.36 | 1.48 | 1.59 | 1.68 | 1.80 | 1.87 | 1.98 | 2.07 |
yi | 2.25 | 2.37 | 2.40 | 2.55 | 2.64 | 2.75 | 2.92 | 3.03 | 3.14 | 3.26 | 3.36 | 3.50 |
xiyi | 2.43 | 2.264 | 2.856 | 3.264 | 3.590 | 4.07 | 4.643 | 5.090 | 5.652 | 6.096 | 6.653 | 7.245 |
=,==2.8475,=29.808,=99.2081,=54.243 |
1)画出散点图:
2)r=
=
在“相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0 05=0.576<0.997891, 这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系.
3)设回归直线方程,
利用,计算a,b,得b≈1.215, a=≈0.974,
∴回归直线方程为:
四、课堂练习:
1 .设有一个直线回归方程为 ,则变量x 增加一个单位时( )
A. y 平均增加 1.5 个单位 B. y 平均增加 2 个单位
C. y 平均减少 1.5 个单位 D. y 平均减少 2 个单位
答案:C
2. 某医院用光电比色计检验尿汞时,得尿汞含量(毫克/升)与消光系数如下表:
尿汞含量x | 2 | 4 | 6 | 8 | 10 |
消光系数y | 64 | 138 | 205 | 285 | 360 |
①对变量y与x进行相关性检验;
②如果y与x之间具有线性相关关系,求回归直线方程.
参考答案:
五、小结 :一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验.在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预报、资料补充等方面有着广泛的应用
六、课后作业:
七、板书设计(略)
八、课后记: