![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)01](http://www.enxinlong.com/img-preview/4/3/12320212/0/0.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)02](http://www.enxinlong.com/img-preview/4/3/12320212/0/1.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)03](http://www.enxinlong.com/img-preview/4/3/12320212/0/2.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)04](http://www.enxinlong.com/img-preview/4/3/12320212/0/3.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)05](http://www.enxinlong.com/img-preview/4/3/12320212/0/4.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)06](http://www.enxinlong.com/img-preview/4/3/12320212/0/5.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)07](http://www.enxinlong.com/img-preview/4/3/12320212/0/6.jpg?x-oss-process=image/resize,w_794/sharpen,100)
![【语文版】中职数学基础模块下册:10.9《一元线性回归》ppt课件(2)08](http://www.enxinlong.com/img-preview/4/3/12320212/0/7.jpg?x-oss-process=image/resize,w_794/sharpen,100)
数学语文版(中职)10.9 一元线性回归集体备课ppt课件
展开9.1 变量间关系的度量 9.2 一元线性回归9.3 利用回归方程进行估计和预测9.4 残差分析
1. 了解相关关系的分析方法理解一元线性回归的基本原理和参数的最小二乘估计掌握回归直线的拟合优度掌握回归方程的显著性检验利用回归方程进行估计和预测用 Excel 进行回归
实例1:教育经费支出与学生成绩的关系分析
学生教育达到的水平与学生所居住的州在教育方面的经费支出多少有关系吗?在许多地区,这个重要问题被纳税人提出;而纳税人又被他们的学区请求增加用于教育方面的税收收入。在这种情况下,为了确定在公立学校中教育经费支出和学生成绩之间是否存在某种关系,请利用有关教育经费支出和学生学习成绩的相关数据展开分析。
9.1变量间关系的度量
9.1.1变量间的关系 ◆确定性的函数关系 Y=f (X) ◆不确定性的统计关系—相关关系 Y= f(X)+ε (ε为随机变量) ◆没有关系 变量间关系的图形描述: 坐标图(散点图)
函数关系
(1)是一一对应的确定关系(2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量
一个变量的取值不能由另一个变量唯一确定。当一个变量取某个值时,另一个变量可能有几个取值,但两者之间却存在着一定的客观规律。
相关关系的例子
商品的消费量(y)与居民收入(x)之间的关系商品的消费量(y)与物价(x)之间的关系商品销售额(y)与广告费支出(x)之间的关系粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系收入水平(y)与受教育程度(x)之间的关系子女身高 (y)与父亲身高(x)之间的关系
巴菲特:股市和经济不是每时每刻都紧密相联,但如果经济在很长一段时间内都向好,那么股市也会在很长一段时间内向好。如果经济不太好,那么股市也会不太好。但是具体每一周,每一月的变化我就不是那么在意,如果经济好,那么最后股市就会好。我并不知道市场明年或接下来两年怎么样。我并不想被称作是中国股市的专家,我不太了解中国股市。——2010年年会接受《经济半小时》采访
9.1.2相关关系的类型
从涉及的变量数量看 简单相关 多重相关(复相关)从变量相关关系的表现形式看 线性相关——散点图接近一条直线(左图) 非线性相关——散点图接近一条曲线(右图)
● 从变量相关关系变化的方向看正相关——变量同方向变化 A 同增同减 (A)负相关——变量反方向变化 一增一减 (B) B● 从变量相关的程度看 完全相关 不完全相关 C 不相关 (C)
9.1.3相关关系的描述与测度
相关分析是对两个变量之间线性关系的描述与度量。
相关分析要解决的问题变量之间是否存在关系?(伪相关)如果存在关系,它们之间是什么样的关系?变量之间的关系强度如何?样本所反映的变量之间的关系能否代表总体变量之间的关系?
散点图(用来判断变量间的关系形态)
相关系数(度量两个变量线性关系的统计量)
●总体相关系数 对于所研究的总体,表示两个相互联系变量相关程度 的总体相关系数为: 总体相关系数反映总体两个变量X和Y的线性相关程度。
● 样本相关系数
x和y的样本相关系数通常用 表示
★相关系数的特点:
相关系数的取值在-1与1之间。当r=0时,表明X与Y没有线性相关关系。当 时,表明X与Y存在一定的线性相关关系: 若 表明X与Y 为正相关; 若 表明X与Y 为负相关。当 时,表明X与Y完全线性相关: 若r=1,称X与Y完全正相关; 若r=-1,称X与Y完全负相关。
|r|0.8时,可视为两个变量之间高度相关0.5|r|<0.8时,可视为中度相关0.3|r|<0.5时,视为低度相关|r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关上述解释必须建立在对相关系数的显著性进行检验的基础之上
★使用相关系数的注意事项:
X和Y 都是相互对称的随机变量,所以计量单位会不会影响相关系数?相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于哪条直线。
9.1.4相关系数的显著性检验
为什么要检验?检验什么?怎么检验?检验的依据: 如果X和Y都服从正态分布,在总体相关系数 的假设下,与样本相关系数 r 有关的 t 统计量服从自由度为n-2的 t 分布:
检验两个变量之间是否存在线性相关关系 采用 t 检验 检验的步骤为 提出假设:H0: ;H1: 0
确定显著性水平,并作出决策 若t>t,拒绝H0 若t
确定显著性水平,并作出决策 若t>t,拒绝H0 若t
Spearman 等级相关系数
适用于定序变量与定序变量之间的相关关系若在定距变量分布不满足正态性的条件,可将定距变量降级为定序变量如要研究考试中学生交卷的名次是否与成绩有关,
交卷名次与考试名次之间的关系
参阅《统计学在经济和管理中的应用》
如何检验:当n=5-30时,可查Spearman相关系数检验临界值。当n大于30时,检验统计量
●回归的古典意义:(高尔顿遗传学的回归概念) 相对一定身高的父母,子女的平均身高有朝向人类平均身高移动或回归的趋势。(平均来说,非常矮小的父辈倾向于有偏高的子代,而非常高大的父辈倾向于有偏矮的子代)
● 回归的现代意义用一定的数学表达式描述变量间的数量关系,根据一个或几个自变量的取值来估计或预测因变量的平均值。
9.2.2一元线性回归模型
涉及一个自变量的回归因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量,用y表示用来预测或用来解释因变量的一个或多个变量称为自变量,用x表示 因变量与自变量之间的关系用一个线性方程来表示
一元线性回归模型可表示为 y = b0 + b1 x + e线性部分反映了由于 x 的变化而引起的 y 的变化误差项 是随机变量反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响是不能由 x 和 y 之间的线性关系所解释的变异性0 和 1 称为模型的参数
0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值
一元线性回归模型 (基本假定)
因变量x与自变量y之间具有线性关系在重复抽样中,自变量x的取值是固定的,即假定x是非随机的误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于所有的 x 值,ε的方差σ2 都相同误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0 ,σ2 )独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对应的ε不相关对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关
回归方程
描述因变量y的期望值如何依赖于自变量x的方程称为回归方程。
估计的回归方程 (estimated regressin equatin)
2.一元线性回归中估计的回归方程为
1.用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程
最小二乘估计 (methd f least squares )
德国科学家Karl Gauss(1777—1855)提出的原理:使因变量的观察值与估计值之间的误差平方和达到最小。即
用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小
某大学的一名统计学老师对学生用在学习上的时间和所取得的成绩之间的关系感兴趣,收集了10名学生最后一个学期的学习成绩资料。
回归直线的拟合优度 (回归直线与各观测点的接近程度)
拟合优度的度量
总离差平方和 回归平方和 残差平方和 判定系数定义:
判定系数是非负的统计量;判定系数取值范围: ;在一元线性回归中,判定系数在数值上是简单线性相关系数的平方。判定系数可以衡量线性关系的强弱,它表示y取值的变差中能够被x与y的线性关系来解释的部分所占的比例。(p280)
估计标准误差 (standard errr f estimate)
实际观察值与回归估计值误差平方和的均方根反映实际观察值在回归直线周围的分散状况对误差项的标准差的估计,是在排除了x对y的线性影响后,y随机波动大小的一个估计量反映用估计的回归方程预测y时预测误差的大小(p280) 计算公式为
四、简单线性回归模型的检验
回归模型的检验包含的内容很多:理论意义的检验 (取值的区间和符号是否符合理论和实际 ) ;一级检验:(假设是否成立)统计学检验(显著性检验)
线性关系的检验
检验自变量与因变量之间的线性关系是否显著将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数k) 残差均方:残差平方和SSE除以相应的自由度(n-k-1)
线性关系的检验 (常用检验的步骤)
提出假设H0:1=0 线性关系不显著
2. 计算检验统计量F
确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若F>F ,拒绝H0;若F
检验 x 与 y 之间是否具有线性关系,或者说,检验自变量 x 对因变量 y 的影响是否显著
回归系数显著性 t 检验的方法
(1) 提出假设一般假设:常用假设:(2) 计算统计量(3)给定显著性水平α,确定临界值 (4) 检验结果判断 若 则拒绝原假设,而接受备择假设
五、简单线性回归模型预测
对因变量平均值的点预测值 :
一家食品连锁店主要在校园周边设分店,为研究销售额(y)(注:单位为千元)与学校人数(x)(注:单位为千人)之间的关系,搜集到10家分店的有关数据。
语文版(中职)基础模块下册10.9 一元线性回归课堂教学ppt课件: 这是一份语文版(中职)基础模块下册10.9 一元线性回归课堂教学ppt课件,共60页。PPT课件主要包含了对于任意Xi值有,故回归方程为,引例分析,SST,SSE,SSR,自由度ƒR为1,图9-6,图9-7,图9-8等内容,欢迎下载使用。
语文版(中职)基础模块下册10.6 抽样方法评课ppt课件: 这是一份语文版(中职)基础模块下册10.6 抽样方法评课ppt课件,共25页。PPT课件主要包含了基本概念等内容,欢迎下载使用。
高中数学语文版(中职)基础模块下册10.4 直方图与频率分布课文课件ppt: 这是一份高中数学语文版(中职)基础模块下册10.4 直方图与频率分布课文课件ppt,共13页。