高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析课文内容课件ppt
展开在必修二第14章的统计课程中, 我们学习了单个变量的观察数据的直观表示和统计特征的刻画等知识. 例如: 用直方图描述样本数据的分布规律 , 用均值刻画样本数据的集中趋势 , 用方差刻画样本数据的离散程度等.这些方法主要适用于通过样本认识单个变量的统计规律.
在现实中,我们还经常需要了解两个或两个以上变量之间的关系.为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法.
(1)正方体的体积与棱长(2)汽车匀速行驶时的路程与时间(3)人的体重与饭量(4)人的身高与视力
饭量会影响体重,但不是唯一因素,所以人的体重与饭量不是函数关系
人的身高与视力无任何关系,所以不是函数关系.
问题1:判断下列两个变量之间是否是函数关系,如果是,写出它们的解析式:
问题2:人的脚长与身高具有某种关联,但是,两个脚长一样的人,他们的身高并不一定相同,也就是说,人的脚长与身高之间并不是确定的函数关系,那么,人的脚长与身高之间究竟是一种怎样的关系呢?
结论:人的脚长与身高有关,一般来说,脚越长,身高越高,但不能用一个确定的函数来表示身高与脚长之间的关系。
问题3:农作物的产量与施肥量具有某种关联,一般来说,在一定范围内,施肥量越多,农作物的产量就越高, 那么我们能否用一个确定的函数来表示产量与施肥量之间的关系呢?
结论:不能用一个确定的函数来表示产量与施肥量之间的关系。
问题4:家庭的收入与支出有一定的关系,收入高的家庭往 往支出也较多,我们能否用一个函数精确地表示家 庭支出与收入之间的关系呢?
结论:不能用一个函数精确地表示家庭支出与收入之间的关系。
通常把上述问题中的脚长、施肥量、家庭的收入等称为自变量,与之对应的身高、农作物的产量、家庭支出等称为相应的因变量。上述三个问题中的自变量与因变量之间不能用一个确定的函数关系来表示,那又具备怎样的关系?
在多次重复观测中,自变量取一定值,因变量不一定取一个确定的值与之对应,而是有多或少的差异,这是因为作为因变量的事物,除受问题中自变量的影响外,还受到其他许多因素的影响,这些因素中有的是可知的,有的难以明确.
一般地,两个变量互相影响,一个变量的变化会引起另一个变量确定性的变化(如函数关系),这种关系称为确定关系。
一般地,两个变量之间具有一定的联系(影响),但又没有确定性的函数关系,这种关系称为相关关系。
两个变量具有相关关系的事例在现实中大量存在. 例如:
2.一个人的体重与个人的饮食量之间的关系
1.子女身高与父亲身高之间的关系
3.一个人的数学成绩与物理成绩之间的关系
4.商品销售收入与广告支出之间的关系
5.空气污染指数与汽车保有量之间的关系
6. 个人的教育投资与收入的关系
题型一 对相关关系的理解认识
例1、 试判断下列各个问题中两个变量之间是否具有相关关系: (1)商品的销售价格与其供应量; (2)汽车的耗油量与行驶速度; (3)真空中自由降落的小球的位移(单位:mm)与时间 (单位:s); (4)空气中污染物浓度(单位:μg/m3)与日降雨量(单位: cm)。
课本第152页练习2
在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如下表所示.表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据.
为了更加直观地描述上述成对样本数据中脂肪含量与年龄的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.
用横轴表示年龄,纵轴表示脂肪含量
问题6:散点图中的点有什么特征?
特征:这些点大致散布在一条从左下角到右上角的直线附近
在平面直角坐标系中,将样本数据构成的点在坐标系内描出得到的图称为散点图。
问题5:通过散点图能否判断年龄和脂肪含量是否具有相关关系?
一般地,如果散点图中所描出的点散布在一条直线附近,我们将具有这样的相关关系称为线性相关关系。
一般地,如果具有相关关系的两个变量的散点图呈现从左下逐渐向右上方向发展的趋势
一般地,如果具有相关关系的两个变量的散点图呈现从左上逐渐向右下方向发展的趋势
散点图中的点散布在从左下角到右上角的区域
散点图中的点散布在从左上角到右下角的区域
观察下列散点图并思考:这些描述祥本数据的图反映出相应的变量之间是否具有相关关系?是正相关还是负相关?
题型二 散点图与相关性
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
问题7:散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
利用两个向量共线的方法研究数据的相关性
n对数据的线性相关系数的定义和计算公式
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1, y1), (x2, y2),‧‧‧, (xn, yn),其中x1, x2, ‧‧‧, xn和y1, y2,‧‧‧, yn的均值分别为 和 .
称 为变量x和变量y的线性相关系数.记为r
(1)-1≤ r ≤1;
(2) r>0时y与x呈正相关关系, r<0时y与x呈负相关关系;
(3) |r|越接近1,y与x相关的程度就越强, |r|越接近0, y与x相关的程度就越弱。
通常情况下,当|r|>0.5时,认为线性相关关系显著,当|r|<0.3时,认为几乎没有线性相关关系。
当|r|=0时,成对数据的没有线性相关关系;但不排除它们有其他相关关系当|r|=1时,成对数据都落在一条直线上.
以下是不同成对样本数据的散点图和相应的相关系数
1.某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于样本相关系数的比较,其中正确的是( )
A.r2
3、对两个变量y与x进行回归分析,分别选择不同的模型, 它们相关系数r如下,其中拟合效果最好的模型是( ) ①模型Ⅰ的相关系数r为-0.90; ②模型Ⅱ的相关系数r为0.80; ③模型Ⅲ的相关系数r为-0.50; ④模型Ⅳ的相关系数r为0.25, (A)Ⅰ (B)Ⅱ (C)Ⅲ (D)Ⅳ
题型四 线性相关系数的应用
1.已知变量x和变量y的3对随机观测数据(2,2),(3,-1),(5,-7)则这3对样本数据的样本相关系数是________
苏教版 (2019)选择性必修第二册9.1线性回归分析授课ppt课件: 这是一份苏教版 (2019)选择性必修第二册<a href="/sx/tb_c4009183_t3/?tag_id=26" target="_blank">9.1线性回归分析授课ppt课件</a>,共1页。
苏教版 (2019)选择性必修第二册9.1线性回归分析背景图课件ppt: 这是一份苏教版 (2019)选择性必修第二册<a href="/sx/tb_c4009183_t3/?tag_id=26" target="_blank">9.1线性回归分析背景图课件ppt</a>,共27页。PPT课件主要包含了复习回顾,1确定关系,2相关关系,1正相关,2负相关,关于散点图的说明,数学探究,不共线,数学建构,相关系数r的性质等内容,欢迎下载使用。
高中9.1线性回归分析备课ppt课件: 这是一份高中<a href="/sx/tb_c4009183_t3/?tag_id=26" target="_blank">9.1线性回归分析备课ppt课件</a>,共21页。PPT课件主要包含了问题情境,数学探究,数学建构,1确定关系,2相关关系,数学应用,数学练习,问题4,散点图的定义,1正相关等内容,欢迎下载使用。