人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系说课课件ppt
展开不一定是因果关系,也可能是伴随关系
2.变量相关关系的分类(1)正相关. (2)负相关.
3.线性相关与非线性相关:
通过散点图可以推断两个变量之间是否存在相关关系、是正相关还是负相关、是线性相关是非线性相关,但这些推断是定性的推断.
从定量的角度刻画成对样本数据的线性相关程度,进而推断两个变量的线性相关程度。
数据预处理的常用方法:中心化(零均值化)
通过绘图分析可得,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图 (1)所示; 如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图(2)所示.
根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
一般情形下,Lxy>0表明成对样本数据正相关;Lxy <0表明成对样本数据负相关.
问题2:你认为 的大小一定能度量出成对样本数据的相关程度吗?
在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高单位由米改为厘米,单位的改变不会改变体重与身高之间的相关程度。
为了消除度量单位的影响,需要对数据作进一步的“标准化”处理. 我们用
我们称r为变量x和变量y的样本相关系数.
我们称 r 为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它反映了两个随机变量之间的线性相关程度.r的符号反映了相关关系的正负性.|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
样本相关系数r的取值范围为[-1,1]
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
当|r|=1时,成对样本数据之间具有怎样的关系?
成对样本数据的两个分量之间满足一种线性关系
相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
注意:若0.75≤|r|≤1,则认为y与x的线性相关程度很强; 若0.3≤|r|<0.75,则认为y与x的线性相关程度一般; 若|r|≤0.25,则认为y与x的线性相关程度较弱)
图(1) 中成对样本数据的正线性相关程度很强.图(2) 中成对样本数据的负线性相关程度比较强. 图(3)中 对样本数据的线性相关程度很弱.图(4)中成对样本数据的线性相关程度极弱.
例1 根据表8. 1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
解: 由样本数据可得
由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
例2 有人收集了某城市居民年收入(所有居民在一年内收人的总和)与A商品销售额的10年数据,如下表所示.
画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
画出成对样本数据的散点图,如图所示.从散点图看,A商品销售额与居民年收人的样本数据呈现出线性相关关系. 由样本数据计算得样本相关系数r≈0.95. 由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.
例3 在某校高一年级 中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性?
根据样本数据画出体重与身高、臂展与身高的散点图,分别如图 (1)和(2)所示,两个散点图都呈现出线性相关的特征.
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关. 其中,臂展与身高的相关程度更高.
2.相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
2. 已知变量x和变量y的3对随机观测数据(2, 2), (3, -1), (5, -7),计算成对样本数据的样本相关系数. 能据此推断这两个变量线性相关吗? 为什么?
虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.
样本相关系数主要刻画的是成对样本数据线性相关的程度.
4. 随机抽取7家超市,得到其广告支出与销售额数据如下:
正线性相关,相关性较强,销售额与广告支出的变化趋势相同.
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
例1 假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
题型一 成对数据相关系数的计算
所以y与x之间具有正相关关系.
训练2 两个变量x,y的样本相关系数r1=0.785 9,两个变量u,v的样本相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
解析 由样本相关系数r1=0.785 9>0知x与y正相关,由样本相关系数r2=-0.956 8<0知u,v负相关.又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.
习题讲解 ——分层精练
1.(多选)对两个变量的样本相关系数r,下列说法正确的是( )
A.|r|越大,相关程度越大B.|r|越小,相关程度越大C.|r|趋近于0时,没有线性相关关系D.|r|越接近1时,线性相关程度越强
解析 对于A,|r|越大,相关程度越大,A正确;对于B,|r|越小,相关程度越小,B错误;对于C,|r|趋近于0时,线性相关关系越弱,C错误;对于D,|r|越接近1时,线性相关程度越强,D正确.
5.(多选)下面的散点图与样本相关系数r一定不符合的是( )
解析 A中,由散点图可得,两相关变量呈负相关,故A错误;B中,由散点图可得,两相关变量呈正相关,且样本相关系数可能是r=0.75;C中,若样本相关系数r=-1,则所有的点应该分布在一条直线上,散点图显然不符合,故C错误;D中,若样本相关系数r=1,则所有的点应该分布在一条直线上,散点图显然不符合,故D错误.
11.对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较,正确的是( )
A.r2
A.每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关B.月温差(月最高气温-月最低气温)的最大值出现在10月C.9~12月的月温差相对于5~8月,波动性更大D.每月最高气温与最低气温的平均值在所统计的前6个月里逐月增加
解析 每月最低气温与最高气温的样本相关系数r=0.83,可知每月最低气温与最高气温有较强的线性相关性,且二者为正线性相关.由所给的折线图可以看出月温差(月最高气温-月最低气温)的最大值出现在10月.9~12月的月温差相对于5~8月,波动性更大.每月的最高气温与最低气温的平均值在所统计的前5个月里逐月增加,在第6个月开始减少,所以A,B,C正确,D错误.
习题讲解 ——每日一刻钟
人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课文配套课件ppt: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000363_t3/?tag_id=26" target="_blank">8.1 成对数据的相关关系课文配套课件ppt</a>,共29页。PPT课件主要包含了创设情境揭示课题,阅读精要研讨新知,例题研讨,学习例题的正规表达,学习例题的常规方法,从例题中学会思考,如何看例题,小组互动,探索与发现思考与感悟,归纳小结回顾重点等内容,欢迎下载使用。
人教A版 (2019)8.1 成对数据的相关关系教学课件ppt: 这是一份人教A版 (2019)8.1 成对数据的相关关系教学课件ppt,共29页。PPT课件主要包含了样本相关系数的应用,样本相关系数等内容,欢迎下载使用。
数学选择性必修 第三册8.1 成对数据的相关关系教学课件ppt: 这是一份数学选择性必修 第三册8.1 成对数据的相关关系教学课件ppt,共5页。PPT课件主要包含了相关关系,散点图,正相关与负相关,正相关,负相关,复习回顾,新课导入,样本相关系数,概念生成,样本相关系数的性质等内容,欢迎下载使用。