高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系优秀ppt课件
展开1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.
散点图可以说明变量间有无线性相关关系,但无法量化两个变量之间的相关程度的大小,更不能精确地说明成对样本数据之间关系的密切程度,那么我们如何才能寻找到这样一个合适的量来对样本数据的相关程度进行定量分析呢?
问题 若样本系数r=0.97,则成对样本数据的相关程度如何?提示 r=0.97,表明成对样本数据正线性相关程度很强.
3.变量相关关系的分类
像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了统计图.我们把这样的统计图叫做散点图
4.两个变量之间相关关系的确定
(2).通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断
1.如何引入一个恰当的“数字特征”,对成对样本数据的相关程度进行定量分析?
如果变量x和变量y负相关,那么关于均值平移后的大多数点 将分布在第二、四象限,对应的成对数据异号居多.
一般地,如果变量x和变量y正相关,那么 均值平移后的大多数点将分布在第一、三象限, 对应的成对数据同号居多;
思考1 根据上述分析,你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
一般情形下,Lxy>0表明成对样本数据正相关;Lxy <0表明成对样本数据负相关.
思考2 Lxy的大小是否一定能度量出成对样本数据的相关程度吗?
因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小. 为了消除度量单位的影响,需要对数据作进一步的“标准化”处理. 我们用
我们称r为变量x和变量y的样本相关系数.
当r >0时,称成对样本数据正相关;当r <0时,称成对样本数据负相关.
我们称 r 为变量x和变量y的样本相关系数.
样本相关系数r是一个描述成对样本数据的数字特征,它的正负和绝对值的大小可以反映成对样本数据的变化特征:
样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?
样本相关系数r的取值范围:
样本相关系数r的取值范围为[-1,1]
当|r|=1时,成对样本数据之间具有怎样的关系?
成对样本数据的两个分量之间满足一种线性关系
由此可见,样本相关系数r的取值范围为[-1,1],样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度:
当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱.
样本相关系数r有时也称样本线性相关系数,|r|刻画了样本点集中于某条直线的程度.当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
两个随机变量的相关性可以通过散点图对成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度: r 的符号反映相关关系的正负性,|r|的大小反映两个变量线性相关的程度,即散点集中于一条直线的程度.
判断线性相关程度: 散点图+r
例1 根据表8. 1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
解: 由样本数据可得
由此可以推断脂肪含量和年龄这两个变量正线性相关,且相关程度很强.
例2 有人收集了某城市居民年收入(所有居民在一年内收人的总和)与A商品销售额的10年数据,如下表所示.
画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
画出成对样本数据的散点图,如图所示.从散点图看,A商品销售额与居民年收人的样本数据呈现出线性相关关系. 由样本数据计算得样本相关系数r≈0.95. 由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.
例3 在某校高一年级 中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如下表所示.
体重与身高、臂展与身高分别具有怎样的相关性?
根据样本数据画出体重与身高、臂展与身高的散点图,分别如图 (1)和(2)所示,两个散点图都呈现出线性相关的特征.
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关. 其中,臂展与身高的相关程度更高.
1. 由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系? 为什么?
解:样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系. 一般来说,样本量越大,根据样本相关系数推断变量之间相关的正负性及线性相关的程度越可靠,而样本量越小则越不可靠. 一个极端的情况是,无论两个变量之间是什么关系,如果样本量取2,则计算可得样本相关系数的绝对值都是1 (在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的.
2. 已知变量x和变量y的3对随机观测数据(2, 2), (3, -1), (5, -7),计算成对样本数据的样本相关系数. 能据此推断这两个变量线性相关吗? 为什么?
虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.
样本相关系数主要刻画的是成对样本数据线性相关的程度.
4. 随机抽取7家超市,得到其广告支出与销售额数据如下:
正线性相关,相关性较强,销售额与广告支出的变化趋势相同.
请推断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
1.两个变量之间的相关程度越低,则其线性相关系数的数值( )A.越小 B.越接近1C.越接近0 D.越接近-1解析 由相关系数的性质知选C.答案 C
2.给定y与x的一组样本数据,求得相关系数r=-0.690,则( )A.y与x线性不相关 B.y与x正线性相关C.y与x负线性相关 D.以上都不对解析 因为r=-0.690<0,所以y与x负线性相关.答案 C
3.(多选题)下列说法正确的是( )A.变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.如果r=±1,说明x与y之间完全线性相关D.线性相关系数r∈(-1,1)解析 ∵相关系数|r|≤1,∴D错误.答案 ABC
4.某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
已知记忆力x和判断力y是线性相关的,求相关系数r.
2.相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
数学人教A版 (2019)8.1 成对数据的相关关系优质ppt课件: 这是一份数学人教A版 (2019)8.1 成对数据的相关关系优质ppt课件,共32页。PPT课件主要包含了问题导入,新知探索,课堂总结等内容,欢迎下载使用。
人教A版 (2019)8.1 成对数据的相关关系教学课件ppt: 这是一份人教A版 (2019)8.1 成对数据的相关关系教学课件ppt,共29页。PPT课件主要包含了样本相关系数的应用,样本相关系数等内容,欢迎下载使用。
数学选择性必修 第三册8.1 成对数据的相关关系教学课件ppt: 这是一份数学选择性必修 第三册8.1 成对数据的相关关系教学课件ppt,共5页。PPT课件主要包含了相关关系,散点图,正相关与负相关,正相关,负相关,复习回顾,新课导入,样本相关系数,概念生成,样本相关系数的性质等内容,欢迎下载使用。