高中数学人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系示范课课件ppt
展开1.结合实例,会通过相关系数比较多组成对数据的相关性.2.了解样本相关系数与标准化数据向量夹角的关系.
通过观察散点图中成对样本数据的分布规律,我们可以大致推断两个变量是否存在相关关系、是正相关还是负相关、是线性相关还是非线性相关等.散点图虽然直观,但无法确切地反映成对样本数据的相关程度,也就无法量化两个变量之间相关程度的大小.能否像引入平均值、方差等数字特征对单个变量数据进行分析那样,引入一个适当的“数字特征”,对成对样本数据的相关程度进行定量分析呢?
利用上述方法处理表8.1-1中的数据,得到图8.1-3.我们发现,这时的散点大多数分布在第一象限、第三象限,大多数散点的横、纵坐标同号.显然,这样的规律是由人体脂肪含量与年龄正相关所决定的.
一般地,如果变量x和y正相关,那么关于均值平移后的大多数散点将分布在第一象限、第三象限,对应的成对数据同号的居多,如图8.1-4(1)所示;如果变量x和y负相关,那么关于均值平移后的大多数散点将分布在第二象限、第四象限,对应的成对数据异号的居多,如图8.1-4(2)所示.
思考:根据上述分析.你能利用正相关变量和负相关变量的成对样本数据平移后呈现的规律,构造一个度量成对样本数据是正相关还是负相关的数字特征吗?
因为Lxy的大小与数据的度量单位有关,所以不宜直接用它度量成对样本数据相关程度的大小.例如,在研究体重与身高之间的相关程度时,如果体重的单位不变,把身高的单位由米改为厘米,则相应的Lxy将变为原来的100倍,但单位的改变并不会导致体重与身高之间相关程度的改变.
我们称r为变量x和变量y的样本相关系数(sample crrelatin cefficient)
这样,我们利用成对样本数据构造了样本相关系数r.样本相关系数r是一个描述成对样本数据的数字特征,它的正负性和绝对值的大小可以反映成对样本数据的变化特征:当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.那么,样本相关系数r的大小与成对样本数据的相关程度有什么内在联系呢?为此,我们先考察一下r的取值范围.
由此可见,样本相关系数r的取值范围为[-1, 1].样本相关系数的绝对值大小可以反映成对样本数据之间线性相关的程度:当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
图8.1-5是不同成对样本数据的散点图和相应的样本相关系数.图(1)中的散点有明显的从左下角到右上角沿直线分布的趋势,说明成对样本数据呈现出线性相关关系;样本相关系数r=0.97,表明成对样本数据的正线性相关程度很强.图(2)中的散点有明显的从左上角到右下角沿直线分布的趋势,说明成对样本数据也呈现出线性相关关系;样本相关系数r=-0.85,表明成对样本数据的负线性相关程度比较强.从样本相关系数来看,图(1)中成对样本数据的线性相关程度要比图(2)中强一些;图(3)和图(4)中的成对样本数据的线性相关程度很弱,其中图(4)中成对样本数据的线性相关程度极弱.
综上可知,两个随机变量的相关性可以通过成对样本数据进行分析,而样本相关系数r可以反映两个随机变量之间的线性相关程度:r的符号反映了相关关系的正负性;|r|的大小反映了两个变量线性相关的程度,即散点集中于一条直线的程度.在有限总体中,若要确切地了解两个变量之间相关关系的正负性及线性相关的程度,我们可以利用这两个变量取值的所有成对数据,通过公式(1)就可以计算出两个变量的相关系数.例如,要确切了解脂肪含量y与年龄x的线性相关程度,需要调查所有人的年龄及其脂肪含量,再将得到的成对数据代入公式(1),计算出相关系数.这个相关系数就能确切地反映变量之间的相关程度.
不过,在实际中,获得总体中所有的成对数据往往是不容易的.因此,我们还是要用样本估计总体的思想来解决问题.也就是说,我们先要通过抽样获取两个变量的一些成对样本数据,再计算出样本相关系数,通过样本相关系数去估计总体相关系数,从而了解两个变量之间的相关程度.对于简单随机样本而言,样本具有随机性,因此样本相关系数r也具有随机性.一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.
例1 根据表8.1-1中脂肪含量和年龄的样本数据,推断两个变量是否线性相关,计算样本相关系数,并推断它们的相关程度.
解:先画出散点图,如图8.1-1所示.观察散点图,可以看出样本点都集中在一条直线附近,由此推断脂肪含量和年龄线性相关.
利用统计软件计算样本相关系数,Excel软件用函数CORREL;R软件用函数cr.
例2 有人收集了某城市居民年收入(所有居民在一年内收入的总和)与A商品销售额的10年数据,如表8.1-2所示.
画出散点图,推断成对样本数据是否线性相关,并通过样本相关系数推断居民年收入与A商品销售额的相关程度和变化趋势的异同.
解:画出成对样本数据的散点图,如图8.1-6所示.从散点图看,A商品销售额与居民年收入的样本数据呈现出线性相关关系.
由样本数据计算得样本相关系数r≈0.95.由此可以推断,A商品销售额与居民年收入正线性相关,即A商品销售额与居民年收入有相同的变化趋势,且相关程度很强.
例3 在某校高一年级中随机抽取25名男生,测得他们的身高、体重、臂展等数据,如表8.1-3所示.体重与身高、臂展与身高分别具有怎样的相关性?
解:根据样本数据画出体重与身高、臂展与身高的散点图,分别如图8.1-7(1)和(2)所示,两个散点图都呈现出线性相关的特征.
通过计算得到体重与身高、臂展与身高的样本相关系数分别约为0.34和0.78,都为正线性相关.其中,臂展与身高的相关程度更高.
2.相关系数的性质: ① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关. ② |r|≤1; ③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系,叫做相关关系.
4.相关关系与函数关系的异同点
不同点:函数关系是一种确定的关系,因果关系;而相关关系是一种非确定性关系,也可能是伴随关系。
相同点:均是指两个变量的关系
相关关系—当自变量取值一定,因变量的取值带有一定的随机性( 非确定性关系)函数关系---函数关系指的是自变量和因变量之间的关系是相互唯一确定的.
完成教材:第103页练习第3,4题.
1.由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的相关关系?为什么?
样本相关系数可以反映变量之间相关的正负性及线性相关的程度,但由于样本数据的随机性,样本相关系数往往不能确切地反映变量之间的相关关系.一般来说,样本量越大,根据样本相关系数推断变量之间相关的正负性及线性相关的程度越可靠,而样本量越小则越不可靠.一个极端的情况是,无论两个变量之间是什么关系,如果样本量取2,则计算可得样本相关系数的绝对值都是1(在样本相关系数存在的情况下),显然据此推断两个变量完全线性相关是不合理的.
虽然样本相关系数为-1,三个样本点在一条直线上,但是由于样本量太小,据此推断两个变量完全线性相关并不可靠.
3.画出下列成对数据的散点图,并计算样本相关系数.据此,请你谈谈样本相关系数在刻画两个变量间相关关系上的特点.
综上,由相关系数的值可知,|r|越接近1,样本的线性相关性越强,越接近0,线性相关性越弱.
4.随机抽取7家超市,得到其广告支出与销售额数据如下:
请判断超市的销售额与广告支出之间的相关关系的类型、相关程度和变化趋势的特征.
从散点图上可得,超市的销售额与广告支出之间呈现出线性相关关系,
由此可推断,销售额与广告支出之间正线性相关,且相关程度较强,销售额与广告支出的变化趋势相同,但随着广告支出超过10万元后,销售额增加幅度变缓.
1.在以下4幅散点图中,判断哪些图中的y和x之间存在相关关系?其中哪些正相关,哪些负相关?哪些图所对应的成对样本数据呈现出线性相关关系?哪些图所对应的成对样本数据呈现出非线性相关关系.
图(2)(3)(4)中的y和x之间存在相关关系;其中图(2)(4)中的y和x之间呈现正相关关系;图(2)(3)中的y和x之间呈现线性相关关系;其中图(4)中的y和x之间呈现非线性相关关系.
2.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:
顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?
设顾客投诉次数为y,正点率为x,
可以推断顾客投诉次数与航班正点率负线性相关,且相关程度较强,顾客投诉次数和航班正点率的变化趋势相反.
3.根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
两个变量的样本相关系数是否为1?请你解释其中的原因.
先画出弹簧长度和所受外力的散点图,如图所示,
理由如下:在理想状态下,弹簧伸长的长度与所受的外力成正比,则弹簧伸长的长度x和相应所受外力F之间满足线性函数关系,相关系数必为1;但是在现实情况下,测量数据受很多因素的影响,比如弹簧的材料,粗细,测量的误差等等,所以通过测量获得样本数据也具有随机性,因此通过测量数据求得的相关系数不一定为1.
4.某地区的环境条件适合天鹅栖息繁衍.有人发现了一个有趣的现象,该地区有5个村庄,其中3个村庄附近栖息的天鹅较多,婴儿出生率也较高;2个村庄附近栖息的天鹅较少,婴儿的出生率也较低.有人认为婴儿出生率和天鹅数之间存在相关关系,并得出一个结论:天鹅能够带来孩子,你同意这个结论吗?为什么?
从统计数据看, 婴儿出生率和天鹅数正相关, 但由于样本数据较少, 得出婴儿出生率和天鹅数两个变量正相关的结论可靠性不高.即使婴儿出生率和天鹅数正相关, 也无法得出天鹅能够带来孩子的结论.因为天鹅数多的地方婴儿出生率也高,可能是受共同的第三方因素影响的结果.例如,某个地方生态很好,既有利于吸引天鹅来栖息繁衍,也有利于婴儿的出生,所以不能得出婴儿出生率高是天鹅多的缘故.可见,相关关系只是反映两个变量之间存在的一种数量关系,但这种数量关系并不一定是因果关系.
人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系说课课件ppt: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000363_t3/?tag_id=26" target="_blank">8.1 成对数据的相关关系说课课件ppt</a>,共42页。PPT课件主要包含了样本相关数r,THANKS,大本习题讲解等内容,欢迎下载使用。
人教A版 (2019)选择性必修 第三册8.1 成对数据的相关关系课文配套课件ppt: 这是一份人教A版 (2019)选择性必修 第三册<a href="/sx/tb_c4000363_t3/?tag_id=26" target="_blank">8.1 成对数据的相关关系课文配套课件ppt</a>,共29页。PPT课件主要包含了创设情境揭示课题,阅读精要研讨新知,例题研讨,学习例题的正规表达,学习例题的常规方法,从例题中学会思考,如何看例题,小组互动,探索与发现思考与感悟,归纳小结回顾重点等内容,欢迎下载使用。
人教A版 (2019)8.1 成对数据的相关关系教学课件ppt: 这是一份人教A版 (2019)8.1 成对数据的相关关系教学课件ppt,共29页。PPT课件主要包含了样本相关系数的应用,样本相关系数等内容,欢迎下载使用。