人教A版 (2019)选择性必修 第三册第八章 成对数据的统计分析8.1 成对数据的相关关系优秀学案设计
展开结合实例,了解样本相关系数的统计含义.
了解样本相关系数与标准化数据向量夹角的关系.
结合实例,会通过样本相关系数比较多组成对样本数据的相关性.
重点难点
1.教学重点:
利用散点图进行相关关系的判断,相关系数r的应用。
2.教学难点:
了解样本相关系数的统计含义,散点图和样本相关系数
课前预习 自主梳理
知识点一 相关关系的定义
相关关系的定义:两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
思考 相关关系是函数关系吗?
答案 不是.函数关系是唯一确定的关系.
知识点二 相关关系的分类
(1)按变量间的增减性分为正相关和负相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.
(2)按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.
自主检测
1.判断正误,正确的画“√”,错误的画“×”.
函数关系是一种确定关系,而相关关系是一种不确定关系.( )
样本相关系数r越大,两变量的相关性越强.( )
散点图可以直观地分析出两个变量是否具有相关性.( )
若变量x,y满足函数关系,则这两个变量线性相关.( )
两个变量的相关关系是一种确定的关系.( )
当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.( )
一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.( )
统计活动中,分析数据时通常用统计图表计算数据的数据特征.( )
在一定范围内,农作物的产量与施肥量之间的关系是相关关系.( )
【答案】(1)√(2)×(3)√(4)×(5)×(6)×(7)√(8)√(9)√
2.下列说法正确的是( )
A.圆的面积与半径之间的关系是相关关系
B.粮食产量与施肥量之间的关系是函数关系
C.一定范围内,学生的成绩与学习时间成正相关关系
D.人的体重与视力成负相关关系
【答案】C
【分析】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.
【详解】解:对于A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以A错误;
对于B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以B错误;
对于C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以C正确;
对于D,人的体重与视力是没有相关关系的,所以D错误.
故选:C.
【点睛】考查相关关系的判断,基础题.
3.已知变量x和y满足关系y=0.1x-10,变量z与y负相关,则下列结论中正确的是
( )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
【答案】C
【详解】 由题意知,变量和之间满足关系,所以变量和是正相关关系,
又变量和是负相关,所以变量和是负相关关系,故选C.
4.已知变量和满足关系,变量与正相关,下列结论中正确的是( )
A.与正相关,与负相关B.与正相关,与正相关
C.与负相关,与负相关D.与负相关,与正相关
【答案】C
【分析】根据相关系数的符号判断相关性,又由变量与正相关,分析可得与的相关性,即可得答案.
【详解】解:根据题意,变量和满足关系,其相关系数为,
所以与负相关;
又由变量与正相关,则与负相关;
故选:C
【点睛】本题考查由线性回归方程,正确理解相关系数的符号与正相关还是负相关的对应是解题的关键.
5.研究表明某地的山高与该山的年平均气温具有相关关系,根据所采集的数据得到线性回归方程,则下列说法错误的是
A.年平均气温为时该山高估计为
B.该山高为处的年平均气温估计为
C.该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关
D.该地的山高与该山的年平均气温成负相关关系
【答案】B
【分析】由已知线性回归直线方程,可估计平均气温为时该地的山高,即可得到答案.
【详解】线性回归直线方程为,当 时即年平均气温为时该山高估计为,故正确;当时解得即山高为处的年平均气温估计为,故错误;该地的山高与该山的年平均气温的正负相关性与回归直线的斜率的估计值有关,故正确;
由,该地的山高与该山的年平均气温成负相关关系,故正确.故选B
【点睛】本题考查线性回归直线方程的应用,考查相关的意义,判断能力,属于基础题.
新课导学
学习探究
环节一 创设情境,引入课题
在必修课程中,我们学习了单个变量的观察数据的直观表示和统计特征的刻画等知识与方法.例如,用直方图描述样本数据的分布规律,用均值刻画样本数据的集中趋势,用方差刻画样本数据的离散程度等.这些方法主要适用于通过样本认识单个变量的统计规律.在现实中,我们还经常需要了解两个或两个以上变量之间的关系.例如,教育部门为掌握学生身体健康状况,需要了解身高变量和体重变量之间的关系;医疗卫生部门要制定预防青少年近视的措施,需要了解有哪些因素会影响视力,以及这些因素是如何影响视力的;商家要根据顾客的意见改进服务水平,希望了解哪些因素影响服务水平,以及这些因素是如何起作用的;等等.为此,我们需要进一步学习通过样本推断变量之间关系的知识和方法.
本章的学习内容有成对数据的统计相关性、一元线性回归模型和列联表等,这些知识与方法在解决实际问题中非常有用.可以发现,两个随机变量的相关性可以通过成对样本数据进行分析;利用一元线性回归模型可以研究变量之间的随机关系,进行预测;利用列联表可以检验两个随机变量的独立性.本章的学习对于提高我们解决实际问题的能力,提升数据分析、数学建模等素养都是非常有帮助的.
我们知道,如果变量是变量的函数,那么由就可以唯一确定.然而,现实世界中还存在这样的情况:两个变量之间有关系,但密切程度又达不到函数关系的程度.例如,人的体重与身高存在关系,但由一个人的身高值并不能确定他的体重值.那么,该如何刻画这两个变量之间的关系呢?下面我们就来研究这个问题.
环节二 观察分析,感知概念
我们知道,一个人的体重与他的身高有关系.一般而言,个子高的人往往体重值较大,个子矮的人往往体重值较小.但身高并不是决定体重的唯一因素,例如生活中的饮食习惯、体育锻炼、睡眠时间以及遗传因素等也是影响体重的重要因素.像这样,两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系(crrelatin).
两个变量具有相关关系的事例在现实中大量存在.例如:
1.子女身高y与父亲身高x之间的关系.一般来说,父亲的个子高,其子女的个子也会比较高;父亲个子矮,其子女的个子也会比较矮.但影响子女身高的因素,除父亲身高外还有其他因素,例如母亲身高、饮食结构、体育锻炼等,因此父亲身高又不能完全决定子女身高.
2.商品销售收入y与广告支出x之间的关系.一般来说,广告支出越多,商品销售收入越高.但广告支出并不是决定商品销售收入的唯一因素,商品销售收入还与商品质量、居民收入等因素有关.
3.空气污染指数y与汽车保有量x之间的关系.一般来说,汽车保有量增加,空气污染指数会上升.但汽车保有量并不是造成空气污染的唯一因素,气象条件、工业生产排放、居民生活和取暖、垃圾焚烧等都是影响空气污染指数的因素.
4.粮食亩产量y与施肥量x之间的关系.在一定范围内,施肥量越大,粮食亩产就越高.但施肥量并不是决定粮食亩产量的唯一因素,粮食亩产量还要受到土壤质量、降水量、田间管理水平等因素的影响.
因为在相关关系中,变量y的值不能随变量x的值的确定而唯一确定,所以我们无法直接用函数去描述量之间的这种关系.对上述各例中两个变量之间的相关关系,我们往往会根据自己以往积累的经验作出推断.“经验之中有规律”,经验的确可以为我们的决策提供一定的依据,但仅凭经验推断又有不足.例如,不同经验的人对同一情形可能会得出不同结论,不是所有的情形都有经验可循等.因此,在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.
【设计意图】该情境从解决现实问题需求出发,引入“相关关系”的概念,让学生了解概念内涵 与外延的同时体会到引入“相关关系”的必要性。
环节三 抽象概括,形成概念
探究:在对人体的脂肪含量和年龄之间关系的研究中,科研人员获得了一些年龄和脂肪含量的简单随机样本数据,如表8.1-1所示.表中每个编号下的年龄和脂肪含量数据都是对同一个体的观测结果,它们构成了成对数据
表8.1—1
根据以上数据,你能推断人体的脂肪含量与年龄之间存在怎样的关系吗?
为了更加直观地描述上述成对样本数据中脂肪含量与年龄之间的关系,类似于用直方图描述单个变量样本数据的分布特征,我们用图形展示成对样本数据的变化特征.用横轴表示年龄,纵轴表示脂肪含量,则表8.1-1中每个编号下的成对样本数据都可用直角坐标系中的点表示出来,由这些点组成了如图8.1-1所示的统计图.我们把这样的统计图叫做散点图(scatter plt).
观察图8.1—1可以发现,这些散点大致落在一条从左下角到右上角的直线附近,表明随年龄值的增加,相应的脂肪含量值呈现增高的趋势.这样,由成对样本数据的分布规律,我们可以推断脂肪含量变量和年龄变量之间存在着相关关系.
【设计意图】数形结合,引导学生从图形角度进一步深化相关关系的内涵并总结出大致判断“相 关关系”的方法。
环节四 辨析理解 深化概念
如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关(psitive crrelatin);如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关(negative crrelatin).
由图8.1—1,能够推断脂肪含量与年龄这两个变量正相关.
思考:
两个变量负相关时,成对样本数据的散点图有什么特点?
你能举出生活中两个变量正相关或负相关的一些例子吗?
散点图是描述成对数据之间关系的一种直观方法.观察散点图8.1-1,从中我们不仅可以大致看出脂肪含量和年龄呈现正相关性,而且从整体上可以看出散点落在某条直线附近.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关(linear crrelatin).
环节五 概念应用,巩固内化
观察散点图8.1-2,我们发现:图(1)中的散点落在某条曲线附近,而不是落在一条直线附近,说明这两个变量具有相关性,但不是线性相关;类似地,图(2)中的散点落在一条折线附近,这两个变量也具有相关性,但它们既不是正相关,也不是负相关;图(3)中的散点杂乱无章,无规律可言,看不出两个变量有什么相关性.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
环节六 归纳总结,反思提升
1. 本节课学习的概念有哪些?
(1)相关关系.
(2)散点图.
(3)正相关、负相关、线性相关、非线性相关.
(4)样本相关系数.
2. 在解决问题时,用到了哪些数学思想?
数形结合.
3.常见误区:
相关关系与函数关系不分,样本相关系数绝对值的大小与相关程度的关系.
环节七目标检测,作业布置
完成教材:第103页练习第3,4题.
备用练习
1.(多选)下列结论正确的是( )
A.函数关系是一种确定性关系
B.相关关系是一种非确定性关系
C.在研究身高与年龄的关系时,散点图中可用横轴表示年龄,纵轴表示身高
D.散点图能准确反映变量间的关系
【答案】ABC
【分析】根据函数概念和相关关系概念判断即可.
【详解】对于A:因为函数关系是确定关系,所以A正确;
对于B:因为相关关系是非确定性关系,所以B正确;
对于C:两个变量转换成数据后,一个对应点的横坐标,一个对应点的纵坐标,所以C正确;
对于D:散点图只能大致反映变量间关系,所以D错误.
故选:ABC.
2.下列关系中,属于相关关系的是( ).
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.出租车车费与行驶的里程之间的关系
D.降雪量与交通事故的发生率之间的关系
【答案】BD
【分析】根据相关关系的概念逐项分析可得答案.
【详解】A中,正方形的边长与面积之间的关系是函数关系;
B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;
C中,出租车车费与行驶的里程之间的关系为确定的函数关系;
D中,降雪量与交通事故的发生率之间具有相关关系.
故选:BD.
3.以下两个变量成负相关的是 .
①学生的学籍号与学生的数学成绩;
②坚持每天吃早餐的人数与患胃病的人数;
③气温与冷饮销售量;
④电瓶车的重量和行驶每千米的耗电量.
【答案】②
【分析】根据相关关系的知识确定正确答案.
【详解】①无相关关系;②负相关;③④正相关.
故答案为:②
4.根据下面四个散点图中点的分布状态,可以直观地判断两个变量之间具有线性相关关系的是( )
A.B.
C.D.
【答案】BC
【分析】根据散点图中点的分布情况即可得答案.
【详解】A中的点无规律分布,范围很广,表明两个变量之间的相关程度很小;
B,C中的点分布在一条直线的附近,两个变量之间具有线性相关关系;
D中所有的点分布在一条曲线附近,所以不是线性相关关系.
故选:BC.
5.下列说法正确的是( )
A.闯红灯与交通事故发生率的关系是相关关系
B.同一物体的加速度与作用力是函数关系
C.产品的成本与产量之间的关系是函数关系
D.广告费用与销售量之间的关系是相关关系
【答案】ABD
【分析】利用相关关系的定义判断.
【详解】闯红灯与发生交通事故之间不是因果关系,但具有相关性,是相关关系,所以A正确;
物体的加速度与作用力的关系是函数关系,B正确;
产品的成本与产量之间是相关关系,C错误;
广告费用与销售量之间是相关关系,D正确.
故选:ABD编号
1
2
3
4
5
6
7
年龄/岁
23
27
39
41
45
49
50
脂肪含量/%
9.5
17.8
21.2
25.9
27.5
26.3
28.2
编号
8
9
10
11
12
13
14
年龄/岁
53
54
56
57
58
60
61
脂肪含量/%
29.6
30.2
31.4
30.8
33.5
35.2
34.6
数学选择性必修 第三册7.2 离散型随机变量及其分布列优秀学案: 这是一份数学选择性必修 第三册<a href="/sx/tb_c4000357_t4/?tag_id=42" target="_blank">7.2 离散型随机变量及其分布列优秀学案</a>,文件包含人教A版数学高二选择性必修第三册72离散型随机变量及其分布列导学案原卷版docx、人教A版数学高二选择性必修第三册72离散型随机变量及其分布列导学案解析版docx等2份学案配套教学资源,其中学案共27页, 欢迎下载使用。
高中数学8.3 分类变量与列联表学案: 这是一份高中数学<a href="/sx/tb_c4000365_t4/?tag_id=42" target="_blank">8.3 分类变量与列联表学案</a>,共22页。学案主要包含了典例解析等内容,欢迎下载使用。
数学选择性必修 第三册8.1 成对数据的相关关系学案及答案: 这是一份数学选择性必修 第三册<a href="/sx/tb_c4000363_t4/?tag_id=42" target="_blank">8.1 成对数据的相关关系学案及答案</a>,共17页。