


所属成套资源:2023新教材高中数学新人教A版选择性必修第三册全一册教师用书(打包21套)
2023新教材高中数学第8章成对数据的统计分析8.1成对数据的统计相关性教师用书新人教A版选择性必修第三册
展开8.1 成对数据的统计相关性1.结合实例了解样本相关系数的统计含义.2.了解样本相关系数与“标准化”成对数据向量夹角的关系.3.结合实例,会通过相关系数比较多组成对数据的相关性.1.通过画散点图来判断变量的相关关系,提升数据分析素养.2.通过样本相关系数的计算,培养数学运算及逻辑推理素养.在校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系.我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?知识点1 变量间的相关关系相关关系的定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.两个变量之间的关系分为函数关系和相关关系.相关关系与函数关系有什么异同?[提示] 异同点关系函数关系相关关系相同点两者均是指两个变量之间的关系不同点是一种确定性的关系是一种非确定性的关系是两个变量之间的关系①一个为变量,另一个为随机变量;②两个都是随机变量是一种因果关系不一定是因果关系,也可能是伴随关系是一种理想的相关关系模型是一种更为一般的情况1.若“名师出高徒”成立,则名师与高徒之间存在的关系是( )A.相关关系 B.函数关系C.无任何关系 D.不能确定A [名师与高徒之间存在一种相关关系.]知识点2 散点图(1)散点图的概念在讨论两个变量x,y之间的关系时,常把它们写成点(x,y)的形式,以便于在平面直角坐标系中研究它们的关系,此时,x,y可以看成描述同一个物体的两个不同特征的量.例如,人的身高和体重间的关系、学生的数学成绩和物理成绩间的关系等,此时,x和y的出现总是成对的,可以用列表的方式给出,也可以用点的形式表示为(x1,y1),(x2,y2),…,(xn,yn),我们称这样的点为样本点.将n个样本点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中,所得的图形叫做散点图.(2)散点图的作用散点图展示了样本点散布的位置.根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.如果散点图中变量的对应点分布在某条曲线的周围,我们就可以得出结论:这两个变量具有相关性,如图①②.如果变量的对应点分布没有规律,我们就可以得出结论:这两个变量不具有相关性,如图③.选择性必修 第三册成对数据的统计分析 ① ② ③(3)正相关、负相关的概念正相关:如果散点图中的点散布在从左下角到右上角的区域内,即当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关,如图①.负相关:如果散点图中的点散布在从左上角到右下角的区域内,即当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关,如图②.① ②[拓展] 线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.(多选题)下列各图中所示的两个变量具有相关关系的是( )A BC DBC [A为函数关系;B,C为相关关系(B为线性相关关系,C为非线性相关关系);D中,因为点的分布比较分散,没有规律,所以两变量之间无相关关系.]知识点3 样本相关系数(1)“标准化”成对数据向量夹角与样本相关系数的关系对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和.将数据以(,)为零点进行平移,得到平移后的成对数据为(x1-,y1-),(x2-,y2-),…,(xn-,yn-),为了消除度量单位的影响,需要对数据作进一步的“标准化”处理.我们用sx=,sy=,分别除xi-和yi-(i=1,2,…,n),得,,…,,为简单起见,把上述“标准化”处理后的成对数据分别记为(x′1,y′1),(x′2,y′2),…,(x′n,y′n),令r=(x′1y′1+x′2y′2+…+x′ny′n).设x′=(x′1,x′2,…,x′n),y′=(y′1,y′2,…,y′n),则r=x′·y′=|x′||y′|cos θ.因为|x′|=|y′|=,所以样本相关系数r=cos θ,其中θ为向量x′和向量y′的夹角.由-1≤cos θ≤1,可知-1≤r≤1.(2)相关系数计算公式样本相关系数r的计算公式为r==.(3)相关系数与相关程度|r|的大小可以反映成对样本数据之间线性相关的程度,|r|≤1.当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.当|r|=1时,表明成对样本数据都落在一条直线上;当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.3.对四组不同数据进行统计,获得如图所示的散点图,对它们的样本相关系数进行比较,正确的是( )①样本相关系数r1 ②样本相关系数r2③样本相关系数r3 ④样本相关系数r4A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3A [由给出的四组数据的散点图可以看出,图①和图③中的成对数据是正相关的,样本相关系数大于0,图②和图④中的成对数据是负相关的,样本相关系数小于0,图①和图②中的点相对更加集中于一条直线附近,所以相关性更强,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.] 类型1 相关关系的判断【例1】 下列选项中,两变量间具有相关关系的是( )A.正方体的体积与棱长B.匀速行驶的汽车的行驶距离与时间C.人的身高与视力D.某人每日吸烟量与其身体健康情况D [对于A,正方体的体积与棱长是函数关系,不满足题意;对于B,匀速行驶的汽车的行驶距离与时间是函数关系,不满足题意;对于C,人的身高与视力没有明显的关系,不满足题意;对于D,某人每日吸烟量与其身体健康情况有相关关系,满足题意.]判断两个变量是函数关系还是相关关系的方法判断两个变量间的关系是函数关系还是相关关系的关键是判断两个变量之间的关系是不是确定的,若确定,则是函数关系;若不确定,则是相关关系.[跟进训练]1.下列关系中,属于相关关系的是________.(填序号)①扇形的半径与面积之间的关系;②农作物的产量与施肥量之间的关系;③出租车费与行驶的里程;④降雪量与交通事故的发生率之间的关系.②④ [在①中,扇形的半径与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.] 类型2 由散点图判断相关关系【例2】 如图所示的散点图分别反映的变量间的相关关系是( )① ② ③A.正相关,负相关,不相关B.负相关,不相关,正相关C.负相关,正相关,不相关D.正相关,不相关,负相关D [对于图(1),图中的点成带状分布,且从左下角到右上角上升,两个变量正相关;对于图(2),图中的点杂乱无章,没有明显的规律,两个变量不相关;对于图(3),图中的点成带状分布,且从左上角到右下角下降,两个变量负相关.故选D.]由散点图判断相关关系的方法根据散点图判断,这时要由两个变量相应值的对应关系,作出散点图,通过观察散点图中各点是否分布在某条曲线的周围,从而判断变量之间是否具有相关关系.[跟进训练]2.观察下列散点图,其中变量x,y之间有线性相关关系的是( )A BC DD [A选项具有确定的函数关系.根据线性相关定义:散点图在一条直线附近波动,据此判断D满足.] 类型3 用样本相关系数判断线性相关程度【例3】 为了对2020年某校月考成绩进行分析,在60分以上的全体同学中随机抽取8位,他们的数学、物理成绩对应如下表:学生编号12345678数学成绩x6872788185889193物理成绩y7066818379809289用变量y与x的样本相关系数r(精确到0.01)说明物理成绩y与数学成绩x的线性相关程度的强弱,并说明它们的变化趋势特征.参考数据:iyi=52 957,·≈545.82.[解] ==82,==80,r=≈≈0.87>0.所以物理成绩y与数学成绩x的线性相关程度较强,且呈正相关,它们的变化趋势相同.1.相关性检验的步骤(1)利用题中数据计算,.(2)利用公式求解.(3)判断相关关系.2.在统计中常用样本相关系数r来衡量两个变量间线性相关程度的强弱.r的范围为[-1,1],r为正时,两个变量正相关;r为负时,两个变量负相关;|r|越接近1,两个变量间线性相关程度越大;|r|越接近0,两个变量间线性相关程度越小.[跟进训练]3.现随机抽取某中学高一10名在校学生,他们入学时的数学成绩x与入学后第一次考试的数学成绩y如下表所示.学生号12345678910x12010811710410311010410599108y84648468696869465771请问:这10名学生的两次数学成绩是否具有较强的线性相关关系?附:若|r|>0.75,则我们可以认为y与x之间具有较强的线性相关关系.注:r==[解] 由题意,知=×(120+108+117+104+103+110+104+105+99+108)=107.8,=×(84+64+84+68+69+68+69+46+57+71)=68,=116 584,=47 384,iyi=73 796.所以样本相关系数r=≈0.750 6.|r|>0.75,故我们可以认为y与x之间具有较强的线性相关关系.即这10名学生的两次数学成绩具有较强的线性相关关系.1.下列所给出的两个变量之间存在相关关系的为( )A.学生的座位号与数学成绩B.学生的学号与身高C.直线上点的横坐标与纵坐标D.学生的身高与体重D [A与B中两个变量之间没有任何关系;C中的两个变量之间具有函数关系;D中两个变量之间存在相关关系.]2.有以下五组变量:①某商品的销售价格与销售量;②学生的学籍号与学生的数学成绩;③坚持每天吃早餐的人数与患胃病的人数;④气温与冷饮销售量;⑤电瓶车的重量和行驶每千米的耗电量.其中两个变量成正相关的是( )A.①③ B.②④C.②⑤ D.④⑤D [对于①,一般情况下,某商品的销售价格与销售量成负相关关系;对于②,学生的学籍号与学生的数学成绩没有相关关系;对于③,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于④,一般情况下,气温与冷饮销售量成正相关关系;对于⑤,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.综上所述,其中两个变量成正相关的序号是④⑤.]3.两个变量负相关时,散点图的特征是( )A.点散布在从左下角到右上角的区域内B.点散布在某带形区域内C.点散布在某圆形区域内D.点散布在从左上角到右下角的区域内D [有负相关关系的各点整体呈递减趋势,因此点应散布在从左上角到右下角的区域内.]4.如图所示,有A、B、C、D、E共5组数据,去掉______组数据后,剩下的4组数据具有较强的线性相关关系.D [当散点图中的点分布在一条直线附近时,样本数据有较强的线性相关关系,可知应去掉D组数据.]回顾本节知识,自主完成以下问题:1.怎样画散点图?[提示] (1)建立平面直角坐标系,两轴的单位长度可以不一致;(2)将n个样本点(xi,yi)(i=1,2,3,…,n)描在平面直角坐标系中.2.怎样判断两个变量具有相关关系?[提示] (1)根据直观感觉或生活经验等判断;(2)根据成对数据的变化趋势判断;(3)根据散点图判断:若散点图中各点分布在一条直线或曲线附近,则变量具有相关关系.3.样本相关系数r的大小与两个变量的相关程度有何关系?[提示] |r|越接近1,两个变量间线性相关程度越大;|r|越接近0,两个变量间线性相关程度越小.
