高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析学案设计
展开1、结合实例,了解样本相关系数的统计含义.
2、结合实例,了解样本相关系数与标准化数据向量夹角的关系.
3、结合实例,会通过相关系数比较多组成对数据的相关性.
学科素养目标
本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.
在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.
重点难点
重点:借助概率分布直方图的几何直观,了解正态分布的特征;
难点:正态分布的均值、标准差、方差及其含义.
教学过程
基础知识点
1.变量的相关关系
(1)两个变量的关系
(2)散点图:建立平面直角坐标系.将样本中的数据构成的点在__________标出得到的统计图.
(3)线性相关关系:散点落在__________附近,则称这两个变量具有线性相关关系.
(4)正相关与负相关
2.相关系数
(1)样本相关系数r的计算公式
我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为r=____________ .
(2)样本相关系数r的性质
①____≤r≤_____;
②r__0时y与x呈正相关关系,r___0时y与x呈负相关关系;
③|r|越接近1,y与x相关的程度就_____,|r|越接近0,y与x相关的程度就____;
通常情况下,当|r|>0.5时,认为线性相关关系_______;当|r|<0.3时,认为_________线性相关关系.
【课前小题演练】
题1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
题2.下列两个变量间的关系不是函数关系的是( )
A.圆的半径与周长
B.角的度数与它的正切值
C.单产为常数时,土地面积与粮食总产量
D.日照时间与水稻的单位产量
题3.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
题4.对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是( )
A.负相关 B.正相关
C.先正后负相关 D.先负后正相关
题5.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )
A.1 B.-0.5 C.0 D.0.5
题6.下列反映两个变量的相关关系中,不同于其他三个的是( )
A.名师出高徒 B.水涨船高
C.月明星稀 D.登高望远
题7.现随机抽取了某校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如表:
请问:这10名学生的两次数学考试成绩是否具有显著的线性相关关系?
【当堂巩固训练】
题8.某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是( )
A.r4<r2<0<r1<r3 B.r2<r4<0<r1<r3
C.r2<r4<0<r3<r1 D.r4<r2<0<r3<r1
题9.已知x,y是两个变量,下列四个散点图中,x,y呈负相关趋势的是( )
题10.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额成正比例函数关系
B.利润率与人均销售额成反比例函数关系
C.利润率与人均销售额成正相关关系
D.利润率与人均销售额成负相关关系
题11.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
题12.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=- eq \f(1,5) x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.1
C.- eq \f(1,5) D. eq \f(1,5)
题13.在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )
A.y=- eq \f(1,2) x-1 B.y=x-1
C.y=x+1 D.y=-x2
题14.(多选题)下列关系中,属于相关关系的是( )
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
题15.(多选题)以下各对变量成正相关的是( )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的重量和行驶每千米的耗电量
题16.下列两个变量之间具有相关关系的是________.(填序号)
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
题17.下列说法中正确的是________(填序号).
①变量间的线性相关系数r的取值范围为[-1,1];
②变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低;
③变量间的相关系数越小,变量间的相关程度越小.
题18.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应关系:
x与Y之间是否具有线性相关关系?若有,判断相关性的强弱.
题19.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mml/L)、空腹血糖CLU指标值(单位:mml/L)如表所示.
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、CLU指标值与BMI值的相关程度;
参考公式:
相关系数r= eq \f(\i\su(i=1,n, )(xi-\x\t(x))(yi-\x\t(y)),\r(\i\su(i=1,n, )(xi-\x\t(x))2 \i\su(i=1,n, )(yi-\x\t(y))2))
参考数据: eq \x\t(x) =33, eq \x\t(y) =6, eq \x\t(z) =8, eq \i\su(i=1,8, ) (xi- eq \x\t(x) )2=244, eq \i\su(i=1,8, ) (yi- eq \x\t(y) )2≈3.6, eq \i\su(i=1,8, ) (zi- eq \x\t(z) )2=5.4, eq \i\su(i=1,8, ) (xi- eq \x\t(x) )(yi- eq \x\t(y) )=28.3,
eq \i\su(i=1,8, ) (xi- eq \x\t(x) )(zi- eq \x\t(z) )=35.4, eq \r(244) ≈15.6, eq \r(3.6) ≈1.9, eq \r(5.4) ≈2.3.
【综合突破拔高】
题20.对于线性相关系数r,叙述正确的是( )
A.|r|∈(0,+∞),|r|越大相关程度越大,反之相关程度越小
B.r∈(-∞,+∞),r越大相关程度越大,反之相关程度越小
C.|r|≤1,且|r|越接近1相关程度越大,|r|越接近0,相关程度越小
D.以上说法都不对
题21.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:
则该商品销售额与平均气温有( )
A.确定性关系 B.正相关关系
C.负相关关系 D.函数关系
题22.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如表,对应散点图如图所示:
根据以上信息,则下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则可以判断出甲同学的物理成绩一定比乙同学的物理成绩高;
④从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则不能判断出甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数是( )
A.1 B.2 C.3 D.4
题23.(多选题)研究与试验发展(R&D)是科技活动的核心指标,是衡量一个国家和地区科技发展水平的主要指标,同时也是反映企业自主创新能力的指标.我国一直以来都在大力促进科技创新,R&D经费支出增速保持世界领先.如图是我国近五年(2016-2020年)R&D经费支出统计图,则下列说法中正确的是( )
A.近五年,R&D经费支出与年份呈现正相关关系
B.近五年,R&D经费支出的中位数为19 678
C.2020年,R&D经费支出相对于2016年增长超过50%
D.2020年,R&D经费支出增长速度最快
题24.如下四个散点图中,正相关的是________,负相关的是________.
题25.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中是相关关系的为________.
题26.如图所示的五组数据(x,y)中,去掉________后,剩下的四组数据相关性增强.
题27.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数.r2表示变量V与U之间的线性相关系数,则r1,r2,0的大小关系为________.
题28.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如表所示:
判断含碳量与冶炼时间的相关关系的强弱.
题29.商务部会同海关总署、国家药监局于3月31日发布关于有序开展医疗物资出口的公告.如医疗物资出口中出现质量问题,将认真调查,发现一起,查处一起,切实维护“中国制造”的形象,更好地发挥医疗物资对支持全球疫情防控的重要作用.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
经计算得 eq \x\t(x) = eq \f(1,16) eq \i\su(i=1,16,x) i=9.97,s= eq \r(\f(1,16)\i\su(i=1,16, )(xi-\x\t(x))2) = eq \r(\f(1,16)(\i\su(i=1,16,x) eq \\al(\s\up1(2),\s\d1(i)) -16\x\t(x)2)) ≈0.212, eq \r(\i\su(i=1,16, )(i-8.5)2) ≈18.439, eq \i\su(i=1,16,x) eq \\al(\s\up1(2),\s\d1(i)) ≈1 591.137, eq \i\su(i=1,16, ) (xi- eq \x\t(x) )(i-8.5)=-2.78,其中xi为抽取的第i个医疗物资的尺寸,i=1,2,3,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检医疗物资中,如果出现了尺寸在( eq \x\t(x) -3s, eq \x\t(x) +3s)之外的医疗物资,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=
eq \f(\i\su(i=1,16, )(xi-\x\t(x))(yi-\x\t(y)),\r(\i\su(i=1,16, )(xi-\x\t(x))2)\r(\i\su(i=1,16, )(yi-\x\t(y))2)) .
编号031 §9.1.1 变量的相关性
目标要求
1、结合实例,了解样本相关系数的统计含义.
2、结合实例,了解样本相关系数与标准化数据向量夹角的关系.
3、结合实例,会通过相关系数比较多组成对数据的相关性.
学科素养目标
本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.
在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.
重点难点
重点:借助概率分布直方图的几何直观,了解正态分布的特征;
难点:正态分布的均值、标准差、方差及其含义.
教学过程
基础知识点
1.变量的相关关系
(1)两个变量的关系
(2)散点图:建立平面直角坐标系.将样本中的数据构成的点在坐标系内标出得到的统计图.
(3)线性相关关系:散点落在一条直线附近,则称这两个变量具有线性相关关系.
(4)正相关与负相关
2.相关系数
(1)样本相关系数r的计算公式
我们可以利用相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为r=___ eq \f(\i\su(i=1,n, )(xi-\x\t(x))(yi-\x\t(y)),\r(\i\su(i=1,n, )(xi-\x\t(x))2\i\su(i=1,n, )(yi-\x\t(y))2)) ___ .
(2)样本相关系数r的性质
①-1≤r≤1;
②r>0时y与x呈正相关关系,r<0时y与x呈负相关关系;
③|r|越接近1,y与x相关的程度就越强,|r|越接近0,y与x相关的程度就越弱;
通常情况下,当|r|>0.5时,认为线性相关关系显著;当|r|<0.3时,认为几乎没有线性相关关系.
【课前小题演练】
题1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )
A.变量x与y正相关,u与v正相关
B.变量x与y正相关,u与v负相关
C.变量x与y负相关,u与v正相关
D.变量x与y负相关,u与v负相关
【解析】选C.由题图象知,变量x与y呈负相关关系;u与v呈正相关关系.
题2.下列两个变量间的关系不是函数关系的是( )
A.圆的半径与周长
B.角的度数与它的正切值
C.单产为常数时,土地面积与粮食总产量
D.日照时间与水稻的单位产量
【解析】选D.函数关系与相关关系都是指两个变量之间的关系,但是这两种关系是不同的,函数关系是指当自变量一定时,函数值是确定的,是一种确定性的关系.因为A项C=2πr,B项y=tan α,C项y=ax(a>0,且a为常数),所以这三项均是函数关系.D项是相关关系.
题3.对于给定的两个变量的统计数据,下列说法正确的是( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似地表示两者的关系
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
【解析】选C.给出一组样本数据,总可以作出相应的散点图,故C正确,但不一定能分析出两个变量的关系,故A不正确,更不一定符合线性相关,故B不正确,两个变量的统计数据不一定有函数关系,故D不正确.
题4.对两个变量x,y的几组观测数据统计如表,则这两个相关变量的关系是( )
A.负相关 B.正相关
C.先正后负相关 D.先负后正相关
【解析】选A.根据两个变量x,y的几组观测数据统计表知,y随x的增大而减小,所以这两个相关变量负相关.
题5.变量x,y的散点图如图所示,那么x,y之间的样本相关系数r最接近的值为( )
A.1 B.-0.5 C.0 D.0.5
【解析】选C.根据变量x,y的散点图,得x,y之间的样本相关关系非常不明显,所以相关系数r最接近的值应为0.
题6.下列反映两个变量的相关关系中,不同于其他三个的是( )
A.名师出高徒 B.水涨船高
C.月明星稀 D.登高望远
【解析】选C.由题意,A,B,D具有因果关系,C没有因果关系.
题7.现随机抽取了某校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如表:
请问:这10名学生的两次数学考试成绩是否具有显著的线性相关关系?
【解析】 eq \x\t(x) = eq \f(1,10) (120+108+…+99+108)=107.8,
eq \x\t(y) = eq \f(1,10) (84+64+…+57+71)=68,
eq \i\su(i=1,10,x) eq \\al(\s\up1(2),\s\d1(i)) =1202+1082+…+992+1082=116 584,
eq \i\su(i=1,10,y) eq \\al(\s\up1(2),\s\d1(i)) =842+642+…+572+712=47 384,
eq \i\su(i=1,10,x) iyi=120×84+108×64+…+108×71=73 796,
所以,相关系数为
r= eq \f(73 796-10×107.8×68,\r((116 584-10×107.82)(47 384-10×682))) ≈0.750 6,
故两次数学考试成绩有显著的线性相关关系.
【当堂巩固训练】
题8.某统计部门对四组数据进行统计分析后,获得如图所示的散点图,关于相关系数的比较,其中正确的是( )
A.r4<r2<0<r1<r3 B.r2<r4<0<r1<r3
C.r2<r4<0<r3<r1 D.r4<r2<0<r3<r1
【解析】选C.根据散点图的特征,数据大致呈增长趋势的是正相关,数据呈递减趋势的是负相关;数据越集中在一条线附近,说明相关性越强,由题中数据可知:(1)(3)为正相关,(2)(4)为负相关;
故r1>0,r3>0;r2<0,r4<0;又(1)与(2)中散点图更接近于一条直线,故r1>r3,r2<r4,因此,r2<r4<0<r3<r1.
题9.已知x,y是两个变量,下列四个散点图中,x,y呈负相关趋势的是( )
【解析】选C.对于A,散点图中的点从左向右是上升的,且在一条直线附近,是正相关关系;对于B,散点图中的点没有明显的相关关系;对于C,散点图中的点从左向右是下降的,且在一条直线附近,是负相关关系;对于D,散点图中的点没有明显的相关关系.
题10.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额成正比例函数关系
B.利润率与人均销售额成反比例函数关系
C.利润率与人均销售额成正相关关系
D.利润率与人均销售额成负相关关系
【解析】选C.根据题意,画出利润率与人均销售额的散点图,如图所示:
由散点图知,利润率与人均销售额成正相关关系.
题11.对两个变量x,y进行线性相关检验,得线性相关系数r1=0.785 9,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.956 8,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
【解析】选C.由线性相关系数r1=0.785 9>0知x与y正相关,由线性相关系数r2=-0.956 8<0知u,v负相关,又|r1|<|r2|,所以变量u与v的线性相关性比x与y的线性相关性强.
题12.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=- eq \f(1,5) x+1上,则这组样本数据的样本相关系数为( )
A.-1 B.1
C.- eq \f(1,5) D. eq \f(1,5)
【解析】选A.因为这组样本数据的所有样本点(xi,yi)(i=1,2,…,n)都在直线y=- eq \f(1,5) x+1上,
所以这组样本数据完全相关,其相关系数是-1.
题13.在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )
A.y=- eq \f(1,2) x-1 B.y=x-1
C.y=x+1 D.y=-x2
【解析】选A.若这组样本数据的相关系数为-1,则样本数据为线性相关,排除D,又相关系数为-1,所以样本数据为负相关,排除B,C(B,C为正相关).
题14.(多选题)下列关系中,属于相关关系的是( )
A.正方形的边长与面积之间的关系
B.农作物的产量与施肥量之间的关系
C.人的身高与年龄之间的关系
D.降雪量与交通事故的发生率之间的关系
【解析】选BD.在A中正方形的边长与面积之间的关系是函数关系;在B中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在C中,人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系;在D中,降雪量与交通事故的发生率之间具有相关关系.
题15.(多选题)以下各对变量成正相关的是( )
A.学生的学籍号与学生的数学成绩
B.坚持每天吃早餐的人数与患胃病的人数
C.气温与冷饮销售量
D.电瓶车的重量和行驶每千米的耗电量
【解析】选CD.对于A,学生的学籍号与学生的数学成绩没有相关关系;对于B,一般情况下,坚持每天吃早餐的人数与患胃病的人数成负相关关系;对于C,一般情况下,气温与冷饮销售量成正相关关系;对于D,一般情况下,电瓶车的重量和行驶每千米的耗电量成正相关关系.
题16.下列两个变量之间具有相关关系的是________.(填序号)
①正方形的边长a和面积S;
②一个人的身高h和右手一拃长x;
③真空中的自由落体运动其下落的距离h和下落的时间t;
④一个人的身高h和体重x.
【解析】对于①,正方形的边长a和面积S是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h和右手一拃长x是正相关关系;对于③,真空中的自由落体运动其下落的距离h和下落的时间t是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h和他的体重x是正相关关系.
答案:②④
题17.下列说法中正确的是________(填序号).
①变量间的线性相关系数r的取值范围为[-1,1];
②变量间的线性相关系数r的绝对值越接近0,则变量间的线性相关程度越低;
③变量间的相关系数越小,变量间的相关程度越小.
【解析】根据题意,依次分析.对于①,相关系数r满足|r|≤1,即相关系数r的取值范围为[-1,1],①正确;
对于②,根据相关系数的性质知|r|≤1,且|r|越接近1,相关程度越大;|r|越接近0,相关程度越小,则②正确;
对于③,当r接近-1时,变量间的相关程度比r接近0时的大,故③错误.
答案:①②
题18.某厂的生产原料耗费x(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应关系:
x与Y之间是否具有线性相关关系?若有,判断相关性的强弱.
【解析】画出散点图如图所示,由图可知x,Y有线性关系.
eq \x\t(x) =5, eq \x\t(y) =47.5, eq \i\su(i=1,4,x) eq \\al(\s\up1(2),\s\d1(i)) =120, eq \i\su(i=1,4,y) eq \\al(\s\up1(2),\s\d1(i)) =9 900, eq \i\su(i=1,4,x) iyi=1 080,
r= eq \f(\i\su(i=1,4,x)iyi-4\x\t(x)\x\t(y),\r(\b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,4,x) eq \\al(\s\up1(2),\s\d1(i)) -4\x\t(x)2))\b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,4,y) eq \\al(\s\up1(2),\s\d1(i)) -4\x\t(y)2))))
= eq \f(1 080-4×5×47.5,\r((120-4×52)(9 900-4×47.52))) ≈0.982 7.
故x与Y之间具有很强的正相关关系.
题19.为分析肥胖程度对总胆固醇与空腹血糖的影响,在肥胖人群中随机抽出8人,他们的肥胖指数BMI值、总胆固醇TC指标值(单位:mml/L)、空腹血糖CLU指标值(单位:mml/L)如表所示.
用变量y与x,z与x的相关系数,分别说明TC指标值与BMI值、CLU指标值与BMI值的相关程度;
参考公式:
相关系数r= eq \f(\i\su(i=1,n, )(xi-\x\t(x))(yi-\x\t(y)),\r(\i\su(i=1,n, )(xi-\x\t(x))2 \i\su(i=1,n, )(yi-\x\t(y))2))
参考数据: eq \x\t(x) =33, eq \x\t(y) =6, eq \x\t(z) =8, eq \i\su(i=1,8, ) (xi- eq \x\t(x) )2=244, eq \i\su(i=1,8, ) (yi- eq \x\t(y) )2≈3.6, eq \i\su(i=1,8, ) (zi- eq \x\t(z) )2=5.4, eq \i\su(i=1,8, ) (xi- eq \x\t(x) )(yi- eq \x\t(y) )=28.3,
eq \i\su(i=1,8, ) (xi- eq \x\t(x) )(zi- eq \x\t(z) )=35.4, eq \r(244) ≈15.6, eq \r(3.6) ≈1.9, eq \r(5.4) ≈2.3.
【解析】变量y与x的相关系数r≈ eq \f(28.3,15.6×1.9) ≈0.95,
变量z与x的相关系数r′≈ eq \f(35.4,15.6×2.3) ≈0.99,可以看出TC指标值与BMI值、CLU指标值与BMI值都是高度正相关.
【综合突破拔高】
题20.对于线性相关系数r,叙述正确的是( )
A.|r|∈(0,+∞),|r|越大相关程度越大,反之相关程度越小
B.r∈(-∞,+∞),r越大相关程度越大,反之相关程度越小
C.|r|≤1,且|r|越接近1相关程度越大,|r|越接近0,相关程度越小
D.以上说法都不对
【解析】选C.用相关系数r可以衡量两个变量之间的相关关系的强弱,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值接近于0时,表示两个变量之间几乎不存在相关关系.
题21.有人收集了春节期间平均气温x与某取暖商品销售额y的有关数据如表:
则该商品销售额与平均气温有( )
A.确定性关系 B.正相关关系
C.负相关关系 D.函数关系
【解析】选C.由表中数据可知:y随x的减小而增大,是负相关关系.
题22.已知某次考试之后,班主任从全班同学中随机抽取一个容量为8的样本,他们的数学、物理成绩(单位:分)对应如表,对应散点图如图所示:
根据以上信息,则下列结论:
①根据散点图,可以判断数学成绩与物理成绩具有线性相关关系;
②根据散点图,可以判断数学成绩与物理成绩具有一次函数关系;
③从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则可以判断出甲同学的物理成绩一定比乙同学的物理成绩高;
④从全班随机抽取2名同学(记为甲、乙),若甲同学的数学成绩为80分,乙同学的数学成绩为60分,则不能判断出甲同学的物理成绩一定比乙同学的物理成绩高.
其中正确的个数是( )
A.1 B.2 C.3 D.4
【解析】选B.由散点图知两变量间是线性相关关系,非函数关系,所以①正确,②错误;
利用概率知识进行预测,得到的结论有一定的随机性,所以③错误,④正确;所以正确结论的个数为2.
题23.(多选题)研究与试验发展(R&D)是科技活动的核心指标,是衡量一个国家和地区科技发展水平的主要指标,同时也是反映企业自主创新能力的指标.我国一直以来都在大力促进科技创新,R&D经费支出增速保持世界领先.如图是我国近五年(2016-2020年)R&D经费支出统计图,则下列说法中正确的是( )
A.近五年,R&D经费支出与年份呈现正相关关系
B.近五年,R&D经费支出的中位数为19 678
C.2020年,R&D经费支出相对于2016年增长超过50%
D.2020年,R&D经费支出增长速度最快
【解析】选ABC.对于A选项,近五年,R&D经费支出与年份呈现正相关关系,A选项正确;
对于B选项,近五年,R&D经费支出的中位数为19 678,B选项正确;
对于C选项,因为 eq \f(24 426,15 677) ≈1.56,即2020年R&D经费支出相对于2016年增长超过50%,C选项正确;
对于D选项,2016-2017年, eq \f(17 606,15 677) ≈1.123,2017-2018年, eq \f(19 678,17 606) ≈1.118,2018-2019年, eq \f(22 144,19 678) ≈1.125,2019-2020年, eq \f(24 426,22 144) ≈1.103,D选项错误.
题24.如下四个散点图中,正相关的是________,负相关的是________.
【解析】对于(1),散点图中的点从左向右是上升的,且在一条直线附近,是正相关;
对于(2),散点图中的点从左向右是下降的,且在一条直线附近,是负相关;
对于(3),(4),散点图中的点不成带状分布,没有明显的相关关系.
答案:(1) (2)
题25.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其横断面直径与高度之间的关系,其中是相关关系的为________.
【解析】对于①,一般地,人的年龄与他(她)拥有的财富是一种相关关系;
对于②,曲线上的点与该点的坐标,是一种确定的对应关系,不是相关关系;
对于③,苹果的产量与气候之间的关系,是一种相关关系;
对于④,森林中的同一种树木,其横断面直径与高度之间的关系,是相关关系.
答案:①③④
题26.如图所示的五组数据(x,y)中,去掉________后,剩下的四组数据相关性增强.
【解析】去掉点(4,10)后,其余四点大致在一条直线附近,相关性增强.
答案:(4,10)
题27.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数.r2表示变量V与U之间的线性相关系数,则r1,r2,0的大小关系为________.
【解析】对于变量X与Y而言,Y随X的增大而增大,故变量Y与X正相关,即r1>0;对于变量U与V而言,V随U的增大而减小,故变量V与U负相关,即r2<0.故r2<0<r1.
答案:r2<0<r1
题28.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如表所示:
判断含碳量与冶炼时间的相关关系的强弱.
【解析】由已知数据列成下表.
于是r= eq \f(\i\su(i=1,10,x)iyi-10\x\t(x)\x\t(y),\r(\b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,10,x) eq \\al(\s\up1(2),\s\d1(i)) -10\x\t(x)2))\b\lc\(\rc\)(\a\vs4\al\c1(\i\su(i=1,10,y) eq \\al(\s\up1(2),\s\d1(i)) -10\x\t(y)2)))) ≈0.990 6.y与x具有很强的线性相关关系.
题29.商务部会同海关总署、国家药监局于3月31日发布关于有序开展医疗物资出口的公告.如医疗物资出口中出现质量问题,将认真调查,发现一起,查处一起,切实维护“中国制造”的形象,更好地发挥医疗物资对支持全球疫情防控的重要作用.为了监控某种医疗物资的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:
经计算得 eq \x\t(x) = eq \f(1,16) eq \i\su(i=1,16,x) i=9.97,s= eq \r(\f(1,16)\i\su(i=1,16, )(xi-\x\t(x))2) = eq \r(\f(1,16)(\i\su(i=1,16,x) eq \\al(\s\up1(2),\s\d1(i)) -16\x\t(x)2)) ≈0.212, eq \r(\i\su(i=1,16, )(i-8.5)2) ≈18.439, eq \i\su(i=1,16,x) eq \\al(\s\up1(2),\s\d1(i)) ≈1 591.137, eq \i\su(i=1,16, ) (xi- eq \x\t(x) )(i-8.5)=-2.78,其中xi为抽取的第i个医疗物资的尺寸,i=1,2,3,…,16.
(1)求(xi,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小).
(2)一天内抽检医疗物资中,如果出现了尺寸在( eq \x\t(x) -3s, eq \x\t(x) +3s)之外的医疗物资,就认为这条生产线在这一天的生产过程中可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?
附:样本(xi,yi)(i=1,2,…,n)的相关系数r=
eq \f(\i\su(i=1,16, )(xi-\x\t(x))(yi-\x\t(y)),\r(\i\su(i=1,16, )(xi-\x\t(x))2)\r(\i\su(i=1,16, )(yi-\x\t(y))2)) .
【解析】(1)由样本数据得(x,i)(i=1,2,3,…,16)的相关系数为
r= eq \f(\i\su(i=1,16, )(xi-\x\t(x))(i-8.5),\r(\i\su(i=1,16, )(xi-\x\t(x))2)\r(\i\su(i=1,16, )(i-8.5)2)) = eq \f(-2.78,0.212×\r(16)×18.439)
≈-0.18;
由于|r|<0.25,因此可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小.
(2)由于 eq \x\t(x) =9.97,s≈0.212,
由样本数据可以看出抽取的第13个零件的尺寸在( eq \x\t(x) -3s, eq \x\t(x) +3s)以外,因此需对当天的生产过程进行检查.
分类
函数关系
相关关系
特征
两个变量有_______关系
两个变量之间具有一定的联系,但又没有_________函数关系
正相关
负相关
具有相关关系的两个变量的散点图呈_________________方向发展的趋势
具有相关关系的两个变量的散点图呈_________________方向发展的趋势
x
10
9
8
7
6
5
y
2
3
3.5
4
4.8
5
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
x
2
4
6
8
Y
30
40
50
70
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
CLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
平均气温(℃)
-2
-3
-5
-6
销售额(万元)
20
23
27
30
学生编号
1
2
3
4
5
6
7
8
数学成绩
60
65
70
75
80
85
90
95
物理成绩
72
77
80
84
88
90
93
95
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
抽取次数
1
2
3
4
5
6
7
8
医疗物
资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物
资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
分类
函数关系
相关关系
特征
两个变量有确定的关系
两个变量之间具有一定的联系,但又没有确定性函数关系
正相关
负相关
具有相关关系的两个变量的散点图呈从左下向右上方向发展的趋势
具有相关关系的两个变量的散点图呈从左上向右下方向发展的趋势
x
10
9
8
7
6
5
y
2
3
3.5
4
4.8
5
学生号
1
2
3
4
5
6
7
8
9
10
x
120
108
117
104
103
110
104
105
99
108
y
84
64
84
68
69
68
69
46
57
71
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
x
2
4
6
8
Y
30
40
50
70
人员编号
1
2
3
4
5
6
7
8
BMI值x
25
27
30
32
33
35
40
42
TC指标值y
5.3
5.4
5.5
5.6
5.7
6.5
6.9
7.1
CLU指标值z
6.7
7.2
7.3
8.0
8.1
8.6
9.0
9.1
平均气温(℃)
-2
-3
-5
-6
销售额(万元)
20
23
27
30
学生编号
1
2
3
4
5
6
7
8
数学成绩
60
65
70
75
80
85
90
95
物理成绩
72
77
80
84
88
90
93
95
x(0.01%)
104
180
190
177
147
134
150
191
204
121
y(min)
100
200
210
185
155
135
170
205
235
125
i
1
2
3
4
5
6
7
8
9
10
xi
104
180
190
177
147
134
150
191
204
121
yi
100
200
210
185
155
135
170
205
235
125
xiyi
10 400
36 000
39 900
32 745
22 785
18 090
25 500
39 155
47 940
15 125
eq \x\t(x) =159.8, eq \x\t(y) =172,
eq \i\su(i=1,10,x) eq \\al(\s\up1(2),\s\d1(i)) =265 448, eq \i\su(i=1,10,y) eq \\al(\s\up1(2),\s\d1(i)) =312 350, eq \i\su(i=1,10,x) iyi=287 640
抽取次数
1
2
3
4
5
6
7
8
医疗物
资尺寸
9.95
10.12
9.96
9.96
10.01
9.92
9.98
10.04
抽取次数
9
10
11
12
13
14
15
16
医疗物
资尺寸
10.26
9.91
10.13
10.02
9.22
10.04
10.05
9.95
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析学案: 这是一份高中数学苏教版 (2019)选择性必修第二册<a href="/sx/tb_c4009183_t4/?tag_id=42" target="_blank">9.1线性回归分析学案</a>,共30页。学案主要包含了课前小题演练,当堂巩固训练,综合突破拔高等内容,欢迎下载使用。
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析学案设计: 这是一份高中数学苏教版 (2019)选择性必修第二册<a href="/sx/tb_c4009183_t4/?tag_id=42" target="_blank">9.1线性回归分析学案设计</a>,共4页。
高中数学苏教版 (2019)选择性必修第二册9.1线性回归分析导学案: 这是一份高中数学苏教版 (2019)选择性必修第二册<a href="/sx/tb_c4009183_t4/?tag_id=42" target="_blank">9.1线性回归分析导学案</a>,文件包含912线性回归方程原卷版docx、912线性回归方程解析版docx等2份学案配套教学资源,其中学案共47页, 欢迎下载使用。