所属成套资源:高考数学科学创新复习方案提升版学案(Word版附解析)
高考数学科学创新复习方案提升版第57讲成对数据的统计分析学案(Word版附解析)
展开
这是一份高考数学科学创新复习方案提升版第57讲成对数据的统计分析学案(Word版附解析),共38页。
1.相关关系
两个变量有关系,但没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.
2.相关关系的分类
(1)按变量间的增减性分为eq \x(\s\up1(01))正相关和eq \x(\s\up1(02))负相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现eq \x(\s\up1(03))增加的趋势.
②负相关:当一个变量的值增加时,另一个变量的相应值呈现eq \x(\s\up1(04))减少的趋势.
(2)按变量间是否有线性特征分为eq \x(\s\up1(05))线性相关或eq \x(\s\up1(06))非线性相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在eq \x(\s\up1(07))一条直线附近,我们就称这两个变量线性相关.
②非线性相关或曲线相关:如果两个变量具有相关性,但不是eq \x(\s\up1(08))线性相关,我们就称这两个变量非线性相关或曲线相关.
3.相关关系的刻画
(1)散点图:为了直观描述成对样本数据的特征,把每对成对数据都用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
(2)样本相关系数
①我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,其中r=
eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2)\r(\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)).
②样本相关系数r的取值范围为eq \x(\s\up1(09))[-1,1].
当r>0时,成对样本数据eq \x(\s\up1(10))正相关;当r6.635,∴根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,∴A错误,D正确;∵m+36=90,18+n=60,∴m=54,n=42,∴B正确,C错误.
5.某产品的广告费用x与销售额y的统计数据如下表:
根据上表可得经验回归方程eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))中的eq \(b,\s\up6(^))为9.4,据此模型预测广告费用为6万元时销售额约为________万元.
答案 65.5
解析 由表可得eq \(x,\s\up6(-))=eq \f(4+2+3+5,4)=3.5,eq \(y,\s\up6(-))=eq \f(49+26+39+54,4)=42,因为点(3.5,42)在经验回归直线eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))上,且eq \(b,\s\up6(^))=9.4,所以42=9.4×3.5+eq \(a,\s\up6(^)),解得eq \(a,\s\up6(^))=9.1.故经验回归方程为eq \(y,\s\up6(^))=9.4x+9.1.令x=6,得eq \(y,\s\up6(^))=65.5.故预测广告费用为6万元时销售额约为65.5万元.
多角度探究突破
角度相关关系的判断
例1 (1)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额成正相关关系
B.利润率与人均销售额成负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
答案 A
解析 由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C,D;其属于正相关关系,A正确,B错误.故选A.
(2)在以下4幅散点图中,图________中的y和x之间存在相关关系(将正确答案的序号填在横线上).
答案 ②③④
解析 图②③中的点成带状区域分布在某一直线附近,④中的点分布在某一曲线附近,故②③④存在相关关系.
角度相关系数的计算及意义
例2 (1)(多选)某同学将收集到的六对数据制作成散点图如右,得到其经验回归方程为l1:eq \(y,\s\up6(^))=0.68x+eq \(a,\s\up6(^)),计算其相关系数为r1,决定系数为Req \\al(2,1).经过分析确定点F为“离群点”,把它去掉后,再利用剩下的五对数据计算得到经验回归方程为l2:eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+0.68,相关系数为r2,决定系数为Req \\al(2,2).下列结论正确的是( )
A.r2>r1>0 B.Req \\al(2,1)>Req \\al(2,2)
C.0<eq \(b,\s\up6(^))<0.68 D.eq \(b,\s\up6(^))>0.68
答案 AC
解析 由图可知两变量呈正相关,故r1>0,r2>0,去掉“离群点”后,相关性更强,所以r1<r2,故Req \\al(2,1)<Req \\al(2,2),故A正确,B错误;根据图象,当去掉F点后,直线基本在A,B,C,D,E附近的那条直线上,直线的倾斜程度会略向x轴偏向,故斜率会变小,因此0<eq \(b,\s\up6(^))<0.68,故C正确,D错误.故选AC.
(2)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得eq \(∑,\s\up10(20),\s\d8(i=1))xi=60,eq \(∑,\s\up10(20),\s\d8(i=1))yi=1200,eq \(∑,\s\up10(20),\s\d8(i=1)) (xi-eq \(x,\s\up6(-)))2=80,eq \(∑,\s\up10(20),\s\d8(i=1)) (yi-eq \(y,\s\up6(-)))2=9000,eq \(∑,\s\up10(20),\s\d8(i=1)) (xi-eq \(x,\s\up6(-)))(yi-eq \(y,\s\up6(-)))=800.
①求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
②求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01).
附:相关系数r=eq \f(\(∑,\s\up10(n),\s\d8(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up10(n),\s\d8(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up10(n),\s\d8(i=1)) (yi-\(y,\s\up6(-)))2)),eq \r(2)≈1.414.
解 ①每个样区野生动物数量的平均数为eq \f(1,20)eq \(∑,\s\up10(20),\s\d8(i=1))yi=eq \f(1,20)×1200=60,地块数为200,所以该地区这种野生动物数量的估计值为200×60=12000.
②样本(xi,yi)的相关系数为
r=eq \f(\(∑,\s\up6(20),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(20),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(20),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2))=eq \f(800,\r(80×9000))=eq \f(2\r(2),3)≈0.94.
判定两个变量相关性的方法
1.(2024·蓟州开学考试)对两个变量x,y进行线性相关检验,得线性相关系数r1=0.8995,对两个变量u,v进行线性相关检验,得线性相关系数r2=-0.9568,则下列判断正确的是( )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强
答案 C
解析 因为线性相关系数r1=0.8995>0,所以x,y正相关,因为线性相关系数r2=-0.95680 B.eq \(a,\s\up6(^))>0,eq \(b,\s\up6(^))Req \\al(2,乙)=0.893.
∴甲建立的回归模型拟合效果更好.
②由①知,甲建立的回归模型拟合效果更好.
由20.3x+3.8≥256,得0.3x+3.8≥lg2256=8,解得x≥14.
∴科技投入的费用至少要14百万元,该企业的收益才能达到2.56亿元.X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
甲
乙
丙
丁
r
0.82
0.78
0.69
0.85
m
106
115
124
103
阅读量
幸福感
合计
强
弱
多
m
18
72
少
36
n
78
合计
90
60
150
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
考向一 两个变量的相关性
月份
1
2
3
4
5
6
人均销售额
6
5
8
3
4
7
利润率(%)
12.6
10.4
18.5
3.0
8.1
16.3
画散点图
若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关
样本相关系数
当r>0时,正相关;当r0时,正相关;当eq \(b,\s\up6(^))
相关学案
这是一份高考数学科学创新复习方案提升版第51讲双曲线(一)学案(Word版附解析),共22页。
这是一份高考数学科学创新复习方案提升版第52讲双曲线(二)学案(Word版附解析),共26页。
这是一份高考数学科学创新复习方案提升版第53讲抛物线(一)学案(Word版附解析),共17页。