所属成套资源:2021届新课改地区高三数学一轮专题复习知识及练习
第62讲 统计案例与线性回归分析-2021届新课改地区高三数学一轮专题复习
展开
第62讲:统计案例与线性回归分析
一、 课程标准
1、 会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系.
2、 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3、了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度.
二、 基础知识回顾
1. 变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散布在左上角到右下角的区域内,两个变量的这种相关关系为负相关.
2. 两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做回归直线.
(2)回归方程为y^=b^x+a^_,其中其中a^,b^是待定参数,(yi-bxi-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.
(4)相关系数:
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
3. 独立性检验
(1)2×2列联表
设X,Y为两个变量,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)如下:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(2)独立性检验
利用随机变量K2(也可表示为χ2)的观测值k=(其中n=a+b+
c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.
常用结论
(1)求解回归方程的关键是确定回归系数a^,b^,应充分利用回归直线过样本中心点 (x-,y-).
(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有关的把握越大.
(3)根据回归方程计算的b^值,仅是一个预报值,不是真实发生的值.
三、 自主热身、归纳总结
1、根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为y=bx+a,则( )
A. a>0,b>0 B. a>0,b