2025高考数学一轮知识必备练习第九章概率与统计9.2成对数据的统计分析
展开1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
4.针对实际问题,会用一元线性回归模型进行预测.
5.通过实例,理解列联表的统计意义.
6.通过实例,了解列联表独立性检验及其应用.
必备知识 温故知新
【教材梳理】
1.成对数据的统计相关性
(1)变量的相关关系.
①相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
②散点图:将样本中个数据点描在平面直角坐标系中得到的统计图叫做散点图.
③正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.
④线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关.如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.
(2)样本相关系数.
①样本相关系数的计算公式.
.
我们称为变量和变量的样本相关系数.
与标准化数据向量夹角的关系
令,,
其中,,则.
则 ,故 .
③样本相关系数的性质:当 时,称成对样本数据正相关;当 时,称成对样本数据负相关.当越接近于1时,成对样本数据的线性相关程度越强;当越接近于0时,成对样本数据的线性相关程度越弱.当时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
2.一元线性回归模型及其应用
(1)一元线性回归模型.
我们称上式为关于的一元线性回归模型.其中,称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.如果 ,那么与之间的关系就可用一元线性函数模型来描述.
(2)一元线性回归模型参数的最小二乘估计.
设满足一元线性回归模型的两个变量的对样本数据为,, ,,当,的取值为时,达到最小.
我们把称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做,的最小二乘估计.
(3)回归分析.
①残差:对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.
②刻画回归效果的方式:一是残差图法,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高;二是残差平方和法,称为残差平方和,残差平方和越小,模型的拟合效果越好;三是用决定系数比较,,越大,模型的拟合效果越好,越小,模型的拟合效果越差.
3.列联表与独立性检验
(1)分类变量与列联表.
①分类变量:为了表述的方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)列联表:一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(也称为列联表)为
(3)独立性检验.
计算公式.
,
其中.
②临界值的定义.对于任何小概率值 ,可以找到相应的正实数 ,使得 成立,我们称 为 的临界值,概率值 越小,临界值越大.
③独立性检验.,通常称为零假设或原假设.基于小概率值 的检验规则是:
当 时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过 ;
当 时,我们没有充分证据推断不成立,可以认为和独立.
这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.
④临界值表.
自主评价 牛刀小试
1. 判断下列命题是否正确,正确的在括号内画“√”,错误的画“×”.
(1) “名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √ )
(2) 经验回归直线一定过成对样本数据的中心点,且中心相同的样本点的经验回归方程一定相同.( × )
(3) 两个变量的样本相关系数越小,它们的相关性越弱.( × )
(4) 独立性检验适用于普查数据.( × )
(5) 在一元线性回归模型中,决定系数越接近1,表示回归的效果越好.( √ )
2. 为研究混凝土的抗震强度与抗压强度的关系,某研究部门得到下表的样本数据:
若与线性相关,且线性回归方程为,则( A )
A. 9.1B. 8.9C. D.
解:由题意,得,,所以,解得.故选.
3. (教材题改编)在利用独立性检验来判断两个分类变量与之间是否有关系时,下列说法正确的是( B )
A. 越大,“与有关系”的可信程度越小
B. 越小,“与有关系”的可信程度越小
C. 越接近于0,“与没有关系”的可信程度越小
D. 越大,“与没有关系”的可信程度越大
解:根据独立性检验的思想,知 越小,变量有关系的可信程度越小,故 正确.故选.
4. (教材题改编)下面是列联表:
则表中,的值分别为52,74.
解:因为,所以.又,所以74.故填52;74.
合计
合计
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
140
150
170
180
195
23
24
26
28
28
合计
21
73
22
25
47
合计
46
120
2025高考数学一轮考点突破训练第九章概率与统计9.2成对数据的统计分析: 这是一份2025高考数学一轮考点突破训练第九章概率与统计9.2成对数据的统计分析,共12页。试卷主要包含了成对数据的统计相关性,一元线性回归模型及其应用,独立性检验等内容,欢迎下载使用。
2025高考数学一轮知识必备练习第九章概率与统计9.5随机事件与概率: 这是一份2025高考数学一轮知识必备练习第九章概率与统计9.5随机事件与概率,共4页。试卷主要包含了结合具体事例,会用频率估计概率,频率与概率等内容,欢迎下载使用。
2025高考数学一轮知识必备练习第九章概率与统计9.9正态分布: 这是一份2025高考数学一轮知识必备练习第九章概率与统计9.9正态分布,共3页。试卷主要包含了 原则,正态分布的均值与方差等内容,欢迎下载使用。