2021高三数学第一轮复习 导学案 第60讲 成对数据的统计分析(1)
展开第六十讲:成对数据的统计分析
【核心考点】
1、会做两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系。
2、了解最小二乘法的思想,能根据给出的线性回归方程(线性回归系数公式不要求记忆)。
3、了解回归分析的基本思想、方法及其简单应用。
4、了解独立性检验(只要求2*2列联表)的思想、方法及其初步应用。
【知识梳理】
1、回归分析:
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是 ;统计量有: 相关指数等。
从散点图看相关性:
正相关:样本点分布在从 的区域内;
负相关:样本点分布在从 的区域内。
从相关系数看相关性:
当时表明两个变量正相关;当时表明两个变量负相关;的绝对值越小,线性相关关系
;的绝对值越大,线性相关关系 ;
通常认为时具有较强的相关性。
从相关指数看相关性:
的值越大,说明残差平方和越小,也就是模型的拟合效果越好。在线性回归模型中,表示解释量对于预报变量变化的贡献率,越接近于1,表示回归的效果越好。
2、线性回归方程:
两个具有线性相关关系的变量的一组数据:,,…,其回归方程为,则
,其中是回归方程的 ,
是在轴上的截距。
3、独立性检验:
列联表,如图
| 总计 | ||
| |||
总计 |
|
统计量:
(其中为样本容量)
【学情自测】
1、某研究机构对高三学生的记忆力和判断力进行统计分析,所得数据如下表:
6 | 8 | 10 | 12 | |
2 | 3 | 5 | 6 |
则对的线性回归直线方程为( )
A、 B、
C、 D、
2、为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下列联表:
性别 | 理科 | 文科 |
男 | 13 | 10 |
女 | 7 | 20 |
已知
,
根据表中数据,得到的观测值:
,则认为选修文科与性别有关系出错的可能性为 。
3、某商品销售量(件)与销售价格(元/件)负相关,则其回归直线方程可能是( )
A、 B、
C、 D、
4、为考察某药物预防疾病的效果,对100只某动物进行试验,得到如下的列联表:
类别 | 患病 | 未患病 | 总计 |
服用药 | 10 | 40 | 50 |
没服用药 | 20 | 30 | 50 |
总计 | 30 | 70 | 100 |
经计算,统计量的观测值,则在犯错误的概率不超过 的前提下认为药物有效,已知独立性检验中统计量的临界值参考表为:( )
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
A、0.010 B、0.025
C、0.05 D、0.10
【典题分析】
题型1:相关关系的判断
例1:某公司在2017年上半年的收入(单位:万元)与月支出(单位:万元)的统计资料如表所示:
月份 | 1月份 | 2月份 | 3月份 | 4月份 | 5月份 | 6月份 |
收入 | 12.3 | 14.5 | 15.0 | 17.0 | 19.8 | 20.6 |
支出 | 5.63 | 5.73 | 5.82 | 5.89 | 6.11 | 6.18 |
根据统计资料,则( )
A、月收入的中位数是15,与有正线性相关关系
B、月收入的中位数是17,与有负线性相关关系
C、月收入的中位数是16,与有正线性相关关系
D、月收入的中位数是16,与有负线性相关关系
题型2:独立性检验
例2:某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数。(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主):
甲(50岁以下) |
| 乙(50岁以上) |
1
5 3 8
8 7 6 4 5 3 2 0 | 2 3 4 5 6 7 8 9 | 0 1 5 6 6 7 2 3 6 7 9 2 4 5 8 1 5 8
|
(1)根据以上数据完成下列列联表.
类别 | 主食蔬菜 | 主食肉类 | 总计 |
50岁以下 |
|
|
|
50岁以上 |
|
|
|
总计 |
|
|
|
(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关,并写出简要分析。
附:
0.050 | 0.010 | 0.001 | |
3.841 | 6.635 | 10.828 |
在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是( )
A、100个心脏病患者中至少有99人打鼾
B、1个人患心脏病,则这个人有99%的概率打鼾
C、100个心脏病患者中一定有打鼾的人
D、100个心脏病患者中可能一个打鼾的人都没有
题型3:线性回归方程的应用
下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图
(I)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;
(II)建立y关于t的回归方程(系数精确到0.01),预测2018年我国生活垃圾无害化处理量。
参考数据:,,,≈2.646.
参考公式:相关系数
回归方程 中斜率和截距的最小二乘估计公式分别为:
2024年高考数学重难点突破讲义:学案 第1讲 数据分析——成对数据的统计分析: 这是一份2024年高考数学重难点突破讲义:学案 第1讲 数据分析——成对数据的统计分析,共12页。
备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析: 这是一份备考2024届高考数学一轮复习讲义第九章统计与成对数据的统计分析第3讲成对数据的统计分析,共11页。
高考数学一轮复习第10章第3课时成对数据的统计分析学案: 这是一份高考数学一轮复习第10章第3课时成对数据的统计分析学案,共32页。