《高考总复习》数学 第九章 第6讲 回归分析与独立性检验[配套课件]
展开
这是一份《高考总复习》数学 第九章 第6讲 回归分析与独立性检验[配套课件],共57页。PPT课件主要包含了变量间的关系,回归分析,常用方法,2线性相关关系,样本点的中心,负相关,5相关指数,独立性检验,×2列联表,3独立性检验等内容,欢迎下载使用。
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.
(2)将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.
(3)正相关、负相关.
①在散点图中,点散布在从左下角到右上角的区域,两个
变量的这种相关关系称为正相关.
②在散点图中,点散布在从左上角到右下角的区域,两个
变量的这种相关关系称为负相关.
(1)定义:对具有相关关系的两个变量进行统计分析的一种
观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
(4)线性相关强度的检验
②当 r>0 时,表明两个变量正相关;
当 r0.75 时,认为两个变量有很强的线性相关性.
R2 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2 表示解释变量对于预报变量变化的贡献率,R2 越接近于 1,表示回归的效果越好.
(1)分类变量:变量的不同“值”表示个体所属的不同类
别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为 2×2 列联表)为
n=______________为样本容量.
利用随机变量 K2 来判断“两个分类变量有关系”的方法称为独立性检验.
1.(多选题)下列叙述正确的是(
解析:相关关系不是确定性关系,当两个变量线性相关时,一般可分为正相关和负相关,所以 A 不正确;回归直线一定过
样本点的中心 所以 B 正确;在回归分析中,相关系
数越大,两个变量的相关性越强,所以 R2 为 0.98 的模型比 R2为 0.80 的模型拟合的效果好,所以 C 正确;某同学研究卖出的热饮杯数 y 与气温度数 x 的关系时,预测可卖出 142 杯热饮,而不是一定卖出 142 杯热饮,所以 D 不正确.故选 BC.
解析:因为变量 x 和 y 正相关,则回归直线的斜率为正,故可以排除选项 C 和 D.因为样本点的中心在回归直线上,把点(3,3.5)分别代入选项 A 和 B 中的直线方程进行检验,可以排除B.故选 A.
3.(2016 年重庆)已知变量 x,y 的取值如下表所示:
4.(2020 年全国Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:℃)的关系,在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到散点图 9-6-1:
由此散点图,在 10 ℃至 40 ℃之间,下面四个回归方程类
型中最适宜作为发芽率 y 和温度 x 的回归方程类型的是(
A.y=a+bxC.y=a+bex
B.y=a+bx2D.y=a+bln x
解析:由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率 y 和温度 x 的回归方程类型的是 y=a+bln x.故选 D.答案:D
相关关系的判断 自主练习
1.已知 x 与 y 之间的几组数据如下表:
2.根据如下样本数据:
解析:依题意,画散点图,如图 D100,两个变量负相关,
(3)由于各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样先将植物覆盖面积按优中差分成三层,在各层内按比例抽取样本,在每层内用简单随机抽样法抽取样本即可.
(2)回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间是否有相关关系,如果有,就找出它们之间的数学表达式;②根据一组观察值,预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.
【考法全练】5G 网络是一种先进的高频传输技术,我国的 5G 技术发展迅速,已位居世界前列.某公司 2019 年 8 月初推出了一款 5G 手机,现调查得到该款 5G 手机上市时间 x 和市场占有率 y 的几组相关对应数据.如图 9-6-2 所示的折线图中,横轴 1 代表 2019 年8 月,2 代表 2019 年 9 月…,5 代表 2019 年 12 月,根据数据并预测该款手机市场占有率的变化趋势,则最早何时该款 5G
手机市场占有率能超过 0.5%(精确到月)(
A.2020 年 6 月C.2020 年 8 月
B.2020 年 7 月D.2020 年 9 月
[例 2](2020 年新高考Ⅰ)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了 100 天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:
(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2
浓度不超过 150”的概率;
(2)根据所给数据,完成下面的 2×2 列联表:
(3)根据(2)中的列联表,判断是否有 99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?
解:(1)由表格可知,该市 100 天中,空气中的 PM2.5 浓度不超过 75,且 SO2 浓度不超过 150 的天数有 32+6+18+8=64天,所以该市一天中,空气中的 PM2.5 浓度不超过 75,且 SO2
浓度不超过 150 的概率为
(2)由所给数据,可得 2×2 列联表为
(3)根据 2×2 列联表中的数据可得
因此根据临界值表可知,有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO2 浓度有关.
【题后反思】解决独立性检验问题的一般步骤:①制作列联表;
要精确到小数点后三位;③查表得出结论,要选择满足条件P(K2>k0)=α的k0作为绝域的临界值.
(2019 年全国Ⅰ)某商场为提高服务质量,随机调查了 50 名男顾客和 50 名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有 95%的把握认为男、女顾客对该商场服务的评价有差异?
[例 3](2015 年全国Ⅰ)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销售量 y(单位:t)和年利润 z(单位:千元)的影响,对近 8 年的宣传费 xi 和年销售量yi(i=1,2,…,8)数据作了初步处理,得到下面的散点图9-6-3 及一些统计量的值.
作为年销售量 y 关于年宣传费 x 的回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立 y 关于 x 的回归方
(3)已知这种产品的年利润 z 与 x,y 的关系为 z=0.2y-x,
根据(2)的结果回答下列问题:
①当年宣传费 x=49 时,年销售量及年利润的预报值是多
【策略指导】判断两个变量是否线性相关及相关程度通常有两种方法:①利用散点图直观判断;②将相关数据代入相关系数 r 公式求出 r,然后根据 r 的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.
【高分训练】(多选题)某同学参加社会实践活动,随机调查了某小区 5个家庭的年可支配收入 x(单位:万元)与年家庭消费 y(单位:万元)的数据,制作了如下对照表:
A.若某户年可支配收入为 4 万元时,则年家庭消费约为
B.若某户年可支配收入为 4 万元时,则年家庭消费约为
C.若年可支配收入增加 1 万元,则年家庭消费相应平均增
D.若年可支配收入增加 1 万元,则年家庭消费相应平均增
因为 =0.5x+0.1,
所以若年可支配收入增加 1 万元,则年家庭消费相应平均
所以选项 C 正确,选项 D 错误.故选 BC.
2.回归分析是处理变量相关关系的一种数学方法.主要解决:①确定特定量之间是否有相关关系,如果有,就找出它们之间的数学表达式;②根据一组观察值,预测变量的取值及判断变量取值的变化趋势;③求出回归直线方程.
相关课件
这是一份《高考总复习》数学 第九章 第11讲 条件概率与正态分布[配套课件],共51页。PPT课件主要包含了正态分布,分布越集中,x=μ,PABPA,为事件,题组一,走出误区,图9-11-1,答案AD,题组二等内容,欢迎下载使用。
这是一份《高考总复习》数学 第九章 第8讲 二项式定理[配套课件],共40页。
这是一份《高考总复习》数学 第九章 第5讲 用样本估计总体[配套课件],共56页。PPT课件主要包含了用样本估计总体,频率组距,3茎叶图,据的众数,最中间,平均数,题组一,走出误区,列说法中正确的是,答案ABC等内容,欢迎下载使用。