2024全国一轮数学(基础版)第46讲 第3课时 残差分析与决定系数课件PPT
展开例1 为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表所示.
(1) 作出散点图并求经验回归方程;
【解答】 散点图如图所示.
(2) 进行残差分析;
由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力呈线性关系.
刻画回归效果的方式:(1) 残差图法:作图时纵坐标为残差,横坐标可以选为样本编号或身高数据或体重估计值等,这样作出的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2022·淄博模拟)随机选取变量x和变量Y的5对观测数据,选取的第i(i=1,2,3,4,5)对观测数据记为(xi,yi),其数值对应如下表所示:
(1) 求变量x和变量Y的样本相关系数(小数点后保留4位),判断这两个变量是正相关还是负相关,并推断它们的线性相关程度.
所以这两个变量负相关,且具有较强的线性相关性.
例2 全球化时代,中国企业靠什么在激烈的竞争中成为世界一流企业呢?由人民日报社指导,《中国经济周刊》主办的第十八届中国经济论坛在人民日报社举行,就中国企业如何提升全球行业竞争力进行了研讨.数据显示,某企业近年加大了科技研发资金的投入,其科技投入x (单位:百万元)与收益y (单位:百万元)的数据统计如下表:
根据数据特点,甲认为样本点分布在指数型曲线y=2bx+a的周围,据此他对数据进行了一些初步处理如下表所示.
【解答】 由①知,甲建立的回归模型拟合效果更好.设20.3x+3.7≥100,解得0.3x+3.7≥lg2100=2+2lg25,解得x≥9.7,所以科技投入的费用至少要9.7百万元,该企业的收益才能达到1亿元.
②由①所得的结论,计算该企业欲使收益达到1亿元,科技投入的费用至少要多少百万元?(精确到0.1)参考数据:lg25≈2.3.
R2表示解释变量对于响应变量变化的贡献率. R2越接近于1,表示拟合的效果越好.
现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:
(3) 通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润应该为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.
1. (多选)下列选项中正确的是( )A. 经验回归分析中,R2的值越大,说明残差平方和越小B. 若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1C. 经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法D. 画残差图时,纵坐标为残差,横坐标一定是编号
点击对应数字即可跳转到对应题目
【解析】 对于A,经验回归分析中,R2的值越大,说明模型的拟合效果越好,则残差平方和越小,A正确;对于B,若一组观测数据(x1,y1),(x2,y2),…,(xn,yn)满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2=1,B正确;对于C,经验回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,C正确; 对于D,残差图中横坐标可以是样本编号,也可以是身高数据,还可以是体重的估计值等,D错误.
2. 某医疗机构使用中西医结合方法治疗某疾病后,每周治愈的患者人数如下表所示:
3. (2022·遂宁模拟)如图,在一组样本数据A(2,2),B(4,3),C(6,4),D(8,7),E(10,6)的散点图中,若去掉D(8,7)后,则下列说法正确的为( )A. 样本相关系数r变小B. 残差平方和变大C. 决定系数R2变小D. 自变量x与因变量y的相关程度变强
【解析】 从散点图分析可知,只有D点偏离直线较远,去掉D点后,x与y的线性相关程度变强,所以相关系数r变大,决定系数R2变大,残差平方和变小.
4. (多选)如图所示是某地某小区2019年12月至2020年12月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码1~13分别对应2019年12月~2020年12月)
【解析】 由散点图可知,y随x的增加而增加,故A错误;
2024全国一轮数学(基础版)第46讲 第2课时 非线性回归模型与曲线拟合课件PPT: 这是一份2024全国一轮数学(基础版)第46讲 第2课时 非线性回归模型与曲线拟合课件PPT,共28页。PPT课件主要包含了研题型·融会贯通,举题说法,随堂内化等内容,欢迎下载使用。
2024全国一轮数学(基础版)第46讲 第1课时 变量的相关关系及线性回归模型课件PPT: 这是一份2024全国一轮数学(基础版)第46讲 第1课时 变量的相关关系及线性回归模型课件PPT,共39页。PPT课件主要包含了链教材·夯基固本,激活思维,基础回归,研题型·融会贯通,举题说法,随堂内化等内容,欢迎下载使用。
2024全国一轮数学(基础版)第44讲 第3课时 圆锥曲线中的定值与定点问题课件PPT: 这是一份2024全国一轮数学(基础版)第44讲 第3课时 圆锥曲线中的定值与定点问题课件PPT,共16页。PPT课件主要包含了研题型·融会贯通,举题说法,随堂内化等内容,欢迎下载使用。