所属成套资源:电子工业社版信息技术第五册课件+教案+素材
初中信息技术电子工业社版(2022)第五册2.2 预测——回归算法获奖课件ppt
展开这是一份初中信息技术电子工业社版(2022)第五册2.2 预测——回归算法获奖课件ppt,文件包含22回归算法pptx、22回归算法doc、导入视频mp4等3份课件配套教学资源,其中PPT共32页, 欢迎下载使用。
1、信息意识:能够理解信息技术回归算法的重要性,并能识别各类信息资源的特点和可靠性。2、计算思维:能运用计算思维的方法和策略来解决问题,包括分析问题、设计算法和评估解决方案。3、数字化学习与创新:能熟练使用计算机软件和工具,例如搜索引擎、数据挖掘工具等,进行信息检索和整理。4、信息社会责任:能理解信息技术对社会的影响,包括隐私保护、信息安全等方面的问题。
马宁最近在研究遗传因素对人的身高的影响,他了解到,一般个子特别高的父亲的儿子会比父亲矮一些,个子特别矮的父亲的儿子会比父亲高一些。孩子不会不断地更高或更矮,而更倾向于家族中同性别人群的平均身高。更高或更矮的趋势不会一直持续下去,而会回到某个中心,这种现象就是回归。
蓝点:个体身高红线:平均身高
AI 技术正日益成为预测的新帮手。回归是监督学习的一个重要问题,回归用于预测输入变量和输出变量之间的关系,常见的回归算法有线性回归、非线性回归等。回归算法可以用来解决生活中的很多问题,如预测电影票房走势、人口增长趋势、商品价格与销售量的关系、居民的支出与收入的关系等。
学校为了促进同学们运动,要组织一次路线长6千米的“健步走,励志行”活动,小艾同学想要预测自己多长时间可以走完6 千米,你可以帮助他吗?
2.请根据1.表中数据在下图中描点,并尝试画出一条趋势图。
3.分析人的步幅与其身高存在怎样的关系。一般年轻人快走一分钟可以走130步,请你预测健步走6千米所需的时间。
答:取步幅平均值65cm,那么一分钟走130步则130*65=8450cm,也就是一分钟走84.5m6千米=6000m,那么用6000/84.5=71.006分钟。
回归是研究因变量对自变量的依赖关系的一种统计分析方法,目的是通过给定值来估计或预测因变量的均值。回归研究的是因变量和自变量之间的关系,可以用于发现变量之间的因果关系,也可以用于预测。利用人工智能做预测的方法有很多,常见的有线性回归、非线性回归等。
在众多数据中,如果能找出一条直线,较为准确地代表已有数据的走向,准确地描述数据之间的关系,这就是线性回归。按照自变量的多少,可分为一元线性回归和多元线性回归。如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,那么这种回归被称为一元线性回归。验证欧姆定律的实验根据采集的数据计算电阻值,探究电流、电压、电阻之间的关系。同学们可以根据若干组测量得到的电流、电压数据,绘制出表示电流、电压之间关系的散点图。
通过观察散点图,我们发现数据样本点呈条状分布,随着流过待测电阻的电流增大,电压也不断升高,可以用一条直线近似地表示它们之间的关系。自变量电流用x表示,因变量电压用y表示,那么表示电流与电压变化关系的这条近似直线 (称为回归直线) 可以用y=kx+b表示,其中k为回归系数,b为截距。回归系数的绝对值越大,表示x对y的影响越大,若回归系数为正,表示y随x的增大而增大: 若回归系数为负,表示y随x的增大而减小; 若回归系数为零,表示回归直线与x轴平行。
根据已知电流推算电压的过程就是运用线性回归原理进行预测的过程,有了这个关系。在自变量已知的情况下,就能很容易地推算出因变量的数值。由于实验中往往存在传感器误差、电磁干扰等许多干扰因素,研究这组数据时,你可能会发现当自变量的取值一定时,因变量的取值也会有波动。
多元线性回归主要研究一个因变量与多个自变量之间的相关关系,与一元线性回归的原理类似,区别在于影响因素(自变量)多一些。例如,影响产品单位成本的变量不仅有产量,还包括原材料价格、劳动力价格,劳动效率及废品率等因素。对这种多变量模型的分析,就是多元线性回归分析。如图所示。
在实际应用中,两个变量之间并不总呈线性关系,对这种类型现象的分析和预测一般要应用非线性回归预测。例如,药物在体内的浓度与时间的关系是非线性的,如图所示。
活动2找出更准确的预测线
国家统计局组织调查,采集居民收入、支出、家庭经营和生产投资状况等数据,数据采集完成后,使用统一的方法进行数据处理,然后将数据传输至国家统计局进行统一汇总、计算。调查到的居民可支配收入和居民消费支出数据在一定程度上可以反映居民的生活水平。
依据居民人均可支配收入累计值和居民人均消费支出累计值,绘制散点图,可以发现,根据散点图中的数据点能画出多条直线,如图所示。根据不同的直线,由居民人均可支配收入累计值预测出的居民人均消费支出累计值是不同的。
估计值和实际值越接近,就表示估计值越准确
注意:手动计算误差和误差平方和,容易出错并且效率不高,可以借助Excel中的求和函数SUM计算多个数的和,或借助求平方和函数SUMSO计算多个数的平方和。
经过计算,误差平方和最小的线可以较准确地表示居民人均可支配收入累计值和居民人均消费支出累计值的关系。
估计值和实际值之间的差称为误差,为了求得能准确体现自变量和因变量之间关系的直线,需要用最小二乘法求出哪条直线更接近实际值。最小二乘法(又称最小平方法)是一种数学优化方法,它通过寻找各个数据点的误差平方和的最小值来确定最佳的模型,使得估计值和实际值更为接近。为什么要用各个数据点的误差平方和,而非简单地用误差求和呢?这是因为估计值可能大于也可能小于实际值,从而分别产生正误差或负误差。误差的和可能会因为正负相消而变小,而并非因为模型好。如图所示,蓝点是实际值,黄点为估计值,绿线是线性模型,红线显示了估计值和实际值之间的误差。
思考并讨论线性回归算法在市场营销和广告效果评估中如何使用?
通过将广告费用、推广活动等作为自变量,销售额或消费者参与度作为因变量,线性回归模型能够帮助确定哪些因素对销售或参与度有最大影响。
根据国家统计局提供的信息,在 2004 年到2018 年的15 年间,我国生活垃圾清运量增加了 7000 万余吨,年末总人口增加了近1亿人,如表所示。结合本节知识,尝试探索生活垃圾清运量和年末总人口的关系,并使用线性回归算法分析预测当年末总人口增长为 140000 万人时生活垃圾清运量的值。
预测结果:当年末总人口增长为 140000 万人时生活垃圾清运量的值为____________?
1.常见的人工智能回归算法可以分为( )和( )。
2.如果一个自变量和一个因变量之间的关系可以用一条直线近似表示,这种回归被称为( )。3.通过寻找各个数据的误差平方和最小值来确定最佳的模型,使得估计值和实际值更为接近的方法是( )。
答案:1、传统回归算法和机器学习回归算法 2、线性回归 3、最小二乘法
4.举出生活中可以用线性回归算法进行预测的实例。许多变量之间存在着相互依存、相互制约、相互影响的关系生活中还有哪些变量之间存在线性关系,可以用线性回归算法进行预测?请举例说明并填写下表。
消费支出与收入之间的关系
回归算法在信息技术领域具有广泛的应用,但适合的算法取决于问题的特性和数据的分布。了解不同回归算法的原理和特点,结合实际情况选择合适的算法,并进行合理的数据预处理和模型评估,可以提高回归模型的预测性能和可解释性 。
相关课件
这是一份电子工业社版(2022)第三册第3单元 物联网的关键技术3.2 标识与定位技术评优课ppt课件,文件包含32标识与定位技术课件pptx、32标识与定位技术教案doc、RFID电子标签技术与条码技术有何区别mp4等3份课件配套教学资源,其中PPT共42页, 欢迎下载使用。
这是一份初中电子工业社版(2022)第2单元 物联网的基本原理2.2 制作简易噪声监测系统模型优秀ppt课件,文件包含22制作简易噪声检测系统模型课件pptx、22制作简易噪声检测系统模型教案doc、引入视频mp4等3份课件配套教学资源,其中PPT共46页, 欢迎下载使用。
这是一份初中信息技术电子工业社版(2022)第三册2.1 物联网的组成优质课件ppt,文件包含21物联网的组成课件pptx、21物联网的组成教案doc、导入视频mp4等3份课件配套教学资源,其中PPT共48页, 欢迎下载使用。