终身会员
搜索
    上传资料 赚现金
    立即下载
    加入资料篮
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件01
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件02
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件03
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件04
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件05
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件06
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件07
    5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件08
    还剩15页未读, 继续阅读
    下载需要25学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.3 数据的分析本节综合与测试评优课课件ppt

    展开
    这是一份粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.3 数据的分析本节综合与测试评优课课件ppt,共23页。PPT课件主要包含了31特征探索,32关联分析,2寻找关联规则,33聚类分析,34数据分类等内容,欢迎下载使用。

    数据分析就是在一大批 杂乱无章的数据中,运用数字化工具和技术,探索数据内在的结构和规律,构建数学模型,并进行可视化表达,通过验证将模型转化为知识,为诊断过去、预测未来发挥作用。数据分析一般包括特征探索、 关联分析、聚类与分类、建立模型和模型评价等。
    数据特征探索的主要任务是对数据进行预处理,发现和处理缺失值,异常数据,绘制直方图,观察分析数据的分布特征,求最大值、最小值、极差等描述性统计量。
    探究活动打开并运行配套学习资源包“第五章\课本素材\程序5-3数据预处理”,观察数据预处理结果。程序5-3数据预处理的关键过程及部分程序段如下:(1)数据清洗,发现缺失值。
    (2)异常值处理中,利用画散点图发现异常值部分。(3)求最大值和最小值。
    (4)求极差(5)求组距。
    (6)绘制价格直方图。(7)绘制评论数直方图。
    关联分析就是分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。关联分析的基本算法如下:(1)扫描历史数据,并对每项数据进行频率次数统计。(2)构建候选项集C1,并计算其支持度,即数据出现顿事次数与总数的比。(3)对候选项集的支持度进行筛选,筛选的数据项支持度应当不小于最小支持度。从而形成顿繁项集么L1。(4) 对频繁项集L2进行连接生成候选项集C2.重复上述步骤,最终形成频繁人项集或者最大频繁项集。
    观察打开并运行教科书配套学习资源包“第五章\课本素村\程序5-4关联分析”,观察程序的运行结果。程序5-4关联分析的关键过程及程序段如下:(1)自定又连接函教,用于实现L_{k-1}到C_k的连接。
    ( 3)创建连接数据。(4)遍历可能的推理。
    (5)计算置信度序列。(6)置信度师选。
    聚类分析是一种探索性的分析, 在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析的算法有很多,其中K平均(K-Means )算法是一种经典的白下而 上的聚类分析方法。K- 平均算法的基本思想就是在空间N个点中,初始选择K个点作为中心聚类点,然后将N个点分别与K个点计算距离,选择自己最近的点作为自己的中心点,再不断更新中心聚集点,以达到“物以类聚,人以群分”的效果,如图5- 10所示。
    聚类分析的基本算法如下:(1)从数据点集合中随机选择K个点作为初始的聚集中心,每个中心点代表着每个聚集中心的平均值。(2) 对其余的每个数据点,依次判断其与K个中心点的距离, 距离最近的表明它属于这项聚类。(3)重新计算新的聚族集合的平均值即中心点。整个过程不断这代计算,直到达到预先设定的造代次数或中心点不再顿繁波动。
    实践打开并运行教科书配套学习资源包“第五章\课本素材\程序5-5聚类分析”文件,观察程序的运行结果。程序5-5直接调用了Pythn语言的sklearn机器学习模块,其对数据进行聚类分析的关键程序段如下:
    数据分类是数据分析处理中最基本的方法。数据分类通常的做法是,基于样本数据先训练构建分类函数或者分类模型(也称为分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。数据分类和回归分析都可用于预测,预测是指从基于样本数据记录,根据分类准则自动给出对未知数据的推广描述,从而实现对未知数据进行预测。贝叶斯分类技术在众多分类技术中占有重要地位, 也属于统计学分类的范畴,是一种非规则的分类方法。贝叶斯分类技术通过对已分类的样本子集进行训练,学习归结出分类函数(对离散变量的预测称作分类,对连续变量的分类称为回归),利用调练得到的分类器实现对未分类数据的分类。
    问题如表5-4所示是某网络商城客户购物行为特征的一组统计资料。已知某客户购物行为特征A为数值182.8,特征B为数值58.9,特征C为数值26,请问这人是重要客户还是普通客户?
    根据表5-4的资料,得到一个已分类的样本集:X=[[182.8,81.6,30],[180.4,86.1,29],[170.0,77.1,30],[180.4,74.8,28],[152.4,45.3,24],[167.6,68.0,26],[165.2,58.9,25],[175.2,]和Y=[1,1,1,1,0,0,0,0] ( 1代表重要客户,0代表普通客户)。打开教科书配套学习资源包“第五章\课本素材\程序5-6”文件,把已分类的样本子集(X,Y )和测试样本[182.8,58.9,26]输入到程序5-6中,具体(高斯朴素贝叶斯)如下:
    运行程序5-6后,得到结果为:[0]。由此可以判断这人为普通客户。程序5-6使用语句frm sklearn.naive_bayes imprt GaussianNB调用了sklearn.naive_bayes模块,使得程序简单明了。
    拓展:贝叶斯与概率分类贝叶斯( Thmas Bayes,1701—1761),英国数学家,发明了概率统计学原理,将归纳推理法用于概率论基础理论,创立了贝叶斯统计理论,对统计决策函数、统计推断、统计的估算等做出了贡献。在概率统计理论中,条件概率是指事件A在另外一个事件B已经发生条件下的发生概率,表示为P(A |B),读作“在B的条件下A的概率”。贝叶斯发现在事件B出现的前提下事件A出现的概率,等于事件A出现的前提下事件B出现的概率乘以事件A出现的概率再除以事件B出现的概率。这就是著名的贝叶斯定理。具体计算公式为:
    运用贝叶斯定理对事物进行分类,是一种非常有效的思维方法,是贝叶斯决策理论方法的基本思想。例如,假设有一个数据集,由两类组成,且已知每个样本的分类,数据分布如图5-11所示。用p,(x,y)表示数据点(x,y)属于红色一类的概率,用pa(x,y)表示数据点(x,y)属于蓝色一类的概率。
    那么如何判断对于一个新的点C(x,y)属于红色还是蓝色类别呢?通常人们会按以下步骤解答这个问题:( 1)求新的点C(x,y)属于红色一类的概率p;(x,y)。(2)求新的点C(x,y)属于蓝色一类的概率pz(x,y)。(3)选择概率高的一类作为新点C(x,y)的分类。即如果p;(x,y)>pz(x,y),则C(x,y)为红色一类;如果p(x,y)
    相关课件

    高中信息技术粤教版 (2019)必修1 数据与计算第五章 数据处理和可视化表达5.3 数据的分析5.3.1 特征探索完美版ppt课件: 这是一份高中信息技术粤教版 (2019)必修1 数据与计算<a href="/xx/tb_c4007099_t3/?tag_id=26" target="_blank">第五章 数据处理和可视化表达5.3 数据的分析5.3.1 特征探索完美版ppt课件</a>,共17页。PPT课件主要包含了数据的分析,特征探索,关联分析,聚类分析,聚类分析介绍,数据分类等内容,欢迎下载使用。

    高中粤教版 (2019)1.2.2 编码的基本方式背景图ppt课件: 这是一份高中粤教版 (2019)1.2.2 编码的基本方式背景图ppt课件,文件包含53数据的分析-新教材粤教版2019高中信息技术必修一课课件28pptx、53数据的分析-新教材粤教版2019高中信息技术必修一课练习docx等2份课件配套教学资源,其中PPT共28页, 欢迎下载使用。

    高中粤教版 (2019)5.3.1 特征探索优质课件ppt: 这是一份高中粤教版 (2019)5.3.1 特征探索优质课件ppt,共18页。PPT课件主要包含了学习目标,重难点,课堂导入,项目实施等内容,欢迎下载使用。

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        使用学贝下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        5.3 数据的分析【新教材】粤教版(2019)高中信息技术必修一 课件
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map