终身会员
搜索
    上传资料 赚现金
    立即下载
    加入资料篮
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件01
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件02
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件03
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件04
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件05
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件06
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件07
    4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件08
    还剩20页未读, 继续阅读
    下载需要20学贝 1学贝=0.1元
    使用下载券免费下载
    加入资料篮
    立即下载

    高中信息技术浙教版 (2019)必修1 数据与计算4.2 大数据处理教课内容ppt课件

    展开
    这是一份高中信息技术浙教版 (2019)必修1 数据与计算4.2 大数据处理教课内容ppt课件,共28页。PPT课件主要包含了大数据的魅力,什么是分治思想,大数据处理类型,批处理计算,Hadoop是什么,流计算,图计算,练一练,想一想等内容,欢迎下载使用。

    1、理解Hadp的组成和功能2、掌握大数据处理类型
    未来,已发生改变…… 大数据的关键技术
    大数据,或称海量数据,指所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合合并后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、避免疾病扩散、打击犯罪、测定实时交通路况或判定研究质量等。
    顾客一次购买商品 1面包、黄油、尿布、牛奶 2咖啡、糖、小甜饼、鲑鱼 3面包、黄油、咖啡、尿布、牛奶、鸡蛋 4面包、黄油、鲑鱼、鸡 5鸡蛋、面包、黄油 6鲑鱼、尿布、牛奶 7面包、茶叶、糖、鸡蛋 8咖啡、糖、鸡、鸡蛋 9面包、尿布、牛奶、盐10茶叶、鸡蛋、小甜饼、尿布、牛奶经关联分析,可发现顾客经常同时购买的商品:尿布牛奶
    分--将问题分解为规模更小的子问题治--将规模更小的子问题逐个击破合--将已解决的子问题合并,最终得出原问题的解
    正如“不同的锁需要不同的钥匙”企业中不同的应用场景数据不同的计算模式,需要使用不同的大数据技术
    不同的计算模式需要使用不同的产品
    设想:硬盘读取速度永远满足要求!
    你发现:目前的硬盘容量是1T,速度100MB/s要把现在的硬盘数据刷一遍,要两个多小时,太可怕了。而Hadp就是一个并行处理海量数据的工具。
    Hadp 诞生于大搜索应用
    Dug Cutting
    MapReduce | GFS | BigTable
    是一个可运行于大规模计算机集群上的分布式系统基础架构,适用于静态数据批处理计算。方便用户便捷处理海量数据。目前Yah!(雅虎)是最主要的贡献者。
    国内外那些企业用Hadp?
    数据仓库,商业智能 (facebk,twitter,淘宝,京东,暴风,新浪,58同城,移动大云)互联网广告计算 (亿赞普,科捷,各类大互联网企业)大搜索引擎项目 (Yah,国产盘古,人民搜索)站内搜索引擎项目 (Ebay,支付宝)内容推荐引擎 (人人,新浪微博,优酷)病毒分析,垃圾邮件识别(Yah,趋势科技,360)云计算服务项目 (亚马逊云,阿里云)地图项目 (月球表面探测地图)科研项目 (欧洲量子对撞机)金融项目 (股票分析,阿里金融)
    分布式文件系统HDFS
    分布式数据库HBase
    分布式并行计算模型MapReduce
    以流式数据访问模式存储超大文件而设计的文件系统。思想:一次写入,多次读取最高效HDFS不需要运行在昂贵并且高可靠的硬件上。比如:云盘、网盘
    高可靠,高性能,可伸缩,分布式的列式数据库是谷歌BigTable数据库的开源实现。
    分布式并行计算模型 MapReduce
    处理海量数据,(>1TB)由Map(映射)和Reduce(归纳)组成自动实现分布式并行计算计算分配到大量机器上
    流计算可以简单、高效、可靠地实现实时数据的获取、传输和存储。
    主要流计算软件:IBM InfSphere Streams(捕获和分析动态数据)Twitter Strm(推特风暴)Yah!S4(雅虎分布式流计算)淘宝Facebk PumaHern
    ·近年来,在Web应用、网络监控、传感监测等领域,兴起了一种新的数据密集型应用——流数据,即数据以大量、快速、时变的流形式持续到达
    现实中的数据大多以图的形式呈现,或者转换为图以后再进行分析
    社交网络数据转换成图结构
    四、实时处理于批处理的整合
    平台的整合缩短了批处理与流处理之间的切换延时时间,有利于减少系统的开销,降低使用成本。
    1.下列关于流数据的描述不正确的是(   ) A.数据在处理时已经采集完成 B.数据价值随着时间的流逝降低 C.实时分析流数据可以得到更有价值的结果 D.可以采用流计算进行实时分析
    2.下列关于Hadp架构的描述正确的是(  ) A.是一个对大数据进行聚合式处理的基础软件框架 B.不能运行于大规模计算机集群上 C.采用NTFS文件系统管理数据文件 D.采用MapReduce编程模型处理大规模数据集
    3.下列软件主要用于进行流计算的有(  ) A.Hadp B.Strm C.Pregel D.Spark
    4.实时处理与批处理整合的优势有(  ) ①可以在同一个平台做批处理计算和流计算 ②缩短了批处理计算和流计算之间的切换延时 ③有利于降低使用成本 ④增加了系统开销 A.①②③ B.①②④ C.②③④ D.①③④
    5.(开放题)试述应用“分治”思想,从日志数据文件(大数据集)中提取出某日访问百度次数最多的IP的基本思路。
    把整个日志大数据文件映射为若干个(如1000个)小文件,再对每个小文中出现的IP进行频率统计,找出频率大的部分及其频率。然后再汇总1000个小文件的处理结果,从中找出频率最大的IP。
    6.(开放题)上网查找Hadp 处理大数据的应用实例,制作演示文稿并向同学介绍。
    建议:学生分组,明确分工,然后使用搜索引擎查找Hadp处理大数据的应用实例,甄选后制作成演示文稿,展示交流。展示交流可以采用面对面方式、微视频方式等。
    相关课件

    信息技术必修1 数据与计算4.2 大数据处理说课课件ppt: 这是一份信息技术必修1 数据与计算4.2 大数据处理说课课件ppt,共25页。PPT课件主要包含了批处理计算,拓展链接等内容,欢迎下载使用。

    综合总复习-浙教版(2019)高中信息技术必修第一册课件: 这是一份高中浙教版 (2019)本册综合复习课件ppt,共60页。PPT课件主要包含了P26,ABCD等内容,欢迎下载使用。

    高中信息技术浙教版 (2019)必修1 数据与计算4.3 大数据典型应用课堂教学ppt课件: 这是一份高中信息技术浙教版 (2019)必修1 数据与计算4.3 大数据典型应用课堂教学ppt课件,共32页。PPT课件主要包含了文本处理数据,文本处理的一般过程,1标签云,文本数据分析与应用,2文本情感分析,数据可视化,什么是数据可视化,可视化的作用,实时分析数据,可视化的基本方法等内容,欢迎下载使用。

    • 精品推荐
    • 所属专辑

    免费资料下载额度不足,请先充值

    每充值一元即可获得5份免费资料下载额度

    今日免费资料下载份数已用完,请明天再来。

    充值学贝或者加入云校通,全网资料任意下。

    提示

    您所在的“深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载 10 份资料 (今日还可下载 0 份),请取消部分资料后重试或选择从个人账户扣费下载。

    您所在的“深深圳市第一中学”云校通为试用账号,试用账号每位老师每日最多可下载10份资料,您的当日额度已用完,请明天再来,或选择从个人账户扣费下载。

    您所在的“深圳市第一中学”云校通余额已不足,请提醒校管理员续费或选择从个人账户扣费下载。

    重新选择
    明天再来
    个人账户下载
    下载确认
    您当前为教习网VIP用户,下载已享8.5折优惠
    您当前为云校通用户,下载免费
    下载需要:
    本次下载:免费
    账户余额:0 学贝
    首次下载后60天内可免费重复下载
    立即下载
    即将下载:资料
    资料售价:学贝 账户剩余:学贝
    选择教习网的4大理由
    • 更专业
      地区版本全覆盖, 同步最新教材, 公开课⾸选;1200+名校合作, 5600+⼀线名师供稿
    • 更丰富
      涵盖课件/教案/试卷/素材等各种教学资源;900万+优选资源 ⽇更新5000+
    • 更便捷
      课件/教案/试卷配套, 打包下载;手机/电脑随时随地浏览;⽆⽔印, 下载即可⽤
    • 真低价
      超⾼性价⽐, 让优质资源普惠更多师⽣
    VIP权益介绍
    • 充值学贝下载 本单免费 90%的用户选择
    • 扫码直接下载
    元开通VIP,立享充值加送10%学贝及全站85折下载
    您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      充值到账1学贝=0.1元
      0学贝
      本次充值学贝
      0学贝
      VIP充值赠送
      0学贝
      下载消耗
      0学贝
      资料原价
      100学贝
      VIP下载优惠
      0学贝
      0学贝
      下载后剩余学贝永久有效
      0学贝
      • 微信
      • 支付宝
      支付:¥
      元开通VIP,立享充值加送10%学贝及全站85折下载
      您当前为VIP用户,已享全站下载85折优惠,充值学贝可获10%赠送
      扫码支付0直接下载
      • 微信
      • 支付宝
      微信扫码支付
      充值学贝下载,立省60% 充值学贝下载,本次下载免费
        下载成功

        Ctrl + Shift + J 查看文件保存位置

        若下载不成功,可重新下载,或查看 资料下载帮助

        本资源来自成套资源

        更多精品资料

        正在打包资料,请稍候…

        预计需要约10秒钟,请勿关闭页面

        服务器繁忙,打包失败

        请联系右侧的在线客服解决

        单次下载文件已超2GB,请分批下载

        请单份下载或分批下载

        支付后60天内可免费重复下载

        我知道了
        正在提交订单

        欢迎来到教习网

        • 900万优选资源,让备课更轻松
        • 600万优选试题,支持自由组卷
        • 高质量可编辑,日均更新2000+
        • 百万教师选择,专业更值得信赖
        微信扫码注册
        qrcode
        二维码已过期
        刷新

        微信扫码,快速注册

        还可免费领教师专享福利「樊登读书VIP」

        手机号注册
        手机号码

        手机号格式错误

        手机验证码 获取验证码

        手机验证码已经成功发送,5分钟内有效

        设置密码

        6-20个字符,数字、字母或符号

        注册即视为同意教习网「注册协议」「隐私条款」
        QQ注册
        手机号注册
        微信注册

        注册成功

        下载确认

        下载需要:0 张下载券

        账户可用:0 张下载券

        立即下载
        账户可用下载券不足,请取消部分资料或者使用学贝继续下载 学贝支付

        如何免费获得下载券?

        加入教习网教师福利群,群内会不定期免费赠送下载券及各种教学资源, 立即入群

        即将下载

        4.2大数据处理-浙教版(2019)高中信息技术必修第一册课件
        该资料来自成套资源,打包下载更省心 该专辑正在参与特惠活动,低至4折起
        [共10份]
        浏览全套
          立即下载(共1份)
          返回
          顶部
          Baidu
          map