高中信息技术中图版 (2019)必修1 数据与计算3.3.1 数据分析优秀课件ppt
展开掌握常用的数据分析方法,能根据需要选择恰当的方法进行数据分析。了解数据可视化的形式,能选用合适的工具进行数据可视化表达与呈现。通过项目研究,感受数据分析和可视化表达对日常生活的影响。
为了解近年来我国水资源状况,访问国家统计局政府网站获得如图3.3.1所示的数据和图表。
图3.3.1 我国水资源部分数据指标呈现
1、利用该网站数据可视化功能,调整水资源数据指标和数据呈现方式,进一步分析不同类型图表所表达信息的异同。2、根据自己的需求,浏览网站栏目,了解相应的数据,并分析其中蕴含的信息。
通过数据分析,可以帮助我们更好地认识所调研事物的目前状况。例如,通过分析游客人数变化、旅游花费等数据,能够了解旅游业当前整体的发展状况,帮助旅游业经营者有针对性的调整经营策略,制订发展方案。
图3.3.2 我国国内旅游总分数据呈现
2、剖析事物的发展历程
通过数据分析,可以剖析事物的发展历程,了解事物的过去,揭示某些现象产生的原因。例如,分析全国27个主要城市近50年来月平均降水量和降水天数,再对比相关城市航班正常率的数据,可以发现航班正常率的走向与月降水量和天数呈相反方向变化的趋势。对航空公司、空中交通管理措施和天气等各方面大量历史数据的分析研究、可以帮助管理者找到影响航班正常运行的干扰因素,从而选择最佳的应对措施。
3、预测事物的未来走向 通过数据分析、可以预测事物未来可能会发生什么、推断未来的发展趋势、并为制订相应的目标及策略提供依据。目前利用数据分析进行预测已经应用于各个领域,包括体育赛事预测、用户行为预测、能源消耗预测、交通行为预测和人体健康预测等。例如,通过各个家庭安装的智能电表,对电力的使用状况进行监控,检测出用电模式,从而对用电需求做出预测。
1、对比分析法对比分析法也叫比较分析法,是将两个或两个以上的数据进行比较,分析它们的差异,揭示出这些数据所反映的事物规律的方法,是一种常用的分析方法。
图3.3.3 全国水资源开发利用综合对比
图3.3.4 中国创新能力指数数据
2、平均分析法平均分析法是运用计算平均数的方法来反映总体在一定时间、地点等条件下某一数量特征的一般水平。
图3.3.5 我国2012—2016年国内旅游人均消费情况
3、结构分析法 结构分析法也称构成分析法,是将各个部分与总体进行对比,是分析事物内部的结构和部分与整体之间关系的方法。
图3.3.6 使用不同无线网络访问某些网站的百分比
1.用电子表格软件进行数据分析 电子表格软件可对数据进行格式编辑、统计计算和囹表处理等。在电子表格软件中,通常用若干工作表存储数据。图3.3.7就是使用电子表格软件处理数据的示意图。
图3.3.7 电子表格软件处理数据的示意图
2.用在线数据分析平台进行数据分析 随着数据规模越来越大,应用范围越来越广,分析数据和挖掘数据价值的需求也越来越多,许多在线数据分析平台应运而生。这些平台集成了多种分析功能,提供了简单易用的交互界面,使得多种数据分析需求得以实现。
使用在线数据分析平台分析全国供水情况 登录国家统计局网站,查找全国供水数据,体验在线数据分析平台分析数据的过程和方法。1.注册账号并登录,熟悉国家统计局网站在线数据分析平台的使用方式;2.查找全国供水数据,根据平台的提示,尝试完成在线数据分析,查看并保存分析结果;3.分析该平台的数据分析功能,有哪些优缺点。 数据分析除了可以对数值型数据进行统计和描述以外、还可以对文本、图像等数据进行分析。常用的文本分析有字词频率统计、语句分词、句法分析、分类分析和情感分析等例如,对一段描述南水北调下程的文字进行文本分析后、得到的结果如图3.3.8所示。
在互联网浪潮的推动下、政府机构向信息化、网络化和智能化转变已成为一种趋势。中央和各级政府机构高度重视信息公开和数据发布,并在其官方网络平台为大众提供数据服务。例如,中华人民共和国国家统计局专门设立了国家数据网站,用于发布我国各级各类统计数据,如图3.3.9所示。国家数据网站不仅提供敏据的下载,还可以对数据进行在线处理,如编辑、计算和生成图表等。
图3.3.9 国家数据网站页面
3.使用编程工具进行数据分析
例1:编写程序统计分析南水北调中线工程各地区水资源情况。问题:分析南水北调中线工程各地区水资源数据,有助于了解我国水资源的分布情况。将采集并整理后的中线工程各地区水资源数据保存为“07-16nsbd-csv“文件、如图所示。编写程序,计算中线工程各地区2007一2016年水资源总量的平均值,并将结果保存到CSV文件中。
图 整理后的2007-2016年中线工程各地区水资源数据
(1)分析问题 已知条件:已有中线工程各地区水资源数据文件“07-16nsbdesv“,其中包含了2007一2016年相关地区水资源数据。 求解目标:统计计算中线工程各地区2007一2016年水资源总量的平均值,将统计结果保存为CSV文件“nsbd_avgesv“,并显示中线工程各地区十年来的平均水资源总量。 已知与未知的关系:可以根据中线工程各地区水资源数据文件“07-16nshd.csv“中的2007一2016年水资源数据,计算出各地区这十年水资源总量的平均值。 (2)规划问题求解流程 首先导入用到的库,读入“07-16nsbd.csv“文件中的全部数据,然后统计各地区十年水资源总量的平均值,生成一个数据表,并将统计结果写人CSV文件。 (3)编程实现与调试 imprt pandas as pd df=pd.read_csv(“07-16nsbd.csv“,encding=“gbk“,header=1) df[“平均水资源总量“]=df.mean(axis=1) print(df[[“地区“,“手均水资源总量“]]) df.t_csv(“nsbd_aVg.csv“,encdinga=“gbk“,f1at_frmata=“%.3f“)
(4)保存文件,调试运行程序程序运行结果如图所示。
数据可视化是以图形、图像和动画等方式直观生动地呈现数据及数据分析结果, 揭示数据之间的关系、趋势和规律等,便于人们更好地理解数据。
3.3.2 数据可视化
数据可视化的形式数据可视化的形式丰富多样,常见的有图表、词云等。例如,图形象地展示了某公交线路的路线及客流情况。图中的蓝色线条显示了公交车行进的路线、右侧的柱形图星示了各站点乘车的人数,折线图显示出客流随时间的变化情况。
图 公交线路及客流情况的可视化呈现
了解数据可视化了解各种数据可视化形式,体验数据可视化效果和魅力。1.访问国家统计局网站,了解数据可视化在国家数据统计分析领域的应用(如图所示),体验数据可视化效果。
数据可视化的实现数据可视化帮助人们形象地获取其中的信息。 1.用图表将数据可视化图表是数据处理中常用的数据可视化形式之一。常用的图表包括折线图、柱形图、饼图、散点图和雷达图等。各种图表呈现数据的形式各有特点,应该根据实际需要选择不同的图表进行数据呈现。 ■ 折线图:折线图可显示随时间而变化的连续数据,常用于分析相等时间间隔下数据的发展趋势。图呈现了2017年2月一2018年1月鲜果类居民消费价格的变化趋势。
柱形图:通常用于显示一定范围内数据的变化情况或用于各项数据的比较。
饼图:用于显示各部分数据在总数据中的大小和比例关系。
散点图:用于表示若干数据系列各数值之间的关系。
雷达图:用来比较每个数据相对中心的数值变化,适用于多维数据的呈现,且每个维度可以排序。下图显示了用户1和用户2在购买频率、购买商品各类等5个维度上的情况。
使用Pyhn语言可以灵活地制作出以上图表,绘制时可以使用Matplib库。该库是提供数据绘图功能的第三方扩展库,其pyplt子库主要用于实现各种数据图表的绘制。绘图时可使用imprt matpltlib. Pyplt as plt语句导入该库,在后续的代码中,则用plt代替pyplt.例如,使用pyplt子库中的画图函数plt(x,y)可以绘制折线图,程序如下:imprt matpltlib.pyplt as p1tX=[l,2.2,3,4,5,6,7]y=[1,7,25,11,8,10,16]plt.plt(x,y)plt.shw()该程序运行的效果如图所示。
图 用函数plt()绘制的折线图
若将plt(x,y)修改为plt(x,y,””),则可绘制出散点图(函数中的“”表示的是 点形标记符),程序运行效果下图所示。
图 用函数plt()绘制的散点图
例2:编写程序用图表可视化呈现南水北调中线工程各地区水资源总量数据。 (1)分析问题 已有需要进行可视化的水资源数据,即供水区湖北省数据,受水区河南省、河北省、北京市和天津市数据,需制作图表呈现数据。为了便于对比各区域数据,选择用柱形图呈现。 (2)规划问题求解流程 首先导入绘制图表需要用到的matplllib库,然后从“nsbd_avg.csv“文件中读取数据,再绘制图表,设置图表标题和横、纵坐标轴、最后显示出柱形图。
(3)编程实现与调试#导入需要的库imprt pandas as pdimprt numpy as npimprt matpltlib.pyplt as p1tplt.rcParams[“fnt.sans-serif“]=[“SimHei“] #指定Matplt1lib库使用的中文字体#读取数据文件#用pandas库中的函数read_csv打开数据文件,指定文件的文字编码方式,指定不包含列标题
df=pd.read_csv(“nsbd_avg.csv“,encding=“gbk“,header=0)water_resurce=df[df.clumns[12]] #绘制图表ind=np.arange(5)width=(ind,water_resurce,width,Clr=“#d62728“)plt.ylabel(“平均水资源总量/亿立方米“)plt.title(“2007一2016年南水北调中线各地区平均水资源总量对比“)plt.xticks(ind,(“北京市“,“天津市“,“河北省“,“河南省“,“湖北省“))#显示图表plt.shw()(4)保存文件,调试运行程序程序运行结果如图所示。
2007-2016年南水北调中线各地区平均水资源总量对比
表3.3.2 pyplt子库中部分函数
图 地球大气环流可视化图
我们生活在三维空间中,来自现实世界的数据通常包含位置信息。地理空间特指真实的人类生活的空间,地理空间数据一直是可视化研究和应用的重要对象、地理信息可视化在现实生活中应用广泛。 人类长期以来通过对地球和自然环境的观测来研究和了解自然空间,科学家们也通过建立数学模型来模拟环境的变化。这些观测和模拟得到的数据通常包含了地理空间中的位置信息,最常见的是与气象相关的数据。例如,图是某一时刻全球大气环流和风速的可视化在线动态展示,能维清晰地反映全球的大气环流状况。当有台风形成时,在地图上能清楚地看到台风的位置。
2、用词云将数据可视化
例3:编写程序制作词云。(1)分析问题已知条件:已有水资源公报文本文件“2016年中国水资源公报.xt“,制作词云需耍用到ScipPy、wrdelud、jieba和Matpltlib等第三方扩展库;求解目标:为“2016年中国水资源公报.txt“文件制作词云;已知与未知的关系:利用第一方扩展库可以对已有的文本文件进行分词,生成并绘制词云。(2)规划问题求解流程首先导入用于制作词云的第三方扩展库,再读入报告的文本文件、然后进行分词,随后配置制作词云的各项参数,如宇体、背景色和词云形状等,最后生成词云图片:(3)编程实现与调试进行编程实现,程序示例如下:
#导入需要用到的库frm scipy.misc imprt imreadimprt matplt1lib.pyplt as p1tfrm wrdclud imprt WrdCludImprt jiebatext=pen(“2916年中国水资源公报.txt“,“rb“).read()text_jieba=““.jin(jieba.cut(text))bg_pic=imread(“1.png“)#配置词云参数WC=WrdClud(fnt_path=“msyhbd.ttf“,backgrund_clrn=“white“,max_wrds=200,mask=bg_pic,maXx_fnt_size=100)wc.generate(text_jieba)#生成图片并显示p1lt.figure()p1lt.imshw(wc)p1lt.axis(“ff“)p1lt.shw()wc.t_file(“水资源.jpg“)
(4) 保存文件,调试运行程序
图 《2016年中国水资源公报》词云
1.制作词云用到的Pythn扩展库Scipy:科学计算核心库之一。Scipy的misc摸块用于对图像进行操作,函数imread()读入用于生成词云的图像文件。jieba:中文分词工具,使用cut方法进行分词,wrdclud:词云生成工具,使用generate方法读取文本生成词云。导入上述库的语句如下:frm scipy.misc imprt imreadfrm wrdclud imprt WrdCludimprt jieba
制作词云使用的库和函数
2、涉及的pyplt子库函数
高中中图版 (2019)3.3.2 数据可视化精品ppt课件: 这是一份高中中图版 (2019)3.3.2 数据可视化精品ppt课件,文件包含中图版高中《信息技术必修1数据与计算》第三章第三节“数据分析与可视化”第二课时PPTpptx、中图版高中《信息技术必修1数据与计算》第三章第三节“数据分析与可视化”第二课时教案docx等2份课件配套教学资源,其中PPT共22页, 欢迎下载使用。
高中中图版 (2019)3.3.2 数据可视化优秀ppt课件: 这是一份高中中图版 (2019)3.3.2 数据可视化优秀ppt课件,文件包含中图版高中《信息技术必修1数据与计算》第三章第三节“数据分析与可视化”第一课时PPTpptx、中图版高中《信息技术必修1数据与计算》第三章第三节“数据分析与可视化”第一课时教案docx等2份课件配套教学资源,其中PPT共27页, 欢迎下载使用。
中图版 (2019)第3章 数据处理与应用3.3 数据分析与可视化3.3.2 数据可视化课前预习ppt课件: 这是一份中图版 (2019)第3章 数据处理与应用3.3 数据分析与可视化3.3.2 数据可视化课前预习ppt课件,共21页。PPT课件主要包含了什么是数据可视化,体验数据可视化,数据可视化之图表,数据可视化之词云,数据可视化之,常用图表类型,表格软件制作图表步骤,操作步骤一,操作步骤二,操作步骤三等内容,欢迎下载使用。