







高中信息技术浙教版 (2019)必修1 数据与计算第四章 数据处理与应用4.2 大数据处理集体备课ppt课件
展开
这是一份高中信息技术浙教版 (2019)必修1 数据与计算第四章 数据处理与应用4.2 大数据处理集体备课ppt课件,共36页。PPT课件主要包含了Pandas模块,模块导入的两种方法,对象与属性,创建Series对象,以列表为数据对象创建,通过字典方式创建,通过循环访问值,索引访问下标,索引访问标签,索引访问切片等内容,欢迎下载使用。
大家是否在搜索引擎中搜索过自己的名字?你搜出来的数据是你自己的吗?
全校同学中,哪个姓氏最多?
以我们目前学的知识,只能找出某个姓氏的同学有哪些而且只适用于数据量少的情况
想要更灵活、深入地进行数据分析与挖掘?用计算机编程处理数据
Numpy模块:是科学运算的基础库,主要提供科学计算中常用的随机数、数组运算等基础模块Scipy模块:基于numpy构建的一个模块,增强了在高等数学、信号处理、图像处理、统计等方面的能力Pandas模块:基于numpy实现,主要用于数据的处理与分析,提供了大量处理数据的函数和方法,能方便操作大型数据集Matpltlib模块:绘图库,快速绘图和设置图标的坐标轴、坐标轴刻度、图例等
Pythn常用数据处理拓展模块
·基于numpy构建,为数据分析而存在!·一维数组Series+二维数组Dataframe·可直接读取数据并做处理(高效简单)·兼容各种数据库·支持各种分析算法
Pandas模块——数据分析核心工具包
提供了Series和DataFrame两种数据结构。使用这两种数据结构,可以完成数据的整理、计算、统计、分析以及简单可视化。
imprt 模块名 调用:模块名.函数名()frm 模块名 imprt 函数名 调用:函数名()
给模块或函数起个“小名”
imprt 模块名[as 别名] 调用:别名.函数名()frm 模块名 imprt 函数名[as 别名] 调用:别名()
imprt pandas as pd
对象:一个抽象概念,表示任意存在的事物。在pythn中,一切都是对象。不仅是具体的事物,字符串、函数等也是对象。将对象分为静态部分和动态部分:静态部分被称为“属性”,是这个对象有什么,人有身高、体重动态部分称为”方法”,这个对象能做什么,人能走路、吃饭使用方法:对象名.属性名
Pandas模块——Series序列
Series是一种一维的数据结构,由一个数组的数据(values)和一个与数据关联的索引(index),索引值默认是从0起递增的整数。列表,字典等都可以用来创建Series数据结构,与列表不同的是,Series的索引可以指定,类型可以是字符串类型。
imprt pandas as pds=pd.Series([45,46,47])print(s)
imprt pandas as pddata={'小余':45,'小松':30,'小陈':28}s=pd.Series(data)print(s)
查看Series对象中的数据
通过index、values属性访问
字符串类型:dtype='bject'整型:dtype=‘int64'
imprt pandas as pddata={'小余':45,'小松':30,'小陈':28}s=pd.Series(data)print(s.index)print(s.values)
imprt pandas as pddata={'小余':45,'小松':30,'小陈':28}s=pd.Series(data)fr i in s: print(i)
print(s[0])print(s[-1])
位置下标/标签索引/切片索引/布尔型索引
data={'小余':45,'小松':30,'小陈':28}s=pd.Series(data)
print(s['小余'])print(s[['小余','小松']])
小余 45dtype: int64小余 45小松 30dtype: int64
print(s[0:2])print(s[['小余':'小陈']])
print(s[s>30])
下列关于pandas模块的说法不正确的是( )A.Pandas是基于numpy的一种工具,该工具是为了解决数据分析任务而创建的B.Pandas提供了大量能使我们快速、便捷地处理数据的函数和方法C.Pandas提供的Series是一种一维数组的对象,他由包含一个数组的数据组成的D.Pandas模块导入的方法是imprt pandas as pd
有Pythn程序段如下: imprt pandas as pdser = pd.Series([1,3,5,7])print(ser.index) 该程序段运行后输出结果为( )
Pandas模块——DataFrame
由1个索引列(index)和若干个数据列组成
index、clumns、values、T
自主阅读书本P121,完成表格填空
DataFrame是一种类似于关系表的表格型数据结构,DataFrame对象是一个二维表格,由1个索引列(index)和若干个数据列组成。其中,每列中的元素类型必须一致,而不同的列可以拥有不同的元素类型。
创建DataFrame
以相等长度的列表组成的字典形式创建
read_excel() 读取excel文件创建dataframe t_excel() 用dataframe创建excel
查看DataFrame
查看列数据:通过属性检索
查看列数据:通过字典记法检索
查看行索引:fr i in df.index: print(i)
查看数据:fr i in df.values: print(i)
查看列标题:fr i in df.clumns: print(i)
fr i in df: print(i)
DataFrame函数
修改DataFrame
默认:axis=0,纵向排序ascendng=True,升序排序
相关课件
这是一份高中信息技术浙教版 (2019)必修1 数据与计算4.2 大数据处理课文ppt课件,共18页。PPT课件主要包含了创建绘图对象,画一条直线,画两条正弦曲线,设置标题与坐标轴,增加图例,改变颜色和粗细,完整程序,项目练习选考数据等内容,欢迎下载使用。
这是一份信息技术必修1 数据与计算4.2 大数据处理说课课件ppt,共25页。PPT课件主要包含了批处理计算,拓展链接等内容,欢迎下载使用。
这是一份高中信息技术浙教版 (2019)必修1 数据与计算4.3 大数据典型应用图文课件ppt,共28页。PPT课件主要包含了旧知回顾数据可视化,说说你身边的大数据,亚马逊“预测式发货”,预测冬季流感,UPS物流,大数据应用,智能交通,交通大数据,精准营销,供应链管理等内容,欢迎下载使用。
