
Pandas基础课程
目录
1Pandas基础
2数据处理
3数据规整
4分组聚合
5时间序列
2
Pandas简介
Pandas的名称来自于面板数据(paneldata)和python数据分析(dataanalysis)。
Pandas最初由AQRCapitalManagement于2008年4月开发,并于2009年底开源出来,
主要提供高性能易用数据类型和分析工具
Pandas的优点有哪些?
➢可以轻易的处理浮点及非浮点数据类型的缺失值(NaN)
➢基于智能标签的切片,花式索引,轻易从大数据集中取出子集
➢可以灵活处理时间数据
AQRCapitalManagement
➢灵活强大的分组功能,可对数据集进行拆分组合操作创始人CliffAsnester
➢方便的将其他Python和Pandas数据结构中不同类索引的数据转换为DataFrame对象
➢轴(axes)的分层标签(使每个元组有多个标签成为可能)
3
Pandas预备知识
➢Pandas一般默认简写:pd
➢Pandas有两种主要的数据类型:Series和DataFrame
•Series可以理解成一种具有索引的数组
•DateFrame是由共用相同索引的一组列组成的
➢Pandas同样适用广播机制
部分excel表
ndarray与Series的区别DateFrame数据示例
4
Series函数相关知识
Series函数同样适用ndarray的操作,但是输出结果仍是Series类型
pandas.Series(self,data=None,index=None,dtype=None,name=None,copy=False,fastpath=False)
Data:Series不改变数据的类型
Index:Series可以自定义索引,索引关键词可以使用符号或汉字
创建Series的几种方法
Python列表标量值(必须有index)
Python字典ndarray
其他
5
DateFrame函数练习
DataFrame函数
pandas.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)
index:index定义行索引
columns:columns定义列索引
创建DataF
免费下载链接
飞猫云链接地址:https://jmj.cc/s/lod85z
压缩包解压密码:res.99hah.com_nKzSe1qY97
下载方法:如果您不是飞猫云会员,请在下载页面滚动到最下方,点击“非会员下载”,网页跳转后再次滚动到最下方,点击“非会员下载”。
解压软件:Bandizip
- 打开飞猫云链接地址的页面,拖动到最下方,找到“非会员下载”的按钮并点击
- 此时,如果没登录,可能会提醒您注册帐号,随便注册一个帐号并登录
- 再在新打开的下载页面,再次拖动到最下方,找到“网页端 非会员下载”的按钮并点击。
版权声明:本文为转载文章,版权归原作者所有,转载请保留出处!