昨天在面向GitHub编程时,无意发现了Pandas官方竟提供了同款小抄,项目地址如下
代码语言:javascript复制https://github.com/pandas-dev/pandas/blob/master/doc/cheatsheet/Pandas_Cheat_Sheet.pdf
可以看到这份小抄提供了PPT和PDF两个版本,虽然最新一条更新记录为两年前,但是并不影响我们拿来学习,下面我们来看看这份小抄(速查表) 的强大!
这份速查表一共有两页,我已经将它转换为图片?发在公众号可能会被压缩,你可以在文末下载高清大图
经过一番研究,这两张图片一共覆盖了12个常用的Pandas操作?
1、数据创建
介绍了几种常用的DataFrame创建语法
2、数据重塑
这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示,理解起来简直不要太方便!
3、数据筛选
这一块区域主要是分别用行/列来讲解一些常用的数据查看、抽样、切片等操作,包含了tail
、head
、loc
、iloc
等非常重要的方法,并且同样给出了部分动画便于理解
4、数据探索
这一块主要给出了一些在进行探索性分析时常用的方法,比如max
、min
、count
等,不过官方将apply放在这里,并没有展开讲解
5、数据修改
这两个区域为缺失值处理和创建新的列,重点用动画示例了assign
和qcut
方法,缺失值处理部分仅给出了两个方法,应该是偷懒了
6、数据分组
主要就是groupby
和相关方法
7、数据连接
这里介绍的还是非常详细!用图片例子来展示pd.merge
中的各种参数变化的不同,一看就懂
以上就是我对这份小抄的基本概括,其实大家应该清楚,仅仅靠靠两张图片根本没法把整个Pandas学明白,所以官方也有选择性的对一些重要的方法给出了详细的讲解,而有些功能则一笔带过,比如我之前?花很大力气介绍的pandas绘图功能仅给出了区区一角
所以你应该这样用这份小抄,把它当成速查表,「用于了解哪些操作可以用Pandas完成」,在你不确定或者不明白如何处理数据时,通过这份速查表快速查到Pandas中的哪个方法可以完成,之后再进一步通过搜索学习对应的方法!
-END-