懂Excel轻松入门Python数据分析包pandas(30):

2021-09-01 14:50:22 浏览数 (1)

经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas

前言

Excel 的表格是以灵活为主,也因此造就各种数据灾难现场。今天来看看怎么填补有意义的空白单元格,并且对应的 pandas 方法。


带"坑"的表格

如下一份销售人员记录表:

  • 你作为一名有素质的数据人员,第一时间就觉得这表格怪怪的,怎么有这么多萝卜坑?!
  • 当你询问表格制作的同事,他却说,这挺好的,条理很分明,空格体现时尚简约!

好吧,幸好你已经长时间接受这种非人的锻炼,打开 Excel,定位 等号 批量写入,轻松解决:

  • 内功心法:选区 -> 定位 -> 空值 -> 输入公式 -> 引用上方一个单元格 -> Ctrl Enter

你为了展示 Excel 功力,全程使用快捷键,一切尽在不知不觉中解决问题:

  • 内功心法:选区 -> F5 -> Alt S -> Alt K -> 回车 -> 引用上方一个单元格 -> Ctrl Enter

啪!!!!白日梦做完了,你的同事一言不合给你扔了 n 个同样"时尚简约"的表格。那不是要手残了?!

幸好,你想起来昨晚看到这一篇文章刚好说到是如何用 pandas 解决


pandas 中的填"坑"

对于 pandas 来说,Excel 中的这些空单元格,加载后全是 nan:

  • 这么看来一点都不时尚了

要填补这些眼花缭乱的 nan,只需要一个方法:

  • 行2:表格.fillna() 填"坑"操作,但是怎么填是有讲究的,参数 method 就是告诉他怎么填
  • method 参数有很多可选值:{'backfill', 'bfill', 'pad', 'ffill', None}
  • 用 ffill 相当于之前的 Excel 操作,获取前面的值(相当于 Excel 操作中,输入等号后,引用公式上方的单元格地址)

但是,调用一个方法还要写上这么多字母,手残党怎么办?pandas 不会让你失望:


别小看 pandas 这么一个小方法,他可以做几乎应对所有填"坑"的场景,比如,直接填个值,大声告诉所有人,"我是空白,我骄傲!":


当然,与普通的表格方法差不多,能通过 axis 参数控制填充方向:

  • 呃,虽然出来的结果不知所云,如果你把手机横过来看(行列互换),说不定能看懂

你会说,填坑到底为了啥?

其实很多时候这些坑来源于合并单元格,比如原来的表格是这样子:

  • 你要统计每个人的总销量

看完这文章,你不就非常容易搞定事情了吗:


0 人点赞