Python小工具:把jupyter notebook数据直接输出到excel

2022-11-30 15:19:12 浏览数 (2)

前言

许多用 Python 做数据工作的小伙伴很喜欢 jupyter notebook 环境,因为它可以分块执行:

  • 可以一块块代码执行并输出结果

后来,vscode 上也支持这种环境:

而我经常在双屏下工作,非常希望可以在一个屏幕输入代码,另一个屏幕查看数据,特别是表数据。可惜的是以上两种工具都没法支持双屏。

究其原因是输入代码和展示结果都在同一个软件中完成。如果有关注 xlwings 库的朋友应该知道,在 xlwings 的新版本里面提供了一个函数,可以轻松把 pandas 的 dataframe 输出到 excel 上:

如果今天只是介绍怎么使用这个函数,那显然不是我的风格。

我觉得要在代码上使用 view 显得太麻烦,可不可以 view 函数都不用写,就像平时输出结果 ,就可以做到一样的效果:

  • 更重要的是,现在我可以在双屏下愉快地工作了

接下来我就会把这个效果的制作过程详细讲解,涉及的知识点:

  • 如何定制在 jupyter notebook 上的输出
  • 修改别人定义的类的函数
  • 使用 xlwings 操作 excel

本节内容需要你安装 xlwings 和 pandas:

代码语言:javascript复制
pip install xlwings pandas
  • xlwings 的版本不是很重要,因为我们不会直接使用它的 view 函数

输出接口的函数

首先,我们需要了解 jupyter notebook 是怎么知道一个对象该显示什么。平常我们输出数值、文本、列表、字典这些 Python 内置对象很好理解。

但是如果是我们自定义类型,jupyter notebook 的显示逻辑是什么?

  • 显然它会优先调用 _repr_html_

如果没有定义 _repr_html_ ,则会调用 __repr__


这里顺带做一些扩展知识。

jupyter notebook 环境是基于网页技术,所以 显示的内容本质上可以是有效的 html

比如,数据放到一个红色框里面:

不仅如此,还可以放入一个链接:

  • 点击链接,会使用浏览器访问

可以加入各种网页的动画效果:

"这些有什么用呀?"

这就取决于你的想象力了。

跑题了,这些只是一点点课外知识。


接管 DataFrame 的 函数

现在我们知道当一个 dataframe 数据显示出来之前,会调用它的 _repr_html_ (如果有,事实上真的有)。那么很简单,我们直接定义一个同名函数,直接赋给 pd.DataFrame 类型:

  • 为了通用,我们把这个步骤写在一个单独的代码文件

函数 _cus_repr_html_ 里面的代码怎么写?

我们可以参考 xlwings 的 view 函数的代码,稍微修改一下:

  • 代码大概10来行,但是我只是修改了一点点(红框处),其他都是从新版的 xlwings 的 view 函数抄过来

之所以要修改,是因为目前最新版本的 xlwings 的 view 函数不够灵活(不能设置输出位置等细节)

最后,在 _cus_repr_html_ 使用 我们自己魔改过的 _view 函数即可:

  • 行8:为什么这里要用 nonlocal 关键字?因为 book_name 变量不是全局变量,而是定义在函数 output2excel 中的局部变量,并且我们需要在另一个函数 cus repr html 中修改这个变量的值

nonlocal 使得变量成为自由变量,以后有机会再深入讲解这些细节

这样子我们就准备好一切,使用很简单:

  • 导入,运行一次函数 output2excel 即可

0 人点赞