前言
许多用 Python 做数据工作的小伙伴很喜欢 jupyter notebook 环境,因为它可以分块执行:
- 可以一块块代码执行并输出结果
后来,vscode 上也支持这种环境:
而我经常在双屏下工作,非常希望可以在一个屏幕输入代码,另一个屏幕查看数据,特别是表数据。可惜的是以上两种工具都没法支持双屏。
究其原因是输入代码和展示结果都在同一个软件中完成。如果有关注 xlwings 库的朋友应该知道,在 xlwings 的新版本里面提供了一个函数,可以轻松把 pandas 的 dataframe 输出到 excel 上:
如果今天只是介绍怎么使用这个函数,那显然不是我的风格。
我觉得要在代码上使用 view 显得太麻烦,可不可以 连 view
函数都不用写,就像平时输出结果 ,就可以做到一样的效果:
- 更重要的是,现在我可以在双屏下愉快地工作了
接下来我就会把这个效果的制作过程详细讲解,涉及的知识点:
- 如何定制在 jupyter notebook 上的输出
- 修改别人定义的类的函数
- 使用 xlwings 操作 excel
本节内容需要你安装 xlwings 和 pandas:
代码语言:javascript复制pip install xlwings pandas
- xlwings 的版本不是很重要,因为我们不会直接使用它的 view 函数
输出接口的函数
首先,我们需要了解 jupyter notebook 是怎么知道一个对象该显示什么。平常我们输出数值、文本、列表、字典这些 Python 内置对象很好理解。
但是如果是我们自定义类型,jupyter notebook 的显示逻辑是什么?
- 显然它会优先调用
_repr_html_
如果没有定义 _repr_html_
,则会调用 __repr__
:
这里顺带做一些扩展知识。
jupyter notebook 环境是基于网页技术,所以 显示的内容本质上可以是有效的 html 。
比如,数据放到一个红色框里面:
不仅如此,还可以放入一个链接:
- 点击链接,会使用浏览器访问
可以加入各种网页的动画效果:
"这些有什么用呀?"
这就取决于你的想象力了。
跑题了,这些只是一点点课外知识。
接管 DataFrame 的 函数
现在我们知道当一个 dataframe 数据显示出来之前,会调用它的 _repr_html_
(如果有,事实上真的有)。那么很简单,我们直接定义一个同名函数,直接赋给 pd.DataFrame 类型:
- 为了通用,我们把这个步骤写在一个单独的代码文件
函数 _cus_repr_html_
里面的代码怎么写?
我们可以参考 xlwings 的 view 函数的代码,稍微修改一下:
- 代码大概10来行,但是我只是修改了一点点(红框处),其他都是从新版的 xlwings 的 view 函数抄过来
之所以要修改,是因为目前最新版本的 xlwings 的 view 函数不够灵活(不能设置输出位置等细节)
最后,在 _cus_repr_html_
使用 我们自己魔改过的 _view 函数即可:
- 行8:为什么这里要用 nonlocal 关键字?因为 book_name 变量不是全局变量,而是定义在函数 output2excel 中的局部变量,并且我们需要在另一个函数 cus repr html 中修改这个变量的值
nonlocal 使得变量成为自由变量,以后有机会再深入讲解这些细节
这样子我们就准备好一切,使用很简单:
- 导入,运行一次函数 output2excel 即可