Jupyter 两个炸裂的骚操作!

2023-11-06 17:20:15 浏览数 (2)

今天聊两个不太常见但很有用的骚操作,可以为我们节省大量的时间,提高效率。

下面我们开始介绍。

一、获取历史执行信息

问题

假如我们已经在Jupyter中编写了一些代码,但在计算后发现忘记将结果赋值了。一般在这种情况下,会不得不调整下,然后再次执行该单元并生成结果完成赋值。

那么如何不重新运行而直接使用结果呢?

解决方法

当我们在Jupyter中执行一个单元格时,会看到单元格之外的In[2]:,结果输出以后单元格外也会出现Out[2]:,如下所示。

在IPython中:

Out是一个标准的Python字典,用于存储单元格输出的结果。此时的字典中,键(key)就是2,即单元格执行次数的id(id只会按1,2,..,n的顺序依次增加,无论执行什么单元格),而值(value)则为单元格的执行结果

In是一个Python列表,存储着按顺序执行的代码。

我们再次执行以下代码,发现执行代码和结果竟都可以复现。

也就是说,我们做的任何操作以及对应的结果,Jupyter都在做着笔记和记录,而且每个记录都是独立存在,id依次增加保证不会被覆盖。所以当我们不小心犯错或者找不到之前结果的时候,就都可有迹可循了。

二、魔法命令store

问题

在用Jupyter的时候,经常由于某种原因,需要重新启动内核。但一般在重新启动之前,会将数据对象保存下来,以免再次运行后重新再跑一遍。

如果代码比较多,数据量比较大,那就是一个非常耗时的过程。而且单独存储每个重要的数据对象也是比较麻烦的。

解决方法

magic魔法命令中的store可以完美解决这个问题。它可以让我们在即使重新启动内核后,也可以获得重启之前计算得到的对象和结果。这就避免了我们反复将对象转储到磁盘的麻烦。

下面演示如何使用store命令。

可以看到,我们首先创建一个dataframe对象并赋给df,然后将df用store保存,当重启内核后,再通过store命令重新获取。

store命令的具体操作如下。

代码语言:javascript复制
# 存储变量
%store value
# 存储多个变量
%store var1 var2
# 获取变量
%store -r value

以上是全部内容,点个赞交个朋友。

-- end --

0 人点赞