今天聊两个不太常见但很有用的骚操作,可以为我们节省大量的时间,提高效率。
下面我们开始介绍。
一、获取历史执行信息
问题
假如我们已经在Jupyter
中编写了一些代码,但在计算后发现忘记将结果赋值了。一般在这种情况下,会不得不调整下,然后再次执行该单元并生成结果完成赋值。
那么如何不重新运行而直接使用结果呢?
解决方法
当我们在Jupyter
中执行一个单元格时,会看到单元格之外的In[2]:
,结果输出以后单元格外也会出现Out[2]:
,如下所示。
在IPython中:
Out
是一个标准的Python字典,用于存储单元格输出的结果。此时的字典中,键(key)就是2
,即单元格执行次数的id(id只会按1,2,..,n的顺序依次增加,无论执行什么单元格),而值(value)则为单元格的执行结果。
In
是一个Python列表,存储着按顺序执行的代码。
我们再次执行以下代码,发现执行代码和结果竟都可以复现。
也就是说,我们做的任何操作以及对应的结果,Jupyter都在做着笔记和记录,而且每个记录都是独立存在,id依次增加保证不会被覆盖。所以当我们不小心犯错或者找不到之前结果的时候,就都可有迹可循了。
二、魔法命令store
问题
在用Jupyter的时候,经常由于某种原因,需要重新启动内核。但一般在重新启动之前,会将数据对象保存下来,以免再次运行后重新再跑一遍。
如果代码比较多,数据量比较大,那就是一个非常耗时的过程。而且单独存储每个重要的数据对象也是比较麻烦的。
解决方法
magic魔法命令中的store
可以完美解决这个问题。它可以让我们在即使重新启动内核后,也可以获得重启之前计算得到的对象和结果。这就避免了我们反复将对象转储到磁盘的麻烦。
下面演示如何使用store
命令。
可以看到,我们首先创建一个dataframe对象并赋给df,然后将df用store
保存,当重启内核后,再通过store
命令重新获取。
store
命令的具体操作如下。
# 存储变量
%store value
# 存储多个变量
%store var1 var2
# 获取变量
%store -r value
以上是全部内容,点个赞交个朋友。
-- end --