昨天给番薯智库开放了嵌套导入页面链接的功能(说是开放是因为底层之前已经有了这个功能,现在限定场景和范围进行开放),这样对于一些包含索引目录的页面,可以一次嵌入,批量导入,方便用户快速导入网页训练数据。不过对于在线网页,为了限定范围,只支持导入同一域名下的页面链接。
这个功能显然也可以迁移到批量导入浏览器书签/收藏夹网页链接进行训练上,对于像我这样的大多人来说,可能看到好的网页内容,随手都会收藏,但从来没有去看过,导致那些珍贵的内容一直在浏览器收藏夹里吃灰。番薯智库作为一个 AI 智能知识库,当然不能对此坐视不管,所以我在昨天批量嵌套网页链接功能基础上稍事修改,就可以支持导入浏览器书签网页内容进行训练并与之对话了。
此功能仅限可以公开访问的网页内容,不支持需要登录访问的网页,不过为了降低大家的使用负担,在批量导入过程中,番薯智库会自动剔除那些无法提取内容的网页,避免训练失败。对于这些额外的内容,你仍然可以跳过另存为本地 HTML 文件,然后跳过离线文档训练进行补充。
导出书签内容
在训练之前,需要先将浏览器书签收藏内容批量导出。以谷歌浏览器为例,按照下图所示点击进入书签管理器(不同浏览器收藏夹名称可能不一样,比如 Edge 浏览器就叫收藏夹,操作流程则是类似的):
点击右上角按钮,在下拉框中选择导出书签(Edge浏览器叫收藏夹):
就可以将你的浏览器书签网页导出到本地磁盘了,这正好是一个番薯智库支持的 HTML 格式文档,将其保存到指定位置,比如桌面或者我的文档:
这样就完成了浏览器书签内容导出。
提交书签进行训练
接下来,我们就可以进入极客智坊的番薯智库产品功能页面对浏览器书签内容进行训练了,如果你还没有创建任何智库,可以参考上篇教程进行创建,如果已经创建过则点击修改按钮进入智库上传书签进行训练:
在嵌入文档区域,点击上传文档按钮,在弹出窗口选择上一步导出的书签/收藏夹文件(bookmarks/favorites 日期 .html后缀文件):
即可提交自己的浏览器书签内容进行训练了,上传成功会弹出如下提示,同时你可以在嵌入的网页列表中看到从浏览器书签栏导入的所有链接:
这一切都是自动完成的,无需任何手动操作。将编辑/嵌入区域的滚轮拉到页面底部,点击开始训练/重新训练按钮即可开始对浏览器书签内容进行训练:
训练操作会异步执行,无需在页面等待。接下来的时间,可以喝杯咖啡,或者干点别的事情,直到智库状态从训练中变成成功:
训练成功后所有链接状态会变成绿色:
你还可以点击上方的定制我的AI智库对智库对话指令进行定制(这一步是可选的):
与浏览器书签内容进行对话
至此,你就可以正式开始与你的浏览器书签内容进行对话了。你可以在训练页进行测试,也可以到预览页体验完整功能:
当然,独乐乐不如众乐乐,你还可以点击预览页底部分享按钮,和自己的小伙伴共享你的知识库:
你可以选择公开分享,也可以选择私密分享,然后点击复制分享链接按钮,就可以和小伙伴分享自己的智库啦。
拓展:导出任意笔记进行训练对话
当然,这个功能可以继续扩展,你可以在本地笔记软件(如Notion)中以自己喜欢的任意格式编辑需要批量训练的网页链接数据,然后导出成 HTML 格式提交到番薯智库进行训练对话,或者直接将自己之前收藏的网页书签文档导出成 HTML 格式提交训练:
希望这个功能对你有帮助