Galaxy Project(https://galaxyproject.org/)是在云计算背景下诞生的一个生物信息学可视化分析开源项目。
该项目由美国国家科学基金会(NSF)、美国国家人类基因组研究所(NHGRI)、哈克生命科学研究所(The Huck Institutes of the Life Sciences)、宾州州立大学网络科学研究所(The Institute for CyberScience at Penn State),以及约翰霍普金斯大学(Johns Hopkins University)提供支持,是目前生物医学研究领域最受欢迎的在线生物信息分析工具之一。
2021年3月左右,Galaxy Project 正式发布了 Release-21.01 的版本;3月17日,发布该版本的 announcement 文档。这里总结一下该版本一些主要的更新内容,为关注和从事 Galaxy 相关工作的中文用户提供参考。
1. 重点更新
工作流(Workflows)是 Galaxy v21.01 版本中的绝对明星,它们已经有了巨大的改进。
1.1 工作流: 最佳实践,报告,调用
在这个版本中我们可以看到工作流程已经有了巨大的改进!工作流报告编辑器比以往任何时候都更容易使用,它为您提供了一个常用报告组件的列表、将它们嵌入到报告中的交互式接口,以及一个新的工作流调用跟踪器。现在,您可以将可视化直接嵌入到您的工作流报告中,从而使得您在总结您的分析时比以往任何时候都更容易。而且,一旦您的报告生成,您可以直接将它们导出到页面,以便与同事分享您的报告。
如果您正在利用 Galaxy 强大的子工作流构建高级工作流来实现可重用的工作流组件,那么您将很高兴地知道,您现在可以自动将这些工作流更新为最新版本。
此外,当您将工作流程与他人分享时,一个新的“最佳实践”检查器已经包含在内,它可以帮助您发现简单的事情,使您的工作流程更具有可共享性。
1.2 远程文件
从21.01开始,顶级功能的突出显示一直存在激烈的竞争,但是远程文件界面绝对是一种非常棒的浏览数据的新方式。在 Galaxy 内部,有一种新的、抽象的方式来引用本地和其他服务器上的文件。这让我们提供一个统一的接口到 FTP 服务器,如您的 Dropbox,公共 S3 存储桶,等等!你可以在上传界面的选择远程文件下找到这个。
Galaxy Climate 社区正在提供一个很好的测试案例;他们的大部分数据都公开发布在公共的 S3 存储桶上,这些数据不容易获得,现在他们可以直接从 Galaxy 系统获得。不再需要在文档中再次执行"import this url"这个神奇的步骤,现在 "只需要浏览存储库中的数据"。
但是远程文件浏览器的增加并没有止步于此!其他几个接口接收到了使用这个新框架的更新:
历史导入导出
历史记录现在可以直接导出到你的 FTP 文件夹,Dropbox,或任何其他配置的远程文件存储。
历史导入也进行了同样的处理,允许从任何这些公共数据位置导入,使它比以往任何时候都更容易在 Galaxy 系之间共享历史,并使您的分析更复制!
更多截图和更多功能请参见 Pull Request 11054。
规则生成器
同样,Rule-Builder 现在可以访问远程文件接口。在许多 FTP 服务器和其他位置都可以轻松地找到带有标识符的示例表,然后通过这个新接口直接加载到 Rule Builder 中。太简单了!
1.3 测试版历史面板
历史记录面板在最新代码中得到了更新和巨大的性能提升。这听起来让你兴奋吗?现在你就可以通过点击历史菜单选项的"Use Beta History Panel"。这不是它的最终状态,但是我们希望得到用户的反馈,告我们你是如何找到它的。这个新的历史面板它具有性能和可用性改进的特点。例如,现在你不需要单独的菜单就可以重命名文件,只需双击数据集标题即可!
1.4 方便使用的改进
这是一个新的部分,涵盖较小的改进,只是使您的工作更容易,加速您与 Galaxy 的互动。
- 交互式工具可以停止,而且它们的输出不会消失,具有更好的重复性!Pull Request 10497
- 上传文件时,"name" 字段将自动聚焦,允许您直接重命名文件,节省您的时间。Pull Request 10487
- 工作流版本现在可以公开它们的更新时间。还原到一个旧版本?哦,是的,还原到那个星期二的版本!Pull Request 10492
- 共享组件现在已经把 url 的“复制到剪贴板”功能包括在内。点击一下,你就准备好与世界分享了。Pull Request 10754
- Galaxy 中的 GTN 覆盖层页面现在可以跟踪您正在查看的页面,如果 Galaxy 页面得到刷新。去学习吧,不要分心!Pull Request 11290
2. 新的可视化
NORA,一个医学图像查看器和注释工具(感谢 @bgruening,Pull Request 1103)
用于深度变焦图像的 OpenSeadragon 查看器(感谢 @gregvonkuster,Pull Request 10756)
3. 新数据类型
- Gfa2 的初始提交(感谢 @bernt-matthias). Pull Request 10270
- 添加 ome.tiff 数据类型(感谢 @qiagu). Pull Request 10349
- 添加对 dzi (Deep Zoom Image)数据格式的支持(感谢 @gregvonkuster). Pull Request 10546
- 为各种 MD 文件类型添加数据类型转换器(感谢 @simonbray). Pull Request 10757
- 添加 nifti1 和 nifti2 数据类型(感谢 @bgruening). Pull Request 11020
- 添加 tck 和 trk 数据类型(感谢 @bgruening). Pull Request 11021
- 添加 gifti fileformat (感谢 @bgruening). Pull Request 11028
- 添加基础的 Apache Parquet 数据类型。Pull Request 11047
- 添加最小的 msf 数据类型(感谢 @nsoranzo). Pull Request 11084
- 添加 ffindex 和 ffdata 数据库文件类型。Pull Request 11218
- 修正了以许多注释开始的文件的 interval 数据类型的嗅探器(感谢 @nsoranzo). Pull Request 11416
- 增加了 cmap 数据类型(感谢 @jaidevjoshi83). Pull Request 11471
- 添加压缩的 paf 数据类型(感谢 @astrovsky01). Pull Request 11567
4. 内置工具更新
- 允许应用规则工具将标签附加到输出数据集。Pull Request 10382
- 允许 build_list 输入为可选的。Pull Request 10871
- 更新 askomics IT 到 4.1.1(感谢 @abretaud). Pull Request 10878
- 允许空文件上传(感谢 @bernt-matthias). Pull Request 11079
- 在 hash 工具中强制进行 hash 选择。Pull Request 11427
- 各种 pyiron 交互式工具修复。(感谢 @bgruening). Pull Request 11545
- 更新 cellxgene IT 容器。(感谢 @bgruening). Pull Request 11546
- 允许在没有数据输入的情况下使用 Openrefine (感谢 @bgruening). Pull Request 11547
- 修复一些 gxit 需要的一个特定的 $HOME (感谢 @abretaud). Pull Request 11577
5. 参考资料
[1]
完整的发行说明:January 2021 Galaxy Release (v 21.01)
[2]
21.01 announce user:January 2021 Galaxy Release (v 21.01)