近日,西弗吉尼亚大学研究团队在 bioRxiv上发表文章 Bioinformatics Illustrations Decoded by ChatGPT: The Good, The Bad, and The Ugly,讨论使用ChatGPT解析文章插图的能力。
ChatGPT 最近开放了bing搜索和接受图像输入的功能,这使得我们可以查阅最新发表的学术信息,也可以用其解释文章中涉及的图表。
作者设计了四个癌症研究的实例来评估 ChatGPT 解释生物信息学插图的能力的各个方面。
这些案例研究涵盖了包括散点图、条形图、箱线图、点图、PCA图、火山图、KM生存图、交互网络、钟形图、圆堆积图和多轨迹基因组浏览器图像等多种类型的图。
ChatGPT 熟练地识别了这些不同的绘图类型(钟形图除外)并应用生物学知识来丰富解释,有效地阐明了绘图中的关键元素。然而,当涉及视觉元素的定量分析时,它很难提供准确的解释。 此外,虽然GPT可以起草图形图例并总结图形中的发现,但必须进行严格的校对以确保内容的准确性和可靠性。
这对于刚入门学生了解图形基本结构和含义,以及有一定知识背景的研究者丰富和完善对于图形含义的理解可以起到一定帮助!
1Prompts
作者使用的prompts是让它作为一个生物信息学专家。
2实测
我们以发表在 Nat Microbiol上的文章 Phyllosphere microbiome induces host metabolic defence against rice false-smut disease 为例,让GPT4扮演一位微生物组学和生物信息学专家对文章中的部分图形进行解释。
共现网络
Fig. 1I Microbial co-occurrence networks in DPs and DSPs
PCA和相关性分析图
Fig. 2e&f
基因编辑图
显微镜拍摄的图片
Fig. 4h-m
分子对接图
Fig. 5i
3小结
难以置信!在给出的信息如此有限的情况下,GPT对于图片的解析相当准确。如果在提问中补充更多的信息,我相信效果会更加出众,读者对文章的理解也会更加深刻,甚至会出现中学时做语文阅读理解的情况——理解到作者没有考虑到的内容。