作者 | 崔雅轩 编辑 | 李仲深
今天给大家介绍的是俄亥俄州立马勤教授在nature reviews molecular cell biology发表的文章《Deep learning shapes single-cell data analysis》。作者在此篇综述文章中主要提到了深度学习模型对于单细胞测序领域具有巨大的潜力。目前已经在单细胞领域中应用了大量深度学习模型来进行数据分析,但仍有许多挑战和可能的新发展有待探索。在这篇评论中,作者考虑了采用深度学习方法来分析单细胞数据的进展、局限性、最佳实践和前景。
一、介绍
单细胞技术大大提高了对单个细胞之间的异质性和功能多样性的理解,并为生物学和精准医学带来了巨大的机会,特别是研究细胞经历快速分化成不同的亚群(例如,在耐药性研究,肿瘤复发研究,免疫细胞研究)或应对外部扰动(例如,在covid-19发病机制)。与单细胞技术发展的同时,人工智能领域(深度学习)的突破,重新定义了通过使用复杂的人工神经网络结构来分析大规模数据的能力。深度学习最近已经在AlphaFold2的蛋白质结构预测中得到了证明,并且使用深度学习在单细胞数据分析中是可行的。
二、为单细胞研究开发匹配的深度学习模型
通过推广深度学习模型的设计和优化,单细胞数据的高度异质性可以在广泛的课题领域中进行分析。外部的生物知识或数据(例如,表型信息或批量组学数据)可以被纳入模型中,以作为约束条件改进预测。单细胞数据通常包含有限数量的标签和注释,这可能会导致模型过拟合和性能较差。但所幸,在许多情况下新兴半监督学习(结合少量的标签数据与大量的无标签数据)和自我监督学习通常可以实现同样准确的结果而不需要额外的标签。此外,提高深度模型的可信度,特别是模型泛化在不同的实验平台和条件,和提高对噪声数据的鲁棒性。此外,提供一些预测结果的可信度评估(例如,P-values or z-scores)可以指导用户做出生物推断。
深度学习模型使用者通常会发现,根据可用性和准确性来决定何时以及如何选择深度学习工具来进行单细胞数据分析很具有挑战性。已被广泛应用于单细胞数据分析,与Seurat相反,深度学习可以揭示更多的内在关系和机制。最佳拟合深度学习模型的选择通常是由特定目标驱动的,例如,是细胞聚类还是细胞分类,特征顺序是否重要,或者不同模式之间的拓扑关系是否重要。最佳拟合学习模型模型的选择通常是由一个特定的目标驱动的,例如,无论是细胞聚类还是细胞分类,以及特征顺序是否重要,还是不同模式之间的拓扑关系是否重要。由于用于单细胞数据分析的深度学习模型尚未成熟,因此运行多个工具来比较可能更有价值的。
三、深度学习在单细胞数据分析中的局限性
虽然现有的深度学习工具已经证明了它们在各种环境下分析单细胞数据的能力,但它们还没有被研究小组在其生物学研究中广泛使用。表格仅包括原始方法学论文的案例研究。虽然新技术的建立往往需要时间,但目前的深度学习方法在单细胞数据分析中的也有很大的局限性。特别是,深度学习方法通常需要大量的数据和计算资源来训练;它们的结果可能不可靠(性能由于数据噪声、参数设置和新的输入数据而变化);大多数深度学习模型是缺乏可扩展性的黑盒;几乎所有的深度学习工具都需要广泛的计算机技能来使用。因此,深度学习方法的发展与它在多种生物系统中的广泛应用之间仍存在差距。
四、单细胞数据分析中的深度学习前景
深度学习在单细胞数据分析中的应用为未来的探索具有广阔的前景。对于方法的发展,快速发展的尖端深度学习方法的不断适应。由于单细胞生物学中可用的注释数据有限,因此有应用主动学习(交互式地建议新的数据标记来训练模型)来建立基于少数训练样本的模型的空间。更高程度地采用端到端深度学习框架(例如,在AlphaFold2中)可以促进更全面和全面地使用训练数据,以解释所有输入特性和关系。基于模型的深度学习有望进一步深入分析单细胞生物学。结构或拓扑感知方法,以及受物理启发和生物启发的框架将信息集成到深度学习模型中,用于其他应用;在单细胞生物学中也可能有类似的应用。此外,深度学习的发展可以支持对潜在的生物学机制的更好的解释,包括因果或调节关系,对外部刺激的细胞类型特异性反应,以及驱动疾病或表型的细胞亚群。开发集成系统和部署云平台将使没有编程技能的用户能够通过web服务使用单细胞深度学习工具。这些工具还可以帮助培训下一代研究人员和临床医生,特别是允许精确医疗更容易实现医疗实践。
基于深度学习的方法展示了在单细胞数据分析的能力,如理解脑细胞类型的复杂性相关的感知和复杂的行为,并推断肿瘤和免疫细胞群的多样性大大加快发现新的发病机制和癌症治疗。我们希望加快研究的脚步,以提供独特的见解,但如果不结合单细胞数据和深度学习技术,这可能就无法实现。另一个不断增长的领域是深度学习模型从可预测和可解释的迁移到更可操作的,即可以直接给出医院治疗的建议,如治疗靶点、药物再利用和药物组合。
原文链接
https://www.nature.com/articles/s41580-022-00466-x.pdf