BT × IT | 如何利用神经网络做空间转录组分析?

2021-12-15 15:58:07 浏览数 (1)

随着生物与信息融合(BT与IT融合)发展,越来越多的IT技术已实际应用于BT问题,例如今天小编介绍的这三个利用神经网络进行空间转录组分析的方法...

CoSTA:用于空间转录组分析的无监督卷积神经网络学习方法

CoSTA是一种通过卷积神经网络(ConvNet)聚类学习基因表达矩阵之间空间相似性的新方法。其使用ConvNet聚类结构,重复(1)通过ConvNet生成特征,(2)通过GMM聚类生成软分配,以及(3)使用软分配来更新ConvNet。一旦完成训练,只保留训练好的ConvNet用于特征提取。由于ConvNet主要由卷积层组成,ConvNet提取的每个基因的最终向量应该是一个空间表示。利用这个空间表示可以在一个空间转录组数据集中量化任何两个基因之间的关系,利用UMAP将这个数据集中的所有SE基因可视化,并通过常见的聚类算法分配模式。

CoSTA流程CoSTA流程

在功能测试中,研究团队通过分析模拟和此前发表的空间转录组数据,证明了CoSTA学习基因之间的空间关系的方式是强调更广泛的空间模式而不是pixels级的相关性。CoSTA为每对基因之间的表达模式相似性提供了一个定量的衡量标准,而不仅仅是将基因归类。与其他方法相比,CoSTA识别的范围更窄,但在生物学上是显著相关的基因集。同时研究团队还指出CoSTA可以应用于任何为每个基因输出基因表达信息的图像类型矩阵的技术,不仅包括文献中探讨的Slide-seq和MERFISH,还包括STARmap、10×Visium和HDST。

? 文中使用的CoSTA代码版本可在如下网址获取:

https://doi.org/10.5281/zenodo.394871

? 文献信息:

https://doi.org/10.1186/s12859-021-04314-1

通过深度学习整合空间基因表达和乳腺肿瘤形态学

ST-Net是一种结合空间转录组学和组织学图像来捕获高分辨率基因表达异质性的深度学习算法。研究团队将ST-Net在一个新的空间转录组学数据集上进行训练,该数据集包含23名乳腺癌患者68个乳腺组织切片中的30612个位点。在held-out test患者中,ST-Net可以预测102个基因表达的空间变异,包括一些乳腺癌生物标记物,分辨率约为100μm。作为一个独立的外部测试,ST-Net准确地预测了10x Genomics乳腺癌数据中的空间表达,而无需任何修改或调整,这表明ST-Net可以稳定地推广到新样本。ST-Net比使用标准细胞特征来预测表达的方法更准确。此外,它还能预测临床医生标记为肿瘤的区域内的大量表达变化,表明ST-Net能捕捉到肿瘤内异质性。

ST-Net流程及测试数据ST-Net流程及测试数据

ST-Net将基因表达与细胞形态的视觉特征联系起来,这表明空间转录组学和深度学习相结合可以利用现成的H&E组织病理学图像预测基因表达。除了预测基因表达外,ST-Net还可以学习组织病理学图像中的其他结构。尽管文献主要关注在乳腺肿瘤中的应用,但ST-Net的技术框架可广泛应用于其他组织类型。

? ST-Net的代码可在如下网址获取:

https://github.com/bryanhe/ST-Net

? 文献信息:

https://doi.org/10.1038/s41551-020-0578-x

AI提取与前列腺癌空间转录组学相关的形态学特征

研究团队受神经网络的启发,希望开发一种方法以获得形态变化与潜在分子模式之间联系的新见解。他们使用人工智能 (AI) 分析了来自多灶性前列腺癌患者的7张苏木精和伊红 (H&E) 染色的前列腺切除术载玻片的形态,还将载玻片与通过新型空间转录组学 (ST) 技术获得的数千个基因的空间解析表达配对。由于这两个空间都是高维的,在寻找它们之间的关联之前主要专注于降维。因此,研究团队使用一组预训练的卷积神经网络从H&E图像中提取形态特征,并提出了降维的工作流程。为了将ST数据总结为遗传图谱,使用了先前提出的因子分析。研究发现这些区域是自动定义的,由无监督聚类概述,与独立的手动注释相关联,在某些情况下,可以找到进一步的相关细分。形态模式也与分子特征相关,可以预测单个基因的空间变异。这种新颖的方法使得利用人工智能对形态学和遗传异质性进行灵活的无监督研究成为可能。

深度形态学特征提取的工作流程深度形态学特征提取的工作流程

在临床环境中,这种方法可以通过观察定义的非监督区域来帮助组织病理学家注释肿瘤样本,减少手动注释所需的时间,特别是在边界评估方面。类似的方法也可用于其他类型的癌症。未来还可能将模型提取的形态学特征与特定细胞群的存在联系起来,而无需使用单细胞数据进行再训练。

? 具体细节详见文献“Materials and Methods”部分:

https://doi.org/10.3390/cancers13194837

首发公号:国家基因库大数据平台 

参考文献

[1] Xu, Y., McCord, R.P. CoSTA: unsupervised convolutional neural network learning for spatial transcriptomics analysis. BMC Bioinformatics 22, 397 (2021). 

[2] He, B., Bergenstråhle, L., Stenbeck, L. et al. Integrating spatial gene expression and breast tumour morphology via deep learning. Nat Biomed Eng 4, 827–834 (2020). 

[3] Chelebian E, Avenel C, Kartasalo K, et al. Morphological Features Extracted by AI Associated with Spatial Transcriptomics in Prostate Cancer[J]. Cancers, 2021, 13(19): 4837.

图片均来源于参考文献,如有侵权请联系删除。

0 人点赞