GeneSwitches:拟时序分化轨迹开关基因分析

2022-09-21 16:32:53 浏览数 (1)

在生物学和基础医学领域,研究细胞类型的分化和细胞状态的转化是非常重要的一环,它可能与疾病的发生发展有着重要且密切的联系。单细胞转录组测序可以保留单个细胞的转录组信息,且由于细胞分化是一个连续的过程,所以单细胞转录组测序可以捕获处于不同分化状态的单细胞进行细胞分化的研究。在单细胞转录组数据中,细胞分化状态体现在不同细胞之间基因表达的连续变化,基于基因表达的连续变化,可以使用拟时序分化轨迹的方法进行细胞分化的分析。通过拟时序分化轨迹分析可以推断出生物过程中细胞的分化轨迹或细胞亚型的演化过程,用拟时间来表征,拟时间越早代表该细胞位于分化转化过程的早期,反之则位于分化转化过程的晚期。

Monocle2是一款常用的单细胞拟时序分化轨迹分析软件,它可以通过反向图嵌入的机器学习技术构建单细胞轨迹,将细胞放置在轨迹中的适当位置,并通过差异分析模块获取在轨迹过程中受调控的基因。关于Monocle的详细介绍和使用方法详见以往推文——技术分享|单细胞转录组数据的拟时序分析——上。

然而,目前的拟时序轨迹分析软件缺乏对轨迹关键驱动基因的下游分析,2020年发表在Bioinformatics杂志上的分析软件GeneSwitches基于此现状,重点开发了拟时序分化轨迹开关基因分析方法,对拟时序分化轨迹的分析结果进行了进一步挖掘,加入了更多的功能分析和可视化,对理解细胞分化转化和疾病发生发展及探索治疗方式有重要的指导作用。开关基因指细胞分化转化过程中表达沉默或表达激活的基因,它可能会引起或推动发育体系,在可选择的相关细胞途径中进行转换,对生物过程的发生发展有着重要的意义。

开关基因分析方法与功能介绍

GeneSwitches首先通过对分化轨迹中的基因进行二值化分析,筛选出了表达特性上存在on和off两个状态的潜在开关基因。随后软件对这些潜在开关基因进行逻辑回归分析和McFadden’s Pseudo R2拟时间相关性分析:通过逻辑回归分析推算出每个开关基因的开关时间(Switching Time Point);通过拟时间相关性分析得到每个相关性R2值,其中表达激活的开关基因与拟时序正相关(R2>0),被定义为上调型开关基因(Up-regulation),而表达沉默的开关基因与拟时序负相关(R2<0),被定义为下调型开关基因(Down-regulation)。拟时序相关性越高代表基因与该轨迹进程的关系越密切。得到了每个潜在开关基因的开关时间和相关性R2值后,将Top开关基因按其开关时间在拟时序上排序可视化,可以更直观地展示分化轨迹进程中的关键基因作用。同时,GeneSwitches嵌入了功能分析模块,通过基因注释(如表面蛋白,转录因子或其他功能类型)和富集分析(GO, KEGG和HALLMARK)的方法帮助解读开关基因分析结果,更好地与生物过程和疾病发生发展联系起来。除此之外,该软件不仅可以对单条轨迹进行开关基因分析,还能比较两条不同分化分支之间开关基因的异同,可用于寻找分支特异性的开关基因或比较相同开关基因在不同分支中开关时间的先后差异。

单轨迹开关基因分析案例

2020年发表的题为“ GeneSwitches: Ordering gene-expression and functional events in single-cell experiments”的文章中进行了GeneSwitches的方法测试。下图展示了从人胚胎干细胞(hESC)分化为心肌细胞(CM)的分化轨迹开关基因分析。通过开关分析发现了拟时序较为早期表达激活的开关基因VIM和TIMP1,可以作为加速分化进程的候选基因。另外他们还找到了早期表达沉默的开关基因POU5F1与后期表达激活的开关基因MYH7。开关基因富集分析结果表明与细胞周期(Cell Cycle)相关的通路在拟时序早期下调,而与心脏功能相关的通路在拟时序后期上调。

双轨迹开关基因分析案例

下图展示了用GeneSwitches分析两条有联系的分化分支的开关基因分析,两条分化轨迹分别为从人胚胎干细胞(hESC)到心肌细胞(CM)的分化分支1(Definitive CM)和到非收缩细胞的分化分支2(Non-contractile)。分析发现分支1上调了一些与心脏功能相关的基因如CSRP3和NKX2-5,而分支2则上调了如DCN和COL1A2等成纤维细胞的marker基因。

参 考 文 献

Cao, Elaine Y., John F. Ouyang, and Owen JL Rackham. "GeneSwitches: ordering gene expression and functional events in single-cell experiments." Bioinformatics 36.10 (2020): 3273-3275.

Qiu, Xiaojie, et al. “Reversed Graph Embedding Resolves Complex Single-Cell Trajectories.” Nature Methods, vol. 14, no. 10, 2017, pp. 979–982.

0 人点赞