欢迎关注”生信修炼手册”!
对于单细胞转录组数据,通过聚类分析,我们可以得到细胞亚型,再通过差异分析,可以得到不同细胞亚型的marker
基因,结合下游的功能分析,可以让我们对细胞类型和功能有更进一步的认识。
以上这些就是单细胞转录组的基础分析内容,对于识别到的细胞亚型,我们可以进一步研究不同亚型之间的分化和演变的过程。在生物体内,细胞的分化是一个动态过程,会受到到细胞间相互作用,生物分子调控等多种因素的影响,而且每个细胞分化的过程是不同步的,如果将细胞的分化看做一个爬楼梯的过程,同一时间,每个细胞所处的楼层是不同的。
将细胞分化过程看做一条时间线,研究确定每个细胞在该时间线上的位置,就是所谓的pseudotime
分析,也称之拟时分析,或者细胞轨迹cell trajectory
分析。
通过测序我们得到了基因在不同细胞中的表达量数据,后续也是基于表达量的数据去进行拟时分析,通常包含以下3个步骤
1. 筛选基因
基因的选取对于后续分析是非常关键的,不同的基因集会得到完全不同的结果。从定量结果中,可以看到许多基因表达量非常的低,这其中有一部分就是背景噪音,在后续分析时是需要去除的,另外,为了提高分析结果的准确性,我们需要选择有生物学意义的基因,比如marker基因来进行后续的分析。
2. 降维
基因的表达量是一个高维的数据结构,直接基于这样的数据去分析是非常复杂和繁琐的,运算量非常的大,所以需要先降维处理。
3. pseudotime
细胞分化过程和物种进化类似,都是一个树状结构,首先根据表达量的分布构建一个最佳的树状结构,然后确定每个细胞在该树状结构中的位置。
典型的拟时分析的结果示意如下
用一张2D-plot来展示细胞轨迹,所以在分过程中需要降维,图中每个点代表一个细胞,细胞后面的树状结构就是细胞分化的树状结构。
得到了细胞的pseudotime
之后,我们可以根据pseudotime
来进行差异分析,探索细胞分化过程中的重要基因,示意如下
最后可以结合功能富集分析和基因相互作用分析,来挖掘重要的功能基因。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!