欢迎关注”生信修炼手册”!
monocle是一个专门用于分析单细胞转录组数据的R包,提供了聚类,pseudotime, 差异分析等多种功能,该项目的网址如下
https://cole-trapnell-lab.github.io/monocle-release/
本文主要介绍使用该R包进行pseudotime分析的步骤,可以分为以下5步
1. 读取数据
monocle
包有很多种读取数据的方式,这里只展示了读取Seurat
中的对象的方法,代码如下
# 加载需要的R包
library(Seurat)
library(monocle)
# 设置cell ranger输出结果目录
input_dir <- "/scRNA/outs/filtered_gene_bc_matrices/GRCh38/"
# 读取数据
pbmc.data <- Read10X(data.dir = input_dir)
# 创建Seurat中的对象
pbmc <- CreateSeuratObject(raw.data = pbmc.data, project = "10X")
# 将Seurat中的对象转换为monocle识别的对象
cds <- importCDS(pbmc)
在monocle
中,用CellDataSet
这种class来存储数据,示意如下
2. 预处理
代码如下
代码语言:javascript复制cds <- estimateSizeFactors(cds)
cds <- estimateDispersions(cds)
第一行代码用于评估每个细胞的sizefactor, 用于后续归一化;第二行代码计算基因的方差。
通过pData
和fData
两个函数,可以查看基因和细胞的相关信息,示意如下
3. 筛选基因
筛选基因没有一个固定标准,可以根据自己的需要灵活选择,这里只展示其中一种
代码语言:javascript复制disp_table <- dispersionTable(cds)
unsup_clustering_genes <- subset(disp_table, mean_expression >= 0.1)
cds <- setOrderingFilter(cds, unsup_clustering_genes$gene_id)
4. 降维分析
使用DDRTree
的方法进行降维分析,代码如下
cds <- reduceDimension(
cds,
max_components = 2,
method = 'DDRTree')
5. psudotime分析
代码如下
代码语言:javascript复制cds <- orderCells(cds)
运行之后,对于每个细胞,会给出一个pseudotime
值,示意如下
可视化的代码如下
代码语言:javascript复制plot_cell_trajectory(cds)
降维之后,在二维空间展示细胞pseudotime的分布,可以看到是一个树状结构,除了上述方法外,还可以根据pseudotime的值给细胞赋颜色,代码如下
代码语言:javascript复制plot_cell_trajectory(cds, color_by = "Pseudotime")
其实就是将fData
中对应的列设置为颜色,如果想要观察不同细胞亚型的分布,可以在fData
中新增一列细胞对应的cluster ID, 然后用这一类来设置颜色。
对于pseudotime分析,我们需要明白它的基本输入就是一张基因在细胞中表达量的表格,与细胞的聚类结果无关,只不过在可视化的时候根据聚类的结果填充了颜色而已。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!