单细胞转录组之使用CellChat对单个数据集进行细胞间通讯分析

2022-07-13 23:06:02 浏览数 (2)

  • 1.CellChat对象的创建、处理及初始化
    • 1.1 使用Seurat对象创建CellChat对象
    • 1.2 使用表达矩阵创建CellChat对象
    • 1.3 设置配体受体交互数据库
    • 1.4 表达数据的预处理
  • 2.细胞通信网络推断
    • 2.1 计算通信概率并推断cellchat网络
    • 2.2 提取推断的cellchat网络作为数据框架
    • 2.3 在信号通路级别推断细胞-细胞通信
    • 2.4 计算整合的细胞通信网络
  • 3. 细胞通信网络的可视化
    • 3.1 使用层次结构图、圆图或和弦图可视化每个信号通路
    • 3.2 计算每个配体受体对整体信号通路的贡献,并可视化由单个配体受体对调节的细胞通信
    • 3.3 自动保存所有推断网络的模块以进行快速探索
    • 3.4 可视化由多个配体受体或信号通路调节的细胞通信
    • 3.5 使用小提琴/点图绘制信号基因表达分布
  • 4. 细胞通信网络系统分析
    • 4.1 识别细胞组的信号角色(例如,占主导地位的发送器、接收器)以及主要贡献信号
    • 4.2 确定全局通信模式,探索多个细胞类型和信号通路如何协调在一起
    • 4.3 信号网络的多重和分类学习分析
  • 5. 保存cellchat对象

细胞通讯分析可以提供细胞亚群互调控的信息,细胞间的调控主要是通过受体配体结合来实现信号传递的。

这里使用CellChat对单个单细胞数据集进行细胞间通讯分析

1.CellChat对象的创建、处理及初始化

创建CellChat对象需要两个文件:1.细胞的基因表达数据,可以直接是Seurat 或者 SingleCellExperiment 对象;2.用户分配的细胞标签(即基于标签的模式)或单细胞数据的低维表示(即无标签模式)。对于后者,CellChat 通过根据低维空间或伪时间轨迹空间中的细胞距离构建共享的邻近图自动对细胞进行分组。

1.1 使用Seurat对象创建CellChat对象

代码语言:txt复制
#加载包
library(CellChat)
library(ggplot2)
library(ggalluvial)
library(svglite)
library(Seurat)
library(SeuratData)
options(stringsAsFactors = FALSE)
#加载之前跑完Seurat标准流程的数据
load(file = 'sce-monocyte.Rdata')

cellchat<-createCellChat(sce)

str(cellchat)

 [1] "Formal class 'CellChat' [package "CellChat"] with 14 slots"                                                        
 [2] "  ..@ data.raw      : num[0 , 0 ] "                                                                                  
 [3] "  ..@ data          :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots"                                     
 [4] "  .. .. ..@ i       : int [1:615321] 11 26 33 43 52 57 73 98 130 142 ..."                                            
 [5] "  .. .. ..@ p       : int [1:643] 0 960 1510 2568 3990 4867 6408 7776 8793 9810 ..."                                 
 [6] "  .. .. ..@ Dim     : int [1:2] 13714 642"                                                                           
 [7] "  .. .. ..@ Dimnames:List of 2"                                                                                      
 [8] "  .. .. .. ..$ : chr [1:13714] "AL627309.1" "AP006222.2" "RP11-206L10.2" "RP11-206L10.9" ..."                
 [9] "  .. .. .. ..$ : chr [1:642] "AAACCGTGCTTCCG-1" "AAACGCTGTTTCTG-1" "AAAGAGACGCGAGA-1" "AAAGCAGATATCGG-1" ..."
[10] "  .. .. ..@ x       : num [1:615321] 3.56 1.57 2.52 1.57 1.57 ..."                                                   
[11] "  .. .. ..@ factors : list()"                                                                                        
[12] "  ..@ data.signaling: num[0 , 0 ] "                                                                                  
[13] "  ..@ data.scale    : num[0 , 0 ] "                                                                                  
[14] "  ..@ data.project  : num[0 , 0 ] "                                                                                  
[15] "  ..@ net           : list()"                                                                                        
[16] "  ..@ netP          : list()"                                                                                        
[17] "  ..@ meta          :'data.frame':t642 obs. of  7 variables:"                                                       
[18] "  .. ..$ orig.ident     : Factor w/ 1 level "pbmc3k": 1 1 1 1 1 1 1 1 1 1 ..."                                     
[19] "  .. ..$ nCount_RNA     : num [1:642] 2639 1103 3033 4584 2683 ..."                                                  
[20] "  .. ..$ nFeature_RNA   : int [1:642] 960 550 1058 1422 877 1541 1368 1017 1017 822 ..."                             
[21] "  .. ..$ percent.mt     : num [1:642] 1.74 2.9 1.42 1.4 2.5 ..."                                                     
[22] "  .. ..$ RNA_snn_res.0.5: Factor w/ 9 levels "0","1","2","3",..: 2 6 2 2 2 6 6 2 2 2 ..."                    
[23] "  .. ..$ seurat_clusters: Factor w/ 9 levels "0","1","2","3",..: 2 6 2 2 2 6 6 2 2 2 ..."                    
[24] "  .. ..$ ident          : Factor w/ 2 levels "CD14  Mono","FCGR3A  Mono": 1 2 1 1 1 2 2 1 1 1 ..."               
[25] "  ..@ idents        : Factor w/ 2 levels "CD14  Mono","FCGR3A  Mono": 1 2 1 1 1 2 2 1 1 1 ..."                   
[26] "  ..@ DB            : list()"                                                                                        
[27] "  ..@ LR            : list()"                                                                                        
[28] "  ..@ var.features  : list()"                                                                                        
[29] "  ..@ dr            : list()"                                                                                        
[30] "  ..@ options       :List of 1"                                                                                      
[31] "  .. ..$ mode: chr "single""                                               

1.2 使用表达矩阵创建CellChat对象

代码语言:txt复制
# 加载scRNA-seq 数据矩阵及其meta数据
load(url("https://ndownloader.figshare.com/files/25950872")) # 该数据集包含两组: 正常组和疾病组
data.input = data_humanSkin$data # 标准化过的矩阵
meta = data_humanSkin$meta 
cell.use = rownames(meta)[meta$condition == "LS"] # 从疾病组中提取细胞名

# 整理数据:将疾病组单细胞数据提取出来
data.input = data.input[, cell.use]
meta = meta[cell.use, ]
# meta = data.frame(labels = meta$labels[cell.use], row.names = colnames(data.input)) # 手动创建包含细胞labels的数据框
unique(meta$labels) # check the cell labels

cellchat <- createCellChat(object = data.input, meta = meta, group.by = "labels")
#从表达矩阵创建CellChat对象
#添加亚群信息
cellchat <- addMeta(cellchat, meta = meta)
cellchat <- setIdent(cellchat, ident.use = "labels") 
levels(cellchat@idents) 
groupSize <- as.numeric(table(cellchat@idents)) # 每个亚群细胞数

1.3 设置配体受体交互数据库

CellChatDB 是一个手动整理的文献支持的配体受体在人和小鼠中的交互数据库。小鼠中的CellChatDB包含2021个经验证的分子相互作用,包括60%的自分泌/旁分泌信号相互作用、21%的细胞外基质(ECM)受体相互作用和19%的细胞-细胞接触相互作用。人的CellChatDB包含1939个经验证的分子相互作用,包括61.8%的自分泌/旁分泌信号相互作用、21.7%的细胞外基质(ECM)受体相互作用和16.5%的细胞-细胞接触相互作用。

代码语言:txt复制
CellChatDB <- CellChatDB.human 
# 如果是小鼠数据,使用CellChatDB.mouse
showDatabaseCategory(CellChatDB)
代码语言:txt复制
#查看下数据库结构
dplyr::glimpse(CellChatDB$interaction)

Rows: 1,939
Columns: 11
$ interaction_name   <chr> "TGFB1_TGFBR1_TGFBR2", "TG…
$ pathway_name       <chr> "TGFb", "TGFb", "TGFb", "T…
$ ligand             <chr> "TGFB1", "TGFB2", "TGFB3",…
$ receptor           <chr> "TGFbR1_R2", "TGFbR1_R2", …
$ agonist            <chr> "TGFb agonist", "TGFb agon…
$ antagonist         <chr> "TGFb antagonist", "TGFb a…
$ co_A_receptor      <chr> "", "", "", "", "", "", ""…
$ co_I_receptor      <chr> "TGFb inhibition receptor"…
$ evidence           <chr> "KEGG: hsa04350", "KEGG: h…
$ annotation         <chr> "Secreted Signaling", "Sec…
$ interaction_name_2 <chr> "TGFB1 - (TGFBR1 TGFBR2)",…


# 使用数据库中的自分泌/旁分泌信号相互作用部分进行后续分析,可根据试验方案、目的选择
CellChatDB.use <- subsetDB(CellChatDB, search = "Secreted Signaling") 
# 使用数据库所有内容进行分析
# CellChatDB.use <- CellChatDB 

# 在cellchat对象中设置使用的数据库
cellchat@DB <- CellChatDB.use

1.4 表达数据的预处理

为了推断细胞的通讯状态,首先识别一个细胞组中过度表达的配体或受体,然后识别过度表达的配体受体相互作用。

还可以将基因表达数据投影到蛋白质-蛋白质相互作用 (PPI) 网络上。投影过程根据实验验证的蛋白质-蛋白质网络中定义的基因表达值来平滑基因的表达值。此功能在分析具有浅测序深度的单细胞数据时很有用,因为投影可减少信号基因的dropput效应,特别是对于配体/受体的可能的零表达。用户可以通过在computeCommunProb()中设置raw.use = TRUE跳过此步骤。

代码语言:txt复制
cellchat <- subsetData(cellchat) 
# subset the expression data of signaling genes for saving computation cost

#设置并行运算
future::plan("multicore", workers = 40) 
#识别细胞组中过度表达的配体或受体
cellchat <- identifyOverExpressedGenes(cellchat)
#识别过度表达的配体受体相互作用
cellchat <- identifyOverExpressedInteractions(cellchat)
#将基因表达数据投射到PPI网络上
cellchat <- projectData(cellchat, PPI.human)

2.细胞通信网络推断

CellChat 通过将基因表达与先前已知的信号配体、受体及其同因子之间的相互作用知识相结合,利用大量作用规律,对细胞-细胞通信的概率进行模拟。为每个相互作用分配一个概率值并进行置换检验,来推断具有生物学意义的细胞-细胞通信。

推断的配体受体对的数量显然取决于计算每个细胞组平均基因表达的方法。默认情况下,CellChat 使用一种统计学上强大的均值方法,称为"trimean",与其他方法相比,它产生的相互作用更少。然而,我们发现 CellChat 在预测更强的交互方面表现良好,这非常有助于缩小交互范围,以便进一步进行实验验证。在computeCommunProb中,我们提供了一个选项,用于使用其他方法,如5%和10%截断均值,来计算平均基因表达。值得注意的是,"trimean"大约是25%的截断平均值,这意味着如果一组表达细胞的百分比低于25%,则平均基因表达为零。要使用 10% 截断的平均值,用户可以设置type = "truncatedMean"和对trim = 0.1。在分析未分类的单细胞转录组时,假设丰富的细胞群倾向于发送比稀有细胞群更强的信号,CellChat 还可以在概率计算中考虑每个细胞组中细胞比例的影响。用户可以设置population.size = TRUE2.1 计算通信概率并推断cellchat网络

代码语言:txt复制
cellchat <- computeCommunProb(cellchat, raw.use = TRUE)
# 如果在某些细胞群中只有少数细胞,则过滤掉细胞间的通信
cellchat <- filterCommunication(cellchat, min.cells = 10)

2.2 提取推断的cellchat网络作为数据框架

我们提供一个函数subsetCommunication,以轻松访问推断感兴趣的细胞-细胞通信。例如df.net <- subsetCommunication(cellchat)返回一个数据框架,该数据框架由配体/受体级别的所有推断细胞通信组成。设置slot.name = "netP"可以在信号通路级别访问推断的通信 df.net <- subsetCommunication(cellchat, sources.use = c(1,2), targets.use = c(4,5))将推断的细胞-细胞通信从细胞组1和2发送到细胞组4和5。 df.net <- subsetCommunication(cellchat, signaling = c("WNT", "TGFb"))通过向WNT和TGFb发出信号来调节推断的细胞通信。

2.3 在信号通路级别推断细胞-细胞通信

CellChat 通过总结与每个信号通路相关的所有配体-受体相互作用的通讯概率,来计算信号通路级别上的通讯概率。

每个配体受体对和每个信号通路的推断细胞间通信网络分别存储在插槽"net"和"netP"中。

代码语言:txt复制
cellchat <- computeCommunProbPathway(cellchat)

2.4 计算整合的细胞通信网络

通过计算链接数或汇总通信概率来计算通信网络

代码语言:txt复制
cellchat <- aggregateNet(cellchat)

可视化整合的细胞通信网络。 使用圆图显示任意两个细胞组之间的相互作用次数或总交互强度(比重)。

代码语言:txt复制
groupSize <- as.numeric(table(cellchat@idents))
par(mfrow = c(1,2), xpd=TRUE)

netVisual_circle(cellchat@net$count, vertex.weight = groupSize, weight.scale = T, label.edge= F, title.name = "Number of interactions")

netVisual_circle(cellchat@net$weight, vertex.weight = groupSize, weight.scale = T, label.edge= F, title.name = "Interaction weights/strength")

由于细胞通信网络较为复杂,我们可以检查每个细胞组发送的信号。在这里,我们还控制参数edge.weight.max,以便我们可以比较不同网络之间的边缘权重。

代码语言:txt复制
mat <- cellchat@net$weight
par(mfrow = c(3,4), xpd=TRUE)
for (i in 1:nrow(mat)) {
  mat2 <- matrix(0, nrow = nrow(mat), ncol = ncol(mat), dimnames = dimnames(mat))
  mat2[i, ] <- mat[i, ]
  netVisual_circle(mat2, vertex.weight = groupSize, weight.scale = T, edge.weight.max = max(mat), title.name = rownames(mat)[i])
}

3. 细胞通信网络的可视化

CellChat提供了几种可视化细胞通信网络的方法,包括分层图、圆图、和弦图和气泡图。还提供了一个易于使用的工具,用于提取和可视化推断网络的高阶信息。例如,它允许对细胞群的主要信号输入和输出以及这些群和信号如何协调功能进行现成预测。CellChat可以通过结合通讯网络分析、模式识别和多重学习方法,使用综合方法对推断出的细胞-细胞通信网络进行定量表征和比较。

3.1 使用层次结构图、圆图或和弦图可视化每个信号通路

层次结构图: 用户应定义vertex.receiver,这是一个数字矢量,将细胞群的索引作为层次图左侧的目标。此分层图由两个部分组成:左部分显示自分泌和旁分泌向某些感兴趣的细胞组(即定义的)发出信号,右部分显示自分泌和旁分泌向数据集中剩余的细胞组发出信号。因此,层级图提供了一种信息性和直观的方式来可视化自分泌和旁分泌信号之间的细胞群之间的感兴趣通信。例如,在研究成纤维细胞和免疫细胞之间的细胞-细胞通信时,用户可以定义为所有成纤维细胞组。和弦图: CellChat 提供两种功能netVisual_chord_cell和netVisual_chord_gene,并可视化具有不同目的和不同级别的细胞通信。netVisual_chord_cell用于可视化不同细胞群之间的细胞-细胞通信(和弦图中的每个部分是细胞组),netVisual_chord_gene用于可视化由多个配体受体或信号通路调节的细胞-细胞通信(和弦图中的每个部分都是配体、受体或信号通路)。边缘颜色/权重、节点颜色/大小/形状的解释: 在所有可视化图中,边缘颜色与发送者源一致,边缘权重与交互强度成正比。较厚的边缘线表示信号更强。在层次结构图和圆图中,圆的大小与每个细胞组中的细胞数量成正比。在层次图中,实心和开放的圆分别代表源和目标。在和弦图中,内条颜色表示从相应的外条接收信号的目标。内条大小与目标接收的信号强度成正比。这种内条有助于解释复杂的和弦图。请注意,有一些内条没有与任何一些细胞组链接,请忽略它,因为这是一个本包尚未解决的问题。不同层次的细胞通信可视化: 可以使用netVisual_aggregate可视化信号通路的推断通信网络,并使用netVisual_individual可视化与该信号通路相关的单个L-R对的推断通信网络。

以输入一个信号通路为例。所有显示重要通信的信号通路均可通过cellchat@netP$pathways获取。

代码语言:txt复制
pathways.show <- c("CXCL") 

netVisual_aggregate(cellchat, signaling = pathways.show)
代码语言:txt复制
# 和弦图
par(mfrow=c(1,1))
netVisual_chord_cell(cellchat, signaling = pathways.show, title.name = paste0(pathways.show, " signaling network"))
代码语言:txt复制
# 热图
par(mfrow=c(1,1))
netVisual_heatmap(cellchat, signaling = pathways.show, color.heatmap = "Reds")

3.2 计算每个配体受体对整体信号通路的贡献,并可视化由单个配体受体对调节的细胞通信

代码语言:txt复制
netAnalysis_contribution(cellchat, signaling = pathways.show)

还可以可视化由单个配体受体对调节的细胞-细胞通信。函数extractEnrichedLR来提取给定信号通路的所有重要相互作用(L-R对)和相关信号基因。

代码语言:txt复制
pairLR.CXCL <- extractEnrichedLR(cellchat, signaling = pathways.show, geneLR.return = FALSE)
LR.show <- pairLR.CXCL[1,] # show one ligand-receptor pair

netVisual_individual(cellchat, signaling = pathways.show,  pairLR.use = LR.show)
#同样可以用热图(netVisual_heatmap)和和弦图(netVisual_chord_cell)展示

3.3 自动保存所有推断网络的模块以进行快速探索

可以使用‘for … loop’自动保存所有推断网络快速探索使用。netVisual,netVisual支持svg、png和pdf格式的输出。

代码语言:txt复制
# 所有显著的信号通路
pathways.show.all <- cellchat@netP$pathways
# 检查细胞排序,选择合适的受配体
levels(cellchat@idents)
vertex.receiver = seq(1,4)
for (i in 1:length(pathways.show.all)) {
  # Visualize communication network associated with both signaling pathway and individual L-R pairs
  netVisual(cellchat, signaling = pathways.show.all[i], vertex.receiver = vertex.receiver, layout = "hierarchy")
  # Compute and visualize the contribution of each ligand-receptor pair to the overall signaling pathway
  gg <- netAnalysis_contribution(cellchat, signaling = pathways.show.all[i])
  ggsave(filename=paste0(pathways.show.all[i], "_L-R_contribution.pdf"), plot=gg, width = 3, height = 2, units = 'in', dpi = 300)
}

3.4 可视化由多个配体受体或信号通路调节的细胞通信

气泡图

可以使用netVisual_bubble显示从某些细胞组到其他细胞组的所有重要相互作用(L-R对)。

代码语言:txt复制
# 显示从某些细胞组到其他细胞组的所有显著的相互作用(L-R 对)
netVisual_bubble(cellchat, sources.use = 4, targets.use = c(5:11), remove.isolate = FALSE)
#去掉sources.use = 4, targets.use = c(5:11)展示的是所有组的相互通讯
代码语言:txt复制
# 显示从某细胞组到其他细胞组的某个通路的相互作用(L-R 对)
netVisual_bubble(cellchat, sources.use = 4, targets.use = c(5:11), signaling = c("CCL","CXCL"), remove.isolate = FALSE)

和弦图

显示从某些细胞组到其他细胞组的所有相互作用(L-R对或信号通路)。两个特殊情况:一个显示从一个细胞组发送的所有交互,另一个显示一个细胞组接收的所有交互;显示用户输入的交互或用户定义的某些信号通路

代码语言:txt复制
#显示从某些细胞组到其他细胞组的所有显著的相互作用(L-R 对)
netVisual_chord_gene(cellchat, sources.use = 4, targets.use = c(5:11), lab.cex = 0.5,legend.pos.y = 30)
#同气泡图一样,和弦图也可以通过调整sources.use 、targets.use及signaling展示不同的通路,如果基因名称重叠,可以通过降低small.gap值来调整参数。

3.5 使用小提琴/点图绘制信号基因表达分布

可以利用Seurat 包装的函数plotGeneExpression绘制与L-R对或信号通路相关的信号基因的基因表达分布图。

代码语言:txt复制
plotGeneExpression(cellchat, signaling = "CXCL")

默认情况下,可以通过plotGeneExpression只显示与推断的重要通信相关的信号基因的表达,或者,用户可以使用extractEnrichedLR提取与推断的L-R对或信号通路相关的信号基因,然后使用Seurat包绘制基因表达图。

代码语言:txt复制
plotGeneExpression(cellchat, signaling = "CXCL", enriched.only = FALSE)

4. 细胞通信网络系统分析

为了便于对复杂的细胞间通信网络进行解释,CellChat 通过从图形理论、模式识别和多重学习中抽象的方法对网络进行量化。它可以使用网络分析的集中度措施确定给定信号网络中的主要信号源和目标以及调节者和影响者 它可以通过利用模式识别方法预测特定细胞类型的关键传入和传出信号,以及不同细胞类型之间的协调响应。 它可以通过定义相似度测量方法和从功能和拓扑角度进行多重学习来分组信号通路。 它可以通过对多个网络的联合多重学习来描绘保存上下文特定的信号通路。4.1 识别细胞组的信号角色(例如,占主导地位的发送器、接收器)以及主要贡献信号

CellChat 允许通过计算每个细胞组的多个网络中心测量,随时识别细胞间通信网络中占主导地位的发送者、接收者、调解者和影响者。具体来说,我们在加权导向网络中采用了措施,包括度外、度内、介于两者之间流动和信息集中度,分别识别细胞间通信的主要发送者、接收者、调解者和影响者。在以权重为计算通信概率的加权定向网络中,将外向度计算为来自细胞组的传出信号的通信概率之和,并计算为传入信号对单元组通信概率的总和的度内,可用于分别识别信号网络的主要单元件发送器和接收器。有关信息中心之间流动的定义,请查看参考文献1及参考文献2。

计算和可视化网络中心分数

代码语言:txt复制
cellchat <- netAnalysis_computeCentrality(cellchat, slot.name = "netP") # “netP”:推断出的信号通路的细胞间通信网络
#使用热图可视化计算的中心性得分,以便及早识别细胞群的主要信号作用
netAnalysis_signalingRole_network(cellchat, signaling = pathways.show, width = 8, height = 2.5, font.size = 10)

在 2D 空间中可视化占主导地位的发送器(源)和接收器(目标)

使用散点图在 2D 空间中可视化占主导地位的发射器(源)和接收器(目标)。

x轴和y轴分别为与每个单元组相关的总传出或传入通信概率。点的大小与每个单元组关联的推断链接(包括传出链接和传入链接)的数量成正比。点的颜色表示不同的细胞群。如果定义了“组”,点形状表示单元格组的不同类别。

代码语言:txt复制
# 聚合细胞-细胞通信网络中所有信号通路的信号作用分析
gg1 <- netAnalysis_signalingRole_scatter(cellchat)

# 感兴趣的细胞-细胞通信网络的信号作用分析
gg2 <- netAnalysis_signalingRole_scatter(cellchat, signaling = c("CXCL", "CCL"))

gg1   gg2

识别对某些细胞组的传出或传入信号贡献最大的信号

代码语言:txt复制
#识别所有信号对某些细胞组的传出或传入的贡献
ht1 <- netAnalysis_signalingRole_heatmap(cellchat, pattern = "outgoing")
ht2 <- netAnalysis_signalingRole_heatmap(cellchat, pattern = "incoming")
ht1   ht2
代码语言:txt复制
# #识别所有信号对某些细胞组的传出或传入的贡献
ht <- netAnalysis_signalingRole_heatmap(cellchat, signaling = c("CXCL", "CCL"))

4.2 确定全局通信模式,探索多个细胞类型和信号通路如何协调在一起

除了探索单个通路的详细通信外,一个重要问题是多个细胞组和信号通路如何协调功能。CellChat 采用模式识别方法识别全局通信模式。随着模式数量的增加,可能会有多余的模式,因此很难解释通信模式。我们选择了五种模式作为默认模式。一般来说,它具有生物学意义,模式数量要大于2。此外,我们还提供了一个函数selectK来推断模式的数量,该数基于 NMF R 包中已实施的两个指标Cophenetic和Silhouette。这两个指标都根据共识矩阵的分层聚类来衡量特定数量模式的稳定性。对于一系列模式,适当的模式数量是Cophenetic 和 Silhouette值开始突然下降的模式。

识别和可视化分泌细胞的传出通信模式

传出模式揭示了发送者细胞(即作为信号源的细胞)如何相互协调,以及它们如何与某些信号通路协调以驱动通信。为了直观地显示潜在模式与细胞群和配体受体对或信号通路的关联,我们使用了河流(冲积)图。我们首先将每行 W 和 H 的每列标准化为 0,1,然后在 W 和 H 中设置为零,如果它们小于 0.5。这种阈值允许发现与每个推断模式相关的最丰富的细胞组和信号通路,即每个细胞组或信号通路仅与一个推断模式相关联。这些阈值矩阵 W 和 H 用作创建冲积图的输入。为了将细胞群与其丰富的信号通路直接联系起来,如果 W 和 H 中的元素少于 1/R(R 是潜在模式数),则我们将它们中的元素设置为零。通过使用不太严格的阈值,可以获得与每个细胞组相关的更丰富的信号通路。我们使用每个细胞组对通过乘以 W 乘以 H 计算的每个信号通路的贡献分数,构建了一个点图,其中点大小与贡献分数成正比,以显示细胞组与其丰富信号通路之间的关联。用户还可以降低参数cutoff,以显示每个细胞组关联的更丰富的信号通路。

代码语言:txt复制
#加载需要的包
library(NMF)
library(ggalluvial)

运行selectK推断模式的数量

代码语言:txt复制
#我们根据在NMF R包中实现的两个指标推断出模式的数量,这两个指标包括Cophenetic和Silhouette。这两个度量标准都是基于共识矩阵的层次聚类来衡量特定数量的模式的稳定性。对于一个模式数量范围,一个合适的模式数量是Cophenetic和Silhouette值开始突然下降的那个。
selectK(cellchat, pattern = "outgoing")

当传出模式数为 3 时,Cophenetic 和Silhouette值都开始突然下降。

代码语言:txt复制
nPatterns = 3
cellchat <- identifyCommunicationPatterns(cellchat, pattern = "outgoing", k = nPatterns)

河流图

代码语言:txt复制
netAnalysis_river(cellchat, pattern = "outgoing")

点图

代码语言:txt复制
netAnalysis_dot(cellchat, pattern = "outgoing")

识别和可视化目标细胞的传入通信模式

传入模式显示目标细胞(即信号接收器中的细胞)如何相互协调,以及它们如何与某些信号通路协调以响应传入的信号。

代码语言:txt复制
selectK(cellchat, pattern = "incoming")

当传入模式的数量为 4 时,Cophenetic 值开始下降。

代码语言:txt复制
nPatterns = 4
cellchat <- identifyCommunicationPatterns(cellchat, pattern = "incoming", k = nPatterns)

河流图

代码语言:txt复制
netAnalysis_river(cellchat, pattern = "incoming")

点图

代码语言:txt复制
netAnalysis_dot(cellchat, pattern = "incoming")

4.3 信号网络的多重和分类学习分析

CellChat 能够量化所有重要信号通路之间的相似性,然后根据其CellChat 网络的相似性对其进行分组。分组可以基于功能或结构相似性进行。功能相似性:功能相似度高表示主要发送器和接收器相似,可解释为两个信号通路或两个配体受体对具有相似的作用。功能相似性分析要求两个数据集之间的细胞群组成相同。结构相似性:结构相似性用于比较其信号网络结构,而不考虑发送器和接收器的相似性。

根据信号组的功能相似性识别信号组

代码语言:txt复制
cellchat <- computeNetSimilarity(cellchat, type = "functional")
cellchat <- netEmbedding(cellchat, type = "functional")
#Error in runUMAP(Similarity, min_dist = min_dist, n_neighbors = n_neighbors,  : 
  Cannot find UMAP, please install through pip (e.g. pip install umap-learn or reticulate::py_install(packages = 'umap-learn')).

#解决方案:
library(reticulate)
py_available()
reticulate::py_install(packages = 'umap-learn')
#之后再运行,如若还是报错,重启R
cellchat <- netEmbedding(cellchat, type = "functional")

cellchat <- netClustering(cellchat, type = "functional")

netVisual_embedding(cellchat, type = "functional", label.size = 3.5)

# netVisual_embeddingZoomIn(cellchat, type = "functional", nCol = 2)

基于结构相似性识别信号组

代码语言:txt复制
cellchat <- computeNetSimilarity(cellchat, type = "structural")
cellchat <- netEmbedding(cellchat, type = "structural")

cellchat <- netClustering(cellchat, type = "structural")

netVisual_embedding(cellchat, type = "structural", label.size = 3.5)
代码语言:txt复制
netVisual_embeddingZoomIn(cellchat, type = "structural", nCol = 2)

5. 保存CellChat对象

以便后续使用

代码语言:txt复制
saveRDS(cellchat, file = "cellchat_humanSkin_LS.rds")

参考来源

CellChat-github

CellChat三部曲1:使用CellChat对单个数据集进行细胞间通讯分析

运行cellchat分析时遇到的一些问题

致谢

I thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.

THE END

0 人点赞