多个基因集富集结果泡泡图绘制展示

2022-01-18 20:50:38 浏览数 (2)

多个基因集富集结果展示

通常我们会同时对多个基因集分别进行富集分析,结果放在一起展示。这时我们需要在富集结果后面加一列,标记该结果是哪个基因集的富集,在Excel中可以很方便地操作。如下面动图所示,分组的名字自己根据实际取名即可。

有了这个多组基因富集后整合起来的数据,就可以用BIC绘图了。数据粘贴就不展示了,直接看参数选择。

与单组富集结果相比,最大的改动就在:

  • 新增的Group列而非 log_odds_ratio列作为横轴(X-axis)信息

提交后获得结果。图中每个点代表一个富集的条目,在Y轴有对应标记。每一列是一组基因的富集结果。三组共有的富集在最上面,2组共有的富集在中间,每组特有的富集在底部。每个点的大小代表用于分析的基因集中匹配到该通路的基因数目,颜色代表富集程度。

如果希望在显示多组时,依然保留log_odds_ratio的信息,也可以。这里换一套数据更好展示(因为Group2、Group3是模拟数据,直接从Group1中抽取出来的,所以绘制出来会存在重叠)

代码语言:javascript复制
GOID    Ontology    Term    Level    q    m    t    k    log_odds_ratio    p    Group
GO:0006730    biological_process    one-carbon metabolic process    4    340    57    45240    13378    1.012309306    0.001481151    Group1
GO:0007154    biological_process    cell communication    2    2169    6843    45240    13378    0.100137585    0.007326261    Group1
GO:0007165    biological_process    signal transduction    5    1955    6136    45240    13378    0.107606604    0.006325629    Group1
GO:0023052    biological_process    signaling    1    2100    6613    45240    13378    0.102820905    0.006590727    Group1
GO:0044700    biological_process    single organism signaling    2    2100    6613    45240    13378    0.102820905    0.006590727    Group1
GO:0050896    biological_process    response to stimulus    1    3251    10438    45240    13378    0.074846633    0.012472089    Group1
GO:0006730    biological_process    one-carbon metabolic process    4    340    57    45240    13378    1.212309306    0.001481151    Group2
GO:0007154    biological_process    cell communication    2    2169    6843    45240    13378    0.200137585    0.007326261    Group2
GO:0007165    biological_process    signal transduction    5    1955    6136    45240    13378    0.207606604    0.006325629    Group2
GO:0023052    biological_process    signaling    1    2100    6613    45240    13378    0.302820905    0.006590727    Group2
GO:0007165    biological_process    signal transduction    5    1955    6136    45240    13378    0.307606604    0.006325629    Group3
GO:0023052    biological_process    signaling    1    2100    6613    45240    13378    0.202820905    0.006590727    Group3
  • log_odds_ratio列依然作为横轴(X-axis)信息
  • 新增的Group列作为Shape variable,用不同的形状表示不同的组
  • Shape variable order是可选项,调节组的顺序,默认不填写或按需设置都可
  • 修改下颜色,用colorPicker设置,前面工具有介绍

提交后获得结果。图中每个点代表一个富集的条目,在Y轴有对应标记。这些条目按其log_odds_ratio的值排序后展示,log_odds_ratio高的条目在Y轴上方展示;每个点的大小代表用于分析的基因集中匹配到该通路的基因数目,颜色代表富集程度。点的形状则代表其所属的组信息。

但是这个图出现了一个问题,图例显示不全。最简单的解决办法就是把图的宽度和高度调大。

结果就正常了,可以下载PDF版、PPT版(如果选了参数)和对应的R代码

0 人点赞