RNA-seq 详细教程:结果汇总与提取(11)

2023-02-27 12:59:35 浏览数 (1)

学习目标

  1. 评估每次比较产生的差异表达基因的数量
  2. 从每次比较中构建包含重要基因的 R 对象

1. 汇总

为了汇总结果,DESeq2 中一个方便的函数是 summary()。它与用于检查数据帧的函数同名。当使用 DESeq 结果表作为输入调用此函数时,将使用默认阈值 padj < 0.1 汇总结果。但是,由于我们在创建结果表阈值时将 alpha 参数设置为 0.05:FDR < 0.05(即使输出显示 p 值 < 0.05,也使用 padj/FDR)。让我们从 OE 与对照结果开始:

代码语言:javascript复制
summary(res_tableOE, alpha = 0.05)

除了在默认阈值下上调和下调的基因数量外,该函数还报告了被测试的基因数量(总读数非零的基因),以及未包括在多重测试中的基因数量由于平均计数较低而进行的校正。

2. 提取

  • 提取显著差异表达基因

让我们首先创建包含我们的阈值标准的变量。我们只会在我们的标准中使用调整后的 p 值:

代码语言:javascript复制
padj.cutoff <- 0.05

我们可以使用 filter() 函数轻松地对结果表进行子集化以仅包括那些重要的,但首先我们会将结果表转换为小标题:

代码语言:javascript复制
res_tableOE_tb <- res_tableOE %>%
  data.frame() %>%
  rownames_to_column(var="gene") %>% 
  as_tibble()

现在我们可以对该表进行子集化,以仅使用我们预定义的阈值保留重要基因:

代码语言:javascript复制
sigOE <- res_tableOE_tb %>%
        filter(padj < padj.cutoff)


0 人点赞