大家对转录本测序已经耳濡目染,但是我们由于当时组织的选择并不能做到100% 的肿瘤,因为比例很小也就直接忽略了。为此,很多学者就在研究相关的算法旨在解决这个问题。我们今天就为大家介绍一个在R语言中实现的对样本测序的反卷积算法。我们引用作者文章(Wang Z, Cao S, Morris J S, et al. Transcriptome Deconvolutionof Heterogeneous Tumor Samples with Immune Infiltration[J]. iScience, 2018, 9:451-460.)中的图形摘要做个简单的描述:
从上图我们可以直观看出此模型主要是基于参考数据对输入的样本表达数据进行各部分比例的计算。为此他们构建一个R包DeMixT。
接下来我们就为大家介绍下此包的如何使用。首先是包的安装,这需要我们先安装devtools然后借助gitHUB源安装:
代码语言:javascript复制devtools::install_github("wwylab/DeMixTallmaterials/DeMixT_0.2")(已安装openMPI)devtools::install_github("wwylab/DeMixTallmaterials/DeMixT_0.2.1")(未安装openMPI)
包中主要的函数也就是DeMixT。
其中主要的参数:
Data.Y 主要是样本表达数据的矩阵。
Data.comp1,data.comp2主要是指的构成部分表达矩阵。
if.filter 判断是否需要筛选用于评估的基因。默认是TRUE 会筛选的。
Nthread 调用的核数。此参数只有在开启openMPI才会起作用。当然在文中作者也给出了MPI不同情况下的运算时间差别。
接下来我们看下此函数的应用实例:
代码语言:javascript复制data(test.data1) res<- DeMixT(data.Y = test.data1$y, data.comp1 = test.data1$comp1, if.filter =FALSE, output.more.info = TRUE)
其中主要的参数信息:
Pi 指的所计算的构成部分在每个样本的比例。最多两个pi1,pi2,第三个直接就是1-pi1-pi2。
ExprT 未知的部分的表达矩阵。
ExprN1 去卷积后的第一部分表达矩阵。
Pi.iter 每次迭代每个样本中已知部分评估比例。
Gene.name 主要是筛选后的基因列表。如果没有筛选那就是所用基因列表。