R语言之肿瘤进化事件选择的算法实现

2019-07-31 11:20:47 浏览数 (1)

我们今天给大家介绍一个通过人类肿瘤的进化条件所选择的事件介绍。其只设计了Linux下的版本所以我们如果需要安装在windows下还是需要利用devtools进行编译安装。当然,其依赖的包还是需要我们自己去安装。那么我们看下其流程吧。

首先我们安装依赖包:

install.packages('foreach')

install.packages('igraph')

install.packages('doParallel')

source("https://bioconductor.org/biocLite.R")

biocLite("BiRewire")

接下来就是安装我们的SELECT(SelectedEvents Linked by Evolutionary Conditions across human Tumors)包,我们不再赘述。如果不清楚可以参考前面的教程《R语言windows环境下R包的构建与.gz包的导入》。

当然如果你是Linux系统那也不方便,你需要安装高版本的R语言,我们也不赘述了,请参照以前课程《Ubuntu环境下的R语言新版本完整安装教程》

本包的设计者为我们提供了一个帮助文档。

其中我们用的主要函数是select,其主要的函数构成:

其中M的数据结构如下:

Sample.class的数据结构如下:

Alteration.class的数据结构如下:

Folder的主要功能是创建对应的目录进行各步骤数据的保存。

r.seed主要功能是提供随机数的可重复性编码,用于保证试验的可重复性。

n.cores主要的功能是设置运行时调用的运算核数,也就是启动的任务数。

通过以上的参数设置就可以进行下面的运算,将我们的数据按照它的格式进行替换就可以进行运算了。

我们运行了它所带的实例程序,由于本人电脑配置低,对其稍微做了点改动:

require(select)

# Load pancan23 dataset

load('G:/pancan23_dataset/pancan23_gam.RData')

alpi = select(M=pancan23$gam[,c(1:20)],sample.class=pancan23$samples$tumor_subtype, alteration.class=pancan23$alterations$alteration_type, folder='select_pancan23_seed.104/',r.seed = 104, n.cores=2)

我们分别在windows和Linux下进行了运行:

Linux下的运行状态以及结果:

Windows下的运行状态以及结果:

我们运行后所产生的数据结构:

0 人点赞