R语言实现拷贝数变异分析

2019-07-31 11:13:19 浏览数 (1)

拷贝数分析大家都不陌生, 其可能和表型变异紧密关联,同时在物种的演化和发展中发挥着重要作用。今天我们来介绍一个在R语言环境下运行的拷贝数分析包cn.mops.。

首先我们看下其安装代码:

source("https://bioconductor.org/biocLite.R")

biocLite("cn.mops")

安装成功后我们看下导入成功后的结果:

接下来是数据的读入,我们以R包自带的数据为例:

BAMFiles <-list.files(system.file("extdata",package="cn.mops"),pattern=".bam$", full.names=TRUE)

bamDataRanges <-getReadCountsFromBAM(BAMFiles,sampleNames=paste("Sample",1:3)) #将数据读入并对每一个文件的样本进行命名;

读入后数据结构如下:

通过以上步骤就可以形成我们需要的数据结构,由于上面数据量不够,我们直接利用其自带的数据进行下面的计算,构建包的数据项目:

data(cn.mops)

resCNMOPS <- cn.mops(XRanges)

运行结果如图:

接下来,我们计算各样本的拷贝数,主要的程序如下:

resCNMOPS <-calcIntegerCopyNumbers(resCNMOPS)

我们计算完拷贝数突变情况,接下来就是结果的可视化

首先我们看下样本s_13的reads的计数情况:

segplot(resCNMOPS,sampleIdx=13)#y轴reads数的对数;x轴染色体的分割情况。

plot()

此处的plot并非R语言自带的plot函数,而是此包的函数。主要是展示拷贝数变异位置的。评估分数为正则为红色,为负则为蓝色,样例如下:

plot(resCNMOPS,which=1)

plot(resCNMOPS,which=5)

0 人点赞