拷贝数分析大家都不陌生, 其可能和表型变异紧密关联,同时在物种的演化和发展中发挥着重要作用。今天我们来介绍一个在R语言环境下运行的拷贝数分析包cn.mops.。
首先我们看下其安装代码:
source("https://bioconductor.org/biocLite.R")
biocLite("cn.mops")
安装成功后我们看下导入成功后的结果:
接下来是数据的读入,我们以R包自带的数据为例:
BAMFiles <-list.files(system.file("extdata",package="cn.mops"),pattern=".bam$", full.names=TRUE)
bamDataRanges <-getReadCountsFromBAM(BAMFiles,sampleNames=paste("Sample",1:3)) #将数据读入并对每一个文件的样本进行命名;
读入后数据结构如下:
通过以上步骤就可以形成我们需要的数据结构,由于上面数据量不够,我们直接利用其自带的数据进行下面的计算,构建包的数据项目:
data(cn.mops)
resCNMOPS <- cn.mops(XRanges)
运行结果如图:
接下来,我们计算各样本的拷贝数,主要的程序如下:
resCNMOPS <-calcIntegerCopyNumbers(resCNMOPS)
我们计算完拷贝数突变情况,接下来就是结果的可视化
首先我们看下样本s_13的reads的计数情况:
segplot(resCNMOPS,sampleIdx=13)#y轴reads数的对数;x轴染色体的分割情况。
plot()
此处的plot并非R语言自带的plot函数,而是此包的函数。主要是展示拷贝数变异位置的。评估分数为正则为红色,为负则为蓝色,样例如下:
plot(resCNMOPS,which=1)
plot(resCNMOPS,which=5)