Varscan检测de novo mutation

2020-05-11 11:34:30 浏览数 (2)

欢迎关注"生信修炼手册"!

de novo mutation 是属于生殖细胞突变中的一类突变,指的是在一个家系中,第一次出现的突变。这个突变在父本中是没有的,只是在子代中第一次出现。

在varscan中,专门有一个子命令trio, 用来分析de novo突变。需要3个bam文件,分别对应faher, mother, child,同时还需要参考基因组的fasta序列。用法如下

第一步:生成mpileup 文件

代码语言:javascript复制
samtools mpileup -B -q 1 -f ref.fasta dad.bam mom.bam child.bam >trio.mpileup

第二步,鉴定de novo 突变

代码语言:javascript复制
java -jar VarScan.jar trio
trio.mpileup 
trio.mpileup.output 
--min-coverage 10 
--min-var-freq 0.20 
--p-value 0.05 
-adj-var-freq 0.05 
-adj-p-value 0.15

varscan首先会使用和mpileup2snp子命令相同的算法分析3个样本中的生殖细胞变异位点,然后会根据子代和父本的分型结果,筛选出不符合孟德尔遗传规律的突变位点,即子代的allel不可能通过父代遗传得到的突变位点,这些位点也称为 Mendelian Inheritance Errors位点,简写为MIE, 对这些的位点的分型结果进行校正,校正过后,如果确实为MIE, 就继续标记为MIE, 如果为一个de novo突变,就标记为de novo突变。

这条命令运行成功之后,会产生如下两个输出文件

代码语言:javascript复制
trio.mpileup.output.snp.vcf
trio.mpileup.output.indel.vcf

分别对应snp和indel两种变异类型的结果,在输出的VCF文件中,如果一个突变位点为MIE, 对应的FILTER字段会标记为mendelError,否则标记为PASS;如果一个突变位点为de novo 突变,对应的INFO字段会标记DENOVO。

需要注意的是,直接分析得到的de novo突变中,还是会存在部分假阳性的位点,需要做进一步的过滤。

1 人点赞