各位科研芝士的朋友,大家好,前面一讲给大家分享了如何借助maftools工具实现对SNP数据的可视化操作,今天我们继续剖析该包的其他用法。还记得上次我们提到的oncoplot函数吗?该函数可以可视化突变频率最高的基因并进行展示,比如想绘制前20个突变基因呢如下(数据源同上一期):
结果如下:
接着问题来了,如果我们想对指定的基因进行突变频率可视化呢?该怎么操作呢?
这个时候我们需要借助oncoplot的genes参数,比如我们向可视化TTN,IDH2,TET2,NRAS,TP53,SMC3这几个基因,那命令行则如下:
结果如下:
你会发现指定的基因排序是按照突变频率由高到低进行排列,如果你不想改变基因的排列顺序,则可以增加一个参数,如下:
结果如下:
除此之外,我们还可以使用oncostrip函数进行可视化任意基因,如下:
转换和颠换数据可视化
前面在讲解SNP基础的时候,我们讲到转换则是嘌呤变嘌呤或者嘧啶变嘧啶,颠换则是异型碱基的置换,一个嘌呤被另外一个嘧啶替换或一个嘧啶被另外一个嘌呤置换,即嘌呤变嘧啶,或者嘧啶变嘌呤。
那么在maf文件里面这些信息也是可以进行展示的,需要借助titv函数将snp分类为转换和转换,并进行展示。
命令如下:
结果如下:Ti代表转换,Tv代表颠换,我们可以发现Ti是Tv的3倍,一般情况下发生转换和颠换频率是2:1。
看到这,我们好像没把临床数据加载进来,这个时候我们可以将临床数据进行加载进去,还是同样的操作,同样采用内置的急性髓性白血病为例子,读进数据如下:
可以看到我们同样借助read.maf函数进行操作,只不过在clinicalData参数后面赋值了laml.clin而已,这个时候的laml对象则涵盖了maf文件同时还包括了临床数据。这个时候我们在进行绘制瀑布图,如下:
代码语言:javascript复制可以看到我们是可视化了两个临床特征,分别为FAB_classification和
代码语言:javascript复制Overall_Survival_Status,结果如下:
代码语言:javascript复制
Ok,今天的教程主要是带大家继续采用maftools对maf文件进行处理,希望大家能到学会如何使用maftools,谢谢大家。
后台回复:“snp”,获取代码
·end·