使用UCSC基因组浏览器可视化测序深度分布数据

2019-12-19 15:27:43 浏览数 (1)

欢迎关注”生信修炼手册”!

通过UCSC基因组浏览器,我们不仅可以查看别人已经公布的数据,还可以上传自己的数据进行查看,支持以下bed,vcf,bigwig等多种常见的文件格式,完整的格式列表请参考以下链接

https://genome.ucsc.edu/goldenPath/help/customTrack.html

对于测序深度信息,常用的有bedgraph和bigwig两种格式。对于bigwig格式,UCSC只接受URL链接,不能直接上传文件。这意味着必须先传到一个网盘上再进行分享或者上传自己的web服务器上才行,总之必须先获取一个公开的URL链接,如果有数据保密性的需求,这种格式就不太适合了。

本文主要介绍如何利用UCSC展示bedgraph格式的数据,步骤如下

1. 从bam文件得到bedgraph文件

通过bedtools可以实现,用法如下

代码语言:javascript复制
bedtools  genomecov -ibam input.bam -bg > result.bedgraph
2. 编辑track信息

bedtools输出的bedgraph文件中,只包含了data line, 我们需要手动编辑,在文件的开头添加track line, 声明文件格式,便于UCSC基因组浏览器识别,不然会自动识别为bed格式,同时还可以添加一些基本的属性,调整显示的设置,示例如下

代码语言:javascript复制
track type=bedGraph name=case color=0,128,0 visibility=full priority=20
3. 上传文件

在UCSC的主页上,通过My Data->Custom Tracks, 打开上传文件的链接,示意如下

选择对应的基因组版本,然后选择文件,点击Submit上传,成功后可以看到如下所示的界面

这里我上传了两个样本的数据,也可以根据情况通过add custom tracks继续上传,所有样本的数据上传完成后,点击go按钮,就可以通过基因组浏览器查看数据了,在检索中输入查看的染色体区域信息,示意如下

图中的case和control就是导入的两个样本文件,在track line中设置了不同的颜色。可以看到,在基因组浏览器中,默认还显示了很多内置的track, 可以根据自己的需求,调整每个track的显示情况,在页面下方的控制栏,可以调整每个track的显示方式

UCSC基因组浏览器也是可视化的常用工具之一,使用简单方便,更多高级的展示功能值得深入学习。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

0 人点赞