一、共线性分析
所谓共线性,顾名思义,表示二者在一条直线上。基因组的共线性分析也类似,主要是用一种线性图的方式来比较两个或者多个基因组是否具有较好的同源性。共线性可以是核酸水平的共线性,也可以是氨基酸水平。一般氨基酸水平具有更好的同源关系,共线性也更好。
共线性这种图做起来并不难,多种比对软件都可以直接输出这种图,blast 比对可以,Mummer 和 lastz 软件也都可以。例如使用 mummer 软件包进行比对之后,使用软件包中的delta-filter 工具过滤一下 delta 格式的结果。然后直接使用 mummerplot 工具就可以直接生成共线性的比对结果了。后面一种共线性图稍微复杂一些,需要自己写程序生成。
共线性分析
二、利用 nucmer dotPlotly 绘制共线性
代码语言:javascript复制#安装软件
#dotplotly
wget https://github.com/tpoorten/dotPlotly/archive/refs/heads/master.zip
#配置R包
install.packages(c("optparse", "ggplot2", "plotly"))
mkdir 50.synteny;cd 50.synteny
代码语言:javascript复制#利用nucmer dotPlotly绘图
nucmer --maxmatch -l 80 -c 100 ../data/ref.fna ../data/mgh78578.fasta -p nucmer
delta-filter -r nucmer.delta >filter.delta
show-coords -c filter.delta >filter.delta.coords
./dotPlotly-master/mummerCoordsDotPlotly.R -i filter.delta.coords -o filter.delta.plot -m 1000 -q 300000 -k 10 -s -t -l -p 12
用Minimap2 dotPlotly
minimap2 -x asm5 ../data/ref.fna ../data/mgh78578.fasta >minimap2.paf
./dotPlotly-master/pafCoordsDotPlotly.R -i minimap2.paf -o minimap2.plot -m 2000 -q 500000 -k 10 -s -t -l -p 12
写在最后:有时间我们会努力更新的。大家互动交流可以前去论坛,地址在下面,复制去浏览器即可访问,弥补下公众号没有留言功能的缺憾。原地址暂未启用(bioinfoer.com)。
代码语言:javascript复制sx.voiceclouds.cn
有些板块也可以预设为大家日常趣事的分享等,欢迎大家来提建议。