Circos入门_circor

2022-11-16 11:53:22 浏览数 (3)

大家好,又见面了,我是你们的朋友全栈君。

是那个基于perl的Circos

Mac/Linux的安装可以参考之前的文章【传送门

Window安装会有点麻烦

01

官网教程必读内容

这不是一个手把手教程,所以如果想解circos的使用,推荐以下官网内容。

第0章 Installation and Configuration

3. Configuration Files – Syntax, Colors, Fonts and Units 4. Colors 5. Data Files

这一章能让你对circos的语法,所需文件,配置文件有所了解。

第1章Quick Start

1. Hello World 2. Ticks & Labels 3. Ideogram Selection, Scale, Color & Orientation 4. Links & Rules 5. Histograms 6. Axes & Backgrounds 7. Heat Maps & Colors 8. Text 9. Automation & Macros

这一个章会带你将基本流程过一遍,循序渐进,每一个小节都是基于之前生成的图,增加新的元素,学起来很轻松。第9节是一个高级的用法,有一点类似于做for循环,可以暂时略过。过完这一章之后,基本就理解circos的原理了。每个元素的设置可以等用到的时候再看前往相应的教程。

第8章Recipes

19. Cortical Maps—Connectograms

因为大部分的例子都是chromosome的,这里介绍了如何画Cortical map的方法,需要在这里了解所需的文件格式

注意:他们提供了一个perl的脚本,帮你把结果转化成circos所需的文件。挣扎几下之后运行成功了,不过发现此代码只适用于左右一 .一对应的模板(比如AAL)。所以需要自己写code,可以用任何熟悉的语言,python/R/Matlab,将要呈现的结果转成circos所需的格式。

最好的学习方式是自己下载教程,边运行代码边学习。推荐VS code,设置三个窗口,左上的窗口调试代码,修改你想测试的参数,右边的窗口显示图片,下面是terminal,执行circos的命令。这样你可以几乎实时看到修改参数的效果。

理解力超强的童鞋,也可以直接看网页版的Configuration。这里的内容更像是给用户的速查手册。

02

基本概念和文件形式

看完必看教程后,会发现Circos比想象中的容易,软件作者已经把轮子都造好了,需要做的就是把数据做成软件所需要的格式,调整参数即可。由于旁支末节太多,如果面面俱到的写跟翻译没什么区别了,所以这里只记录一些关键的信息。官网提供的教程是最好的参考。

1

ideogram

一般是最外面的那一圈默认使用chromosome,如需使用network/nodes时需要自定义ideogram的文件。它起到的是reference的作用,比如一个ROI呈现在9点钟方向,那么之后这个ROI相应的数据(内圈)也会呈现在9点钟方向。

文件格式如下

chromosome就是network,band就是network中的ROI/node,最后一列是自定义颜色的名称,也可以用circos内置的颜色名称。如果使用了自定义的颜色,需要将颜色的配置写进circos.conf中。中间的数字是chromosome(network)和band(node)的长度,使用统一的unit即可。

这文件做好保存为segment.txt放在data文件夹中。

在之后的主配置文件中定义karyotype为我们制作的ideogram即可,注意这里用的unit是100,需要和chromosome/band的unit对应的。

ideogram的配置文件定义的是ideogram的呈现方式。

2

2D tracks

每一圈添加的元素,可以是heatmap/text/histogram/scatter/line,数据格式和用法都大同小异。注意以下几点即可

  • 每个track用<plot></plot>封装
  • 所有的track使用<plots></plots>封装
  • 使用相对位置(r)定义它相对于ideogram的起始位置
  • 使用绝对位置(p)定义它相对于整个画布的起始位置
  • 如果你设置起始位置(r0和r1)的距离不够,元素可能不会显示

2D trancks的文件格式如下

数据做好后同样保存在data中

创建配置文件,即可选择以什么样的方式呈现该数据。

3

2D links

由于我的数据并没有links,所以这里用chromosome的例子。同样的原理,保存Links的数据,写配置文件即可实现添加ROI之间的连接。

4

进阶

使用circos稍微有些tricky的部分便是添加条件判断循环,作者的例子讲的也很清楚。以下只是简单的笔记

条件判断使用的<rule>模块的逻辑判断是element-wise的,相当于帮你内置了一个for循环,每个符合条件的元素就会进行赋值和绘图。这里要用到一点点perl基本语法。以下代码实现不同数据(0,1,2)用不同颜色/形状呈现。

如果要在每一圈都用相同形式的2d track,但是载入不同的数据,此时就需要使用循环,实现每次载入一个不同的文件,同时改变该圈数据的位置。circos给你了一个counter函数,每次画一个圈就会得到一个指针,用这个指针做循环就行了,需要了解基本的语法。

5

Bonus

通过加载自定义font,可以画一些好玩的内容

像极了看到结果的我

Dafont.com 是不错的font来源,有很多有意思的内容

1 人点赞