各位亲爱的土豪富婆,承蒙您慧眼识珠大驾光临大Y老师为您准备的小灶课堂。
-----以下是日常碎碎念,日理万机的您,可以直接跳到图图图图分割线享用-----
大Y老师做生信分析十多年了,在此期间结识很多实验大牛,发现大牛们做实验很大牛,但是对很多生信的图表竟然一知(Wu)半(Suo)解(Zhi),这怎么可以呢,你们是大牛耶!
然后大Y老师上网一查,发现事出有因。虽然现在市面上有很多生信培训的公众号,或者代码复现的实操文章,但是对实验大牛们来说,其实并不是很实用。为什么这么说呢,依据大Y老师的经验,做生信其实是分为三个层次的:
层次一:看懂图(能看懂文献的分析结果)
层次二:会做图(会写代码,能完成别人的画图需求)
层次三:知道做什么图(知道自己的数据需要用什么图来展示,指示别人去做)
这样大家就清楚了,层次一嘛,打工人实锤,层次二嘛,还是打工人实锤,层次三嘛,才算是金主爸爸。试问各位,谁不想从打工人变成金主爸爸,谁会愿意从打工人进阶成打工人呢?其实,如果不打算专门做生信专业,完全可以跳过第二层次,直接跃迁到第三层!毕竟做实验很厉害就已经很厉害了呀。
那么问题来了,怎样实现从看懂图到知道做什么图的跃迁呢?这就是大Y老师创立这个公众号的目的啦,就是要用特别白的那种大白话跟大家分享读懂生信分析图表的方法,让大家以后读文献更快更明白,与分析老师沟通也更顺畅更高效,最终融会贯通,把自己的数据漂漂亮亮地展现出来。
好啦,碎碎念结束,下面我们就要开始今天的识图之旅啦。请大家先一起喝一口水,因为下面的内容可是全网独家干货,真的超干~
-----我是图图图图的分割线-----
生信分析有很多基础的图形,在此基础上又发展出很多复杂花哨的变形或组合,酷炫得让人眼花缭乱。别怕,其实万变不离其宗。我们就从基础的图形开始夯实起来!所有图形中,最基础的就是点图(Dot Plot)啦。那么我们今天就来学习一张最入门的点图:
上面就是一张非常基础典型的点图。点图的必要元素只包括X轴坐标和Y轴坐标。每个点对应一个X轴坐标值和一个Y轴坐标值,即这个点分别向X轴和Y轴画垂线所对应的数值。一个点图相当于将一个二维表格可视化。
当当当当,一个小知识点,什么是必要元素?
必要元素,就是成图所必须要有的信息。在理解一张图的时候,只要死死咬住其必要元素,就可以很快理解图形的含义。不同图形的必要元素是不一样的哦。
点图简约而不简单,在各种领域广泛应用,帮助将表格数据可视化。在生信中,点图有哪些用法呢?我们拿文章中的真图来看:
1. 展示数值
Genome Biology 2014
让我们看看,上图的必要元素分别指示什么?上图每个点的X轴坐标是一个名称,指代不同RNA,进一步区分为不同类别的RNA,Y轴指示富集比值(enrichment ratio)[1],其含义我们会在之后的进阶中学习到。这张图的目的在于展示RNA的实际富集比值,让我们一眼就看到,啊,前几个snRNA的富集比值好高呀,都在256左右,后面的Ribo RNA的富集比值就低了许多,只有4左右。
2. 展示分布
Cell Reports 2019
大牛们对左上图一定非常熟悉啦,在流式实验中,利用两个抗体表达强度区分两种细胞。同理,右上图也利用X和Y坐标将点定位,从而展示出这些点聚集成了四簇[2]。在这张图中,点图的必要元素X轴坐标和Y轴坐标分别为PCA分析中的PC轴,其含义我们会在之后的进阶中学习到。
3. 展示关系
PLoS computational biology 2020,Nature 2019
让我们一起来看看。左上图里每个点的X轴指示其时间值,Y轴指示其自由能量值,将图中的点连线,就可以清楚地看到自由能量随着时间变化先下降、再上升的趋势[3]。
右上图里呢,每个点的X轴指示其S变量的值,Y轴指示其u变量的值。在点很多的情况下,非常适合做一个回归分析,计算Y随着X的变化关系。在右上图中,黑色的直线就是回归分析后计算出来的回归线,即Y伴随X变化的函数。让我们回想初中数学课的指示,回归线斜率越大,变化速度越大,即Y伴随X变化产生的变化越剧烈。所以这个图说明,在s增加的情况下,u也增加,其变化的速度就是线条的斜率,是不是很简单?
聪明的你一定发现了,点图中,除了必要元素XY轴坐标,似乎点的颜色也可以用来指示一些信息。没错,而且不止颜色,点的大小、形状、透明度等等,都可以用来作为补充元素展示信息。补充元素不是成图所必须的,但是可以提供额外的信息量,在每张图里可以有不同的存在方式。所以一张小小的点图可以承载的信息量可是大大的。那么,点图可以变身出哪些花哨绚丽的生信图形呢?我们在下一期的小灶里一起见证。
[1] LU Z, GUAN X, SCHMIDT C A, et al. RIP-seq analysis of eukaryotic Sm proteins identifies three major categories of Sm-containing ribonucleoproteins [J]. Genome Biology, 2014, 15(1): R7-R.
[2] LEYLEK R, ALCáNTARA-HERNáNDEZ M, LANZAR Z, et al. Integrated Cross-Species Analysis Identifies a Conserved Transitional Dendritic Cell Population [J]. Cell Reports, 2019, 29(11): 3736-50.e8.
[3] SU Y, BINTZ M, YANG Y, et al. Phenotypic heterogeneity and evolution of melanoma cells associated with targeted therapy resistance [J]. PLoS Comput Biol, 2019, 15(6): e1007034-e.
欢迎大家分享你在生信学习中的感想、困扰和乐趣。