经常有小伙伴跟我抱怨,没时间没精力去学代码,太复杂了。当然也有些小伙伴确实打起精神开始学,从网上搜了一大堆R语言资料,和生物信息学资料,甚至还买了本R语言实战的书,甚至还学起了python,准备大干一场。但是,有时候实在是心有余而力不足,一边要学实验技术,上课,读文献,甚至要在临床轮转,当初高涨的热情很快就被磨灭,然后就没有然后了。
如果实在没时间精力代码,咱们还有好用的数据库呀,如果运用得当,又有好的想法,一样能做些工作,这里白介素同学分享一篇文献,全文没有使用任何一句代码,但是人家发了3分的文章哦。来来来,解析下这篇文章是怎么操作的吧,首先看看摘要内容:
看到方法学部分了吧, 人家就用了4个网络数据库,说明一下,全是在线的点击版本,非常简单好用。做的工作其实也很简单,就是讲了看了AQP这个基因family在乳腺癌中的表达情况,与预后关系等。
下面看下具体是做了哪些内容嘞?咱们看图说话:
这张图很熟悉呀,就是Oncomine数据库做的,操作一下,特别说明这个数据库本身需要edu的邮箱注册,用起来很方便,是最大的肿瘤芯片数据库。这里作者是看下这些目标基因在各种肿瘤里边的表达情况,以热图的形式展现出来。
然后放了张表格,其实也不是关键数据,也是Oncomine的数据。
接下来又是张表格,分析了下各个基因的mRNA表达水平与临床病理特征的相关性。这个是在bc-GenExMiner v4.1这个数据库做的。
然后是这些基因在不同分级中的表达情况:(这里指出下作者没说清楚用啥做的,确定的是还是用以上这些数据库的数据)
然后就是做生存分析了,看下这些基因与预后的关系,用的数据库是KMplot,这个大家应该比较熟悉了,非常好用的数据库,作的图可直接用于发表。
再接下来,还是一个这样的生存分析,展示的是这些基因在不同亚型中与预后的关系,也是用这个数据库操作的,很简单,看起来数据很多,其实不然。
再接下来,换了个数据库,该分析的都分析得差不多了,用cBioportal数据库分析基因突变与生存的关系,还有这些基因在乳腺癌中的突变情况,那个图也很简单:关于该数据库的使用我们做了一期非常细致的帖子:懒人如何分析TCGA数据之cBioportal网站
全文的分析内容到这里就结束了,后面必然还需要大段的讨论分析的,这个你懂的。就这样一个3分的文章研究内容就结束了。这篇文章能得到哪些结论呢? 顶多就是这些基因在肿瘤中的表达情况,预后情况,还有就是突变情况这三个层次了。
如果熟悉这些数据库,完成这些操作3天的时间肯定是足够了。
好了,白介素同学只能帮到这里了。 熟练使用数据库去呀,数据库就在那里,怎样使用,会不会使用全看自己了。