超简单!每个样本只要10元的转录组分析教程

2023-02-12 16:05:31 浏览数 (2)

写教程的初衷

一个临床医生要发SCI文章该怎么办?

踏踏实实做实验实在是产出低效,不过有实力的还是应走这条路。前提:有实验室,有设备(共享的也行),有经费,有学生,有IDEA。绝大部分像我这样的临床医生是没有这个条件的,但是主任还是逼着大家去做,该怎么办?最近一种类型的文章大量出现,以挖掘数据为主,不用做啥实验,就能发SCI文章。隔壁科室,一年13篇的产出(忽略影响因子),吓呆了许多实验室的PI。

挖掘数据的数据从哪里来

主要从GEO基因芯片数据库中来:绝大部分国外实验室或者发完文章了以后芯片数据是要公开的,这就给大家提供了大量的数据。不同研究对象就有不同的数据再加上不同研究条件的处理,会有很多议题提供给大家来挖掘写成故事发表文章。数据矩阵(还有gene名字与表达量的表格)可以从GEO的网址上轻松获得,用R语言简单那么处理就可以了。对于芯片数据可以下载数据压缩包(.cel),拿回去自己用R或者官方的工具软件,在个人电脑上就可以完成。以国人的学习能力,可用的芯片数据一定会越来越少,别人挖完了,再分析,发文章被Accepted的几率也会降低。

学会了挖数据没数据了怎么办

用文章现成的表格去挖掘很难说服审稿人的,错过了数据挖掘套路发文章的我们该怎样做呢?其实数据的获得还有一个更重要的渠道就是二代测序结果。很多高级文章比如CNS中有一类是Resource的文章,他们也会被要求上传原始数据。对于这些数据得的挖掘,由于受到计算机及操作者的能力和网速等条件的限制,很少被人挖掘再分析。但是,如果对这些数据从mapping开始分析挖掘,那么文章一定也会太Low。举个

0 人点赞