“站长,怎么判断是不是链特异性建库呢?”

2023-02-28 21:26:39 浏览数 (1)

感谢前辈 很多时候翻翻生信技能树的帖子就能找到答案,比如下面的这个关于链特异性建库的讲解很详尽,今天翻出来给大家分享一下。

下面的内容参考于简书:https://www.jianshu.com/p/a63595a41bed

ps感谢小站的小伙伴迅子提供相关资料。

搞清楚是否为链特异性建库重要吗?

小站一直关注转录组原始数据的分析。原始数据下载的时候,有的会写清楚是否为链特异性建库,而很多时候是不写的,那么这个对于分析来说重要吗?具体讲清楚什么是链特异性建库这个事,实在是太难,大家可以去看那简书的内容。如果看完简书内容还是晕的话,那么听站长粗略的解释一下。你可以把链特异性建库看作是更高级的建库方法,所以1、如果自己做测序一定要问清楚是否为链特异性建库,是哪种?因为非链特异性建库方法便宜,小小被坑。2、如果研究的是编码基因,看一个表达量变化,用非链特异性建库省点钱也是可以的。3、如果做的是lncRNA,环状RNA,那么一定要做链特异性建库测序。miRNA的建库方法本身就是链特异性的。那么从公共数据库下载的数据,如果不是链特异性的就不能分析lncRNA和环状RNA了吗?这个问题可能是大家最关心的。对于这个问题,下面是站长的答案,仅供参考!仅供参考!仅供参考!。本来原始数据就少,能分析就分析吧,所有分析出来的基因,肯定逃不过验证这一步。如果原始数据是链特异性建库,分析时候参数正确,在验证时候候选差异基因正确的概率更高一些。如果原始数据是非链特异性建库,候选基因在验证时候正确的概率稍低一些。但是只要经过生化试验验证,证据充分,其实跟是啥方法建库没啥关系。这也是,为什么纯生信文章不好发表的原因之一。一切证据还得有生化试验支持才算数。当然这只是从基因表达量的方面考虑,如果研究转录后修饰什么的,千万别这么搞哈~

公共数据怎么识别是不是链特异性建库

根据https://www.jianshu.com/p/a63595a41bed中提供的IGV方法,站长做了一个视频 视频背景音乐:来自于奥戸巴寿的《いつも何度でも》视频中第二行样本是非链特异性测序,第三行样本是dUTP链特异性测序如下图

结合小站之前的教程这一步应该插在STAR Mapping之后从零到壹:10元~Mapping神器STAR的安装及用随便选一个样本,在样本文件夹里找到bam文件,然后用samtools index建立baibam与bai要在一个目录下,载入到IGV软件中,就是视频那个样子啦。位置信息是chr12:123,406,542-123,416,558首先看是不是链特异性,右键选color alignments by first-of-pair strand如视频那样,红蓝分布,就是链特异性再看是什么样的链特异性在链特异性那个样本右键选color alignments by read strand鼠标放在红或者蓝的read上,看信息。显示first of pair那个read的箭头方向与基因的方向相反,这就提示是dUTP建库的方法。知道这些有啥用呢?在STAR运行结束后的ReadsPerGene.out.tab文件中非链特异性的要选第二列那个数而dUTP链特异性建库要选第四列那个数所以批量处理counts数教程中"站长,Mapping之后counts怎么合并成一个表?"df.use <- data.frame(v1 = df.read 这句代码中V4就是第四列,选择这个是针对dUTP链特异性建库测序的,如果是非链特异性建库图中那个位置应该改成V2就可以啦~~

0 人点赞