序列可以反着拼接吗?

2020-06-23 14:41:46 浏览数 (1)

前几天有人问我,扩增子测序结果进行正反向序列拼接的时候,大家一般都是老老实实R1在前R2在后拼接。但是他反其道而行之,R2在前R1在后也拼了出来,且数据量和正常拼接差不多,就问我是怎么回事。

其实这个很好解释,反着拼肯定能出结果,且出来的序列和正常拼接必然是反向互补的关系。大家稍微思考一下应该可以明白。

如R1序列是abcd,R2序列就是dcba,正常拼出来的是abcd,而反着拼出来是dcba。

为了验证,我拿了一些数据测试,也证实了确实是反向互补的关系。

继续往下思考,不管是正常的序列还是反向互补序列,序列之间的相似度并不会改变,因此对于OTU的生成是不会产生影响的,且对于只用OTU进行的任何分析也不会有任何影响。

但是物种注释呢,注释时会同时取序列和反向互补序列进行注释么?我也随便拿一批数据用RDP试了一下,看了一些高丰度OTU的注释结果是一样的。

但是也必须注意,正常拼接和反着拼接刚拼完的序列肯定是反向互补的,但是由于后续的质量控制可能会切掉序列的一部分,这就导致正常拼接和反着拼接的序列不能严格对应上了。但是序列主体还是一样的,对物种注释应该不会产生太大的影响。

综上,只能说反着拼对OTU没影响,对基于RDP的物种注释影响不大。但是对于其他的物种注释算法是否有影响还不清楚。另外对需要参考数据库的分析也可能会带来问题。

dp

0 人点赞