做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。
☞使用R获取DNA的反向互补序列
☞R如何reservse一个字符串
最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。
代码语言:javascript复制#我们的DNA序列
DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"
#首先需要安装Biostrings这个包
BiocManager::install("Biostrings")
#加载Biostrings这个包
library(Biostrings)
#构建DNAstring对象
DNA.str <- DNAString(DNA_seq)
DNA.str
接下来我们来看看这个包都能做什么事情
代码语言:javascript复制#查看序列长度
length(DNA.str)
代码语言:javascript复制#获取反向序列
rev_seq=reverse(DNA.str)
#转换成字符串
toString(rev_seq)
代码语言:javascript复制#获取互补序列
complement(DNA.str)
代码语言:javascript复制#获取反向互补序列,一个函数就搞定了
reverseComplement(DNA.str)
代码语言:javascript复制#转换成RNA序列
RNAString(DNA.str)
代码语言:javascript复制#翻译成氨基酸序列
translate(DNA.str)
代码语言:javascript复制#统计每个碱基出现的次数
letterFrequency(DNA.str, DNA_BASES)
代码语言:javascript复制#统计每个碱基出现的频率
letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)
代码语言:javascript复制#统计序列的GC含量
letterFrequency(DNA.str, "GC", as.prob = TRUE)
果然还是要站在前人的肩膀上,才能看的更远。