【R语言】Biostrings序列处理函数

2022-09-21 18:38:15 浏览数 (1)

做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。

☞使用R获取DNA的反向互补序列

☞R如何reservse一个字符串

最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。

代码语言:javascript复制
#我们的DNA序列
DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"

#首先需要安装Biostrings这个包
BiocManager::install("Biostrings")

#加载Biostrings这个包
library(Biostrings)
#构建DNAstring对象
DNA.str <- DNAString(DNA_seq)
DNA.str

接下来我们来看看这个包都能做什么事情

代码语言:javascript复制
#查看序列长度
length(DNA.str)
代码语言:javascript复制
#获取反向序列
rev_seq=reverse(DNA.str)
#转换成字符串
toString(rev_seq)
代码语言:javascript复制
#获取互补序列
complement(DNA.str)
代码语言:javascript复制
#获取反向互补序列,一个函数就搞定了
reverseComplement(DNA.str)
代码语言:javascript复制
#转换成RNA序列
RNAString(DNA.str)
代码语言:javascript复制
#翻译成氨基酸序列
translate(DNA.str)
代码语言:javascript复制
#统计每个碱基出现的次数
letterFrequency(DNA.str, DNA_BASES)
代码语言:javascript复制
#统计每个碱基出现的频率
letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)
代码语言:javascript复制
#统计序列的GC含量
letterFrequency(DNA.str, "GC", as.prob = TRUE)

果然还是要站在前人的肩膀上,才能看的更远。

0 人点赞