美文网首页
【R语言】Biostrings生物序列处理函数

【R语言】Biostrings生物序列处理函数

作者: 生信交流平台 | 来源:发表于2021-12-01 22:13 被阅读0次

做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。

☞使用R获取DNA的反向互补序列

R如何reservse一个字符串

最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。

#我们的DNA序列
DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"

#首先需要安装Biostrings这个包
BiocManager::install("Biostrings")

#加载Biostrings这个包
library(Biostrings)
#构建DNAstring对象
DNA.str <- DNAString(DNA_seq)
DNA.str

接下来我们来看看这个包都能做什么事情

#查看序列长度length(DNA.str)
#获取反向序列
rev_seq=reverse(DNA.str)
#转换成字符串
toString(rev_seq)
#获取互补序列
complement(DNA.str)
#获取反向互补序列,一个函数就搞定了
reverseComplement(DNA.str)
#转换成RNA序列
RNAString(DNA.str)
#翻译成氨基酸序列
translate(DNA.str)
#统计每个碱基出现的次数
letterFrequency(DNA.str, DNA_BASES)
#统计每个碱基出现的频率
letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)
#统计序列的GC含量
letterFrequency(DNA.str, "GC", as.prob = TRUE)

果然还是要站在前人的肩膀上,才能看的更远。

【R语言】Biostrings序列处理函数

相关文章

网友评论

      本文标题:【R语言】Biostrings生物序列处理函数

      本文链接:https://www.haomeiwen.com/subject/wgyexrtx.html