美文网首页
【R语言】Biostrings生物序列处理函数

【R语言】Biostrings生物序列处理函数

作者: 生信交流平台 | 来源:发表于2021-12-01 22:13 被阅读0次

    做生物信息学分析,免不了要跟DNA,RNA,蛋白序列打交道。前面给大家介绍过几种获取DNA反向互补序列的方法。

    ☞使用R获取DNA的反向互补序列

    R如何reservse一个字符串

    最近小编又get了一个新的R包Biostrings,能轻松的实现序列反转,互补,反向互补配对等操作,今天就迫不及待的来跟大家分享一下。

    #我们的DNA序列
    DNA_seq="AGCTTATCGATCGATCGTAGCTACGTAGCTACGTAC"
    
    #首先需要安装Biostrings这个包
    BiocManager::install("Biostrings")
    
    #加载Biostrings这个包
    library(Biostrings)
    #构建DNAstring对象
    DNA.str <- DNAString(DNA_seq)
    DNA.str
    

    接下来我们来看看这个包都能做什么事情

    #查看序列长度length(DNA.str)
    
    #获取反向序列
    rev_seq=reverse(DNA.str)
    #转换成字符串
    toString(rev_seq)
    
    #获取互补序列
    complement(DNA.str)
    
    #获取反向互补序列,一个函数就搞定了
    reverseComplement(DNA.str)
    
    #转换成RNA序列
    RNAString(DNA.str)
    
    #翻译成氨基酸序列
    translate(DNA.str)
    
    #统计每个碱基出现的次数
    letterFrequency(DNA.str, DNA_BASES)
    
    #统计每个碱基出现的频率
    letterFrequency(DNA.str, DNA_BASES, as.prob = TRUE)
    
    #统计序列的GC含量
    letterFrequency(DNA.str, "GC", as.prob = TRUE)
    

    果然还是要站在前人的肩膀上,才能看的更远。

    【R语言】Biostrings序列处理函数

    相关文章

      网友评论

          本文标题:【R语言】Biostrings生物序列处理函数

          本文链接:https://www.haomeiwen.com/subject/wgyexrtx.html