"的行,...">
美文网首页
用R提取非表格的特定行

用R提取非表格的特定行

作者: RaoZC | 来源:发表于2020-12-01 01:04 被阅读0次

    有时候我们需要提取非表格文件中含有某些符号的特定的行,例如,我们需要从下面fasta文件中提取所有包含">"的行,


    image.png

    基本思路是逐行读入,定位,按照定位提取每一行

    a = readLines("GeneBank.faa")
    b = grep(">",a)
    str(b)
    
    查找包含">"的行号

    可以看到,使用grep后,我们得到包含“>”的行号,我们利用这个行号进行定位

    c = a[b]
    write.table(c,"ID.txt",quote = F, row.names = F)
    

    即可得到如下结果


    image.png

    相关文章

      网友评论

          本文标题:用R提取非表格的特定行

          本文链接:https://www.haomeiwen.com/subject/dmdjwktx.html