美文网首页
fasta文件批处理,提取headers

fasta文件批处理,提取headers

作者: lizg | 来源:发表于2019-01-22 16:36 被阅读11次

    首先将文件保存在一个文件夹下:


    image.png

    运行python脚本:

    # 读取fasta文件头
    import os
    path_files=os.listdir("F:\文件处理\\fasta_dir")# 获取目录下的文件
    out_file=open('header','w')
    for file in path_files:
        filename=os.path.basename(file)#获取文件名
        fasta_file=open("F:\\文件处理\\fasta_dir\\"+filename,'r')#打开文件
        for line in fasta_file:
            if line[0]=='>':
                print (line)
                out_file.writelines(line)
    out_file.close()
    

    输出结果

    >NC_007122.7:21138038-21139481 Danio rerio strain Tuebingen chromosome 11, GRCz11 Primary Assembly
    >NC_000001.11:206767603-206772494 Homo sapiens chromosome 1, GRCh38.p12 Primary Assembly
    >NC_000067.6:131019845-131024970 Mus musculus strain C57BL/6J chromosome 1, GRCm38.p4 C57BL/6J
    >NC_000019.10:58346806-58353499 Homo sapiens chromosome 19, GRCh38.p12 Primary Assembly
    >NC_005112.4:47738933-47743392 Rattus norvegicus strain mixed chromosome 13, Rnor_6.0
    

    相关文章

      网友评论

          本文标题:fasta文件批处理,提取headers

          本文链接:https://www.haomeiwen.com/subject/trqrjqtx.html