[Py008] gff文件处理2

作者: 安哥生个信 | 来源:发表于2018-10-20 22:53 被阅读61次

根据第三列的type,提取mRNA及相应exon的信息。

[Py005]是一样的,但是这次换一种处理思路。

思路:

​ 每次读取一行,拆分为list;

​ 将第三列的特征值追加到新命令的list(type)中;

​ 如果第三列的特征值为mRNA,打印该行;

​ 如果第三列的特征值为exon,并且通过true_exon函数判断符合“mRNA;exon;exon”之类的顺序,则打印该行。

import re

def true_exon(list):
    list = list[::-1]
    list = ";".join(list)
    if re.match(r'(?:exon;)+mRNA', list):
        return True
    else:
        return False

type = []
outGFF = open('out.gff', 'w')
for line in open('in.gff'):
    line_list = line.strip().split('\t')
    type.append(line_list[2])
    if line_list[2] == 'mRNA':
        outGFF.write(line)
    if line_list[2] == 'exon' and true_exon(type):
        outGFF.write(line)
outGFF.close()

相关文章

  • [Py008] gff文件处理2

    根据第三列的type,提取mRNA及相应exon的信息。 和[Py005]是一样的,但是这次换一种处理思路。 思路...

  • 基因组注释文件(GTF/GFF)格式介绍

    基因组注释文件GTF/GFF格式的介绍 GFF 2 -> GTF -> GFF 3 The GTF ...

  • 山羊转录组GFF文件与GTF格式转换

    GFF文件与GFF文件来源 1.1 GFF文件来源 1.1 GTF文件来源 GFF文件与GTF文件格式 2.1 ...

  • gffread软件使用教程

    gffread 不仅可以实现GTF与GFF的互相转换,而且还可以对GFF文件进行过滤处理。可以直接读取GTF文件。...

  • 2020-11-25

    1.改脚本 intron.gff文件需要改 读取intron的部分 原来使用的intron: gff处理: 使用之...

  • 生信软件下载网站

    1.序列比对软件 2.处理GTF/GFF文件 3.kmer计数软件 4.bwa,samtools,bcftools...

  • gbff 文件

    包含基因和序列信息 bp_genbank2gff3.pl脚本可以把gbff文件转化成gff文件

  • awk命令

    GFF文件转换awk '{if(1,5,$9}' md.gff >md1.gff

  • annovar:使用gff文件自建数据库注释

    1、gff文件转换gffread:将gff文件转换为gtfgtfToGenePred:将gtf转换为GenePre...

  • GFF 文件

    GFF全称为general feature format,这种格式主要是用来注释基因组。 从 Ensembl 导出...

网友评论

    本文标题:[Py008] gff文件处理2

    本文链接:https://www.haomeiwen.com/subject/rfrvzftx.html