gffread使用小妙招

作者: 杨博士聊生信 | 来源:发表于2021-08-20 20:35 被阅读0次

    大家好,今天给大家分享一个软件(cufflinks)中的一个命令gffread,前一段时间需要提取生菜所有基因的CDS序列,本来一开始准备自己写脚本,后来发现gffread就可以实现。

    1. 安装:

    #下载
    wget http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz](http://cole-trapnell-lab.github.io/cufflinks/assets/downloads/cufflinks-2.2.1.Linux_x86_64.tar.gz
    
    #解压
    tar -zvxf cufflinks-2.2.1.Linux_x86_64.tar.gz
    
    #加入到自己环境变量中
    export PATH=/home/software/cufflinks-2.2.1.Linux_x86_64/:$PATH
    
    #进入软件目录
    cd cufflinks-2.2.1.Linux_x86_64
    #查看
    ls -l
    
    图1.png

    这样即安装好了。

    2.gffread使用
    以生菜为例吧,现在我们有生菜基因组文件lettuce_genome.fa和gff文件。

    2.1 使用gffread利用生菜生菜基因组文件lettuce_genome.fa和gff文件生成生菜所有基因的CDS序列文件,格式为fasta格式。

    gffread  Lactuca_sativa_lettuce.gff -g lettuce_genome.fa -x 
    Lactuca_sativa_lettuce_cds.fa
    

    这样就好了,已经生成所有基因的CDS序列文件。

    less Lactuca_sativa_lettuce_cds.fa
    
    图 2.png
    ##还可以利用gffread提取参考基因组文件中的转录本,与上面提取CDS序列类似
    gffread Lactuca_sativa_lettuce.gtf  -g lettuce_genome.fa -w transcripts.fa
    

    2.2 我们还可以使用gffread实现gff文件和gtf文件格式转换

    #gff to gtf
    gffread Lactuca_sativa_lettuce.gff -T -o Lactuca_sativa_lettuce.gtf
    #gtf to gff 
    gffread Lactuca_sativa_lettuce.gtf -o tmp.gff
    

    当然,这个软件还要很多其他功能,感兴趣的可以自己试试哦。

    相关文章

      网友评论

        本文标题:gffread使用小妙招

        本文链接:https://www.haomeiwen.com/subject/svfxiltx.html