美文网首页
转录组重建系统发育(二)使用Trinity对cleandata进

转录组重建系统发育(二)使用Trinity对cleandata进

作者: 惊鸿影 | 来源:发表于2021-09-21 16:04 被阅读0次

    在处理完rawdata(参考上一文章)转录组重建系统发育(一)使用fastp多rawdata进行处理之后就可以进行转录组组装了,无参转录组组装中最常用的软件为Trinity

    1、安装

    Trinity是常用的进行无参转录组数据拼接的软件,可以使用conda进行安装

    conda instal -c bioconda trinity
    

    或者到github按说明下载https://github.com/trinityrnaseq/trinityrnaseq/releases

    安装之后就可以使用了,输入 Trinity -h 可以获得帮助信息如下


    image.png

    2、使用

    Trinity 的常用参数
    --seqType :这个参数指定数据类型 (fq or fa)
    --max_memory : 这个参数指定运算过程占用内存
    --CPU : 这个指定运算过程使用的CPU情况
    --single:单向测序可以使用此命令后加单向测序文件
    双向测序文件可以使用left和right命令如下
    --left :后接左向测序文件
    --right:后接右向测序文件
    现在的转录组测序文件一般比较大,可以使用服务器进行组装。常用组装脚本如下。
    --output:后接输出文件名。名字中要带有trinity单词

    Trinity --seqType fq \ #设置数据格式
        --max_memory 64G \ #设置使用的内存大小
        --CPU 8 \ #设置CPU数量
        --full_cleanup \ #运行结束后清除过程文件只保留组装的fasta文件
        --min_kmer_cov 2 \ #对碎片较多的文件可以使用这个命令加快组装速度
        --left ../02.cleandata/SRS7102777_1.clean.fastq.gz \ #左向数据
        --right ../02.cleandata/SRS7102777_2.clean.fastq.gz \ #右向数据
        --output ./SRS7102777_trinity >./log/2777.log 2>./log/2777.erro
    # > 符号后可以输出log文件, 2> 可以输出报错信息文件
    

    运行结束后我们会得到如下图一样的两个文件


    image.png

    以fasta为后缀的就是我们需要的组装好的文件。
    组装后可以使用Trinity自带的脚本提取最长的转录本。

    perl /datapool/miniconda3/pkgs/trinity-2.8.5-h8b12597_5/opt/trinity-2.8.5/util/misc/get_longest_isoform_seq_per_trinity_gene.pl ../03.trinity/SRS7102777_trinity.Trinity.fasta > 168_trinity_longest.fasta
    

    相关文章

      网友评论

          本文标题:转录组重建系统发育(二)使用Trinity对cleandata进

          本文链接:https://www.haomeiwen.com/subject/pubwgltx.html