美文网首页
转录组重建系统发育(二)使用Trinity对cleandata进

转录组重建系统发育(二)使用Trinity对cleandata进

作者: 惊鸿影 | 来源:发表于2021-09-21 16:04 被阅读0次

在处理完rawdata(参考上一文章)转录组重建系统发育(一)使用fastp多rawdata进行处理之后就可以进行转录组组装了,无参转录组组装中最常用的软件为Trinity

1、安装

Trinity是常用的进行无参转录组数据拼接的软件,可以使用conda进行安装

conda instal -c bioconda trinity

或者到github按说明下载https://github.com/trinityrnaseq/trinityrnaseq/releases

安装之后就可以使用了,输入 Trinity -h 可以获得帮助信息如下


image.png

2、使用

Trinity 的常用参数
--seqType :这个参数指定数据类型 (fq or fa)
--max_memory : 这个参数指定运算过程占用内存
--CPU : 这个指定运算过程使用的CPU情况
--single:单向测序可以使用此命令后加单向测序文件
双向测序文件可以使用left和right命令如下
--left :后接左向测序文件
--right:后接右向测序文件
现在的转录组测序文件一般比较大,可以使用服务器进行组装。常用组装脚本如下。
--output:后接输出文件名。名字中要带有trinity单词

Trinity --seqType fq \ #设置数据格式
    --max_memory 64G \ #设置使用的内存大小
    --CPU 8 \ #设置CPU数量
    --full_cleanup \ #运行结束后清除过程文件只保留组装的fasta文件
    --min_kmer_cov 2 \ #对碎片较多的文件可以使用这个命令加快组装速度
    --left ../02.cleandata/SRS7102777_1.clean.fastq.gz \ #左向数据
    --right ../02.cleandata/SRS7102777_2.clean.fastq.gz \ #右向数据
    --output ./SRS7102777_trinity >./log/2777.log 2>./log/2777.erro
# > 符号后可以输出log文件, 2> 可以输出报错信息文件

运行结束后我们会得到如下图一样的两个文件


image.png

以fasta为后缀的就是我们需要的组装好的文件。
组装后可以使用Trinity自带的脚本提取最长的转录本。

perl /datapool/miniconda3/pkgs/trinity-2.8.5-h8b12597_5/opt/trinity-2.8.5/util/misc/get_longest_isoform_seq_per_trinity_gene.pl ../03.trinity/SRS7102777_trinity.Trinity.fasta > 168_trinity_longest.fasta

相关文章

网友评论

      本文标题:转录组重建系统发育(二)使用Trinity对cleandata进

      本文链接:https://www.haomeiwen.com/subject/pubwgltx.html