转录组重建系统发育（二）使用Trinity对cleandata进

作者: 惊鸿影 | 来源:发表于2021-09-21 16:04 被阅读0次

转录组重建系统发育（二）使用Trinity对cleandata进
转录组入门学习（四）
转录组分析实战第二节：无参考基因转录组拼接
转录组组装软件：Trinity (转载)
转录组组装软件：Trinity (转载)
转录本的统计指标N50 vs ExN50
TransDecoder
转录组重建系统发育（四）使用cdhit去冗余和使用transde
利用aTRAM定向组装目标序列
转录组分析实战第一节：Rawdata的质量控制与清理

在处理完rawdata（参考上一文章）转录组重建系统发育（一）使用fastp多rawdata进行处理之后就可以进行转录组组装了，无参转录组组装中最常用的软件为Trinity

1、安装

Trinity是常用的进行无参转录组数据拼接的软件，可以使用conda进行安装

conda instal -c bioconda trinity

或者到github按说明下载https://github.com/trinityrnaseq/trinityrnaseq/releases

安装之后就可以使用了，输入 Trinity -h 可以获得帮助信息如下

image.png

2、使用

Trinity 的常用参数
--seqType ：这个参数指定数据类型（fq or fa）
--max_memory ：这个参数指定运算过程占用内存
--CPU ：这个指定运算过程使用的CPU情况
--single：单向测序可以使用此命令后加单向测序文件
双向测序文件可以使用left和right命令如下
--left ：后接左向测序文件
--right：后接右向测序文件
现在的转录组测序文件一般比较大，可以使用服务器进行组装。常用组装脚本如下。
--output：后接输出文件名。名字中要带有trinity单词

Trinity --seqType fq \ #设置数据格式
    --max_memory 64G \ #设置使用的内存大小
    --CPU 8 \ #设置CPU数量
    --full_cleanup \ #运行结束后清除过程文件只保留组装的fasta文件
    --min_kmer_cov 2 \ #对碎片较多的文件可以使用这个命令加快组装速度
    --left ../02.cleandata/SRS7102777_1.clean.fastq.gz \ #左向数据
    --right ../02.cleandata/SRS7102777_2.clean.fastq.gz \ #右向数据
    --output ./SRS7102777_trinity >./log/2777.log 2>./log/2777.erro
# > 符号后可以输出log文件， 2> 可以输出报错信息文件

运行结束后我们会得到如下图一样的两个文件

image.png

以fasta为后缀的就是我们需要的组装好的文件。
组装后可以使用Trinity自带的脚本提取最长的转录本。

perl /datapool/miniconda3/pkgs/trinity-2.8.5-h8b12597_5/opt/trinity-2.8.5/util/misc/get_longest_isoform_seq_per_trinity_gene.pl ../03.trinity/SRS7102777_trinity.Trinity.fasta > 168_trinity_longest.fasta