在处理完rawdata(参考上一文章)转录组重建系统发育(一)使用fastp多rawdata进行处理之后就可以进行转录组组装了,无参转录组组装中最常用的软件为Trinity
1、安装
Trinity是常用的进行无参转录组数据拼接的软件,可以使用conda进行安装
conda instal -c bioconda trinity
或者到github按说明下载https://github.com/trinityrnaseq/trinityrnaseq/releases
安装之后就可以使用了,输入 Trinity -h 可以获得帮助信息如下
image.png
2、使用
Trinity 的常用参数
--seqType :这个参数指定数据类型 (fq or fa)
--max_memory : 这个参数指定运算过程占用内存
--CPU : 这个指定运算过程使用的CPU情况
--single:单向测序可以使用此命令后加单向测序文件
双向测序文件可以使用left和right命令如下
--left :后接左向测序文件
--right:后接右向测序文件
现在的转录组测序文件一般比较大,可以使用服务器进行组装。常用组装脚本如下。
--output:后接输出文件名。名字中要带有trinity单词
Trinity --seqType fq \ #设置数据格式
--max_memory 64G \ #设置使用的内存大小
--CPU 8 \ #设置CPU数量
--full_cleanup \ #运行结束后清除过程文件只保留组装的fasta文件
--min_kmer_cov 2 \ #对碎片较多的文件可以使用这个命令加快组装速度
--left ../02.cleandata/SRS7102777_1.clean.fastq.gz \ #左向数据
--right ../02.cleandata/SRS7102777_2.clean.fastq.gz \ #右向数据
--output ./SRS7102777_trinity >./log/2777.log 2>./log/2777.erro
# > 符号后可以输出log文件, 2> 可以输出报错信息文件
运行结束后我们会得到如下图一样的两个文件
image.png
以fasta为后缀的就是我们需要的组装好的文件。
组装后可以使用Trinity自带的脚本提取最长的转录本。
perl /datapool/miniconda3/pkgs/trinity-2.8.5-h8b12597_5/opt/trinity-2.8.5/util/misc/get_longest_isoform_seq_per_trinity_gene.pl ../03.trinity/SRS7102777_trinity.Trinity.fasta > 168_trinity_longest.fasta
网友评论