目的
NGS测序得到的短序列(read)存储于Fastq文件,在经过DNA建库和测序之后,文件中不同read之间的顺序就全部丢失了。因此,Fastq文件中紧挨着的两条read之间没有任何位置关系,它们都是随机来自于原本基因组中某个位置的短序列而已。因此我们无法判断Fastq文件中reads间的顺序关系。比对就是把每一条read分别与该物种的参考基因组或自身组装的长序列进行比较,然后按顺序排列整齐并记录其对应的位置。
做法
对于没有参考基因组的物种进行转录组测序,需要首先对测序reads进行拼接,然后才能进行比对这一过程。
安装
编译安装:
在Trinity下载页面下载最新版本
wget https://github.com/trinityrnaseq/trinityrnaseq/releases/download/v2.12.0/trinityrnaseq-v2.12.0.FULL.tar.gz
tar -zxvf trinityrnaseq-v2.12.0.FULL.tar.gz
# 在基本安装目录中通过 make来编译安装Trinity
Anaconda 安装
conda activate py3
conda search trinity
conda install trinity
使用
Trinity --seqType fq --left reads_1.fq --right reads_2.fq --CPU 6 --max_memory 20G
组装拼接结果保存在./trinity_out_dir/Trinity.fasta文件中,该结果用于后续的功能注释和表达量计算。
网友评论