CREST安装
CREST是基于Split Read原理对SV结构变异进行检测的一个软件。
Github地址:https://github.com/youngmook/CREST
在运行CREST之前需要先安装以下几个软件及模块
1. BLAT
Blat,全称 The BLAST-Like Alignment Tool,可以称为"类BLAST 比对工具",对于DNA序列,BLAT是用来设计寻找95%及以上相似至少40个碱基的序列。对于蛋白序列,BLAT是用来设计寻找80%及以上相似至少20个氨基酸的序列
下载地址:https://hgwdev.gi.ucsc.edu/~kent/src/blatSrc.zip
wget https://hgwdev.gi.ucsc.edu/~kent/src/blatSrc.zip
Unzip blatSrc.zip && cd blatSrc
uname -a
##查看Linux版本类型
export MACHTYPE=x86_64
mkdir ~/bin/x86_64
make && make install
export PATH=~/bin/x86_64 >> ~/.bashrc文件中
source ~/.bashrc
安装前需要先自行安装libpng、zlib等库
libpng地址:http://www.libpng.org/pub/png/libpng.html(选择低版本的下载安装)
BLAT安装成功后在 ~/bin/x86_64目录下可以看到BLAT的套装软件如下:
2. Cap3
由Huang, X. 和 Madan, A 开发的一套用于序列拼接的软件,此软件适用于小的数据集或 EST 拼接,它有如下特征:
◾利用正反向进行拼接,更正拼接错误、连接 contigs。
◾应用 reads 的质量信息。
◾自动截去 reads5端、3
端的低质量区。
◾产生 Consed 程序可读的 ace 格式。
◾ CAP3 能用于 Staden 软件包的中的 GAP4 软件。
下载地址:http://seq.cs.iastate.edu/cap3.html
根据自己相应的操作系统选择相应的软件包下载解压即可使用
3. SAMtools
下载地址: http://sourceforge.net/projects/samtools/files/
选择较低版本的下载
4. BioPerl and Bio::DB::Sam 模块
Perl的模块可以用cpan自行安装即可
cpanm Bio::Perl
cpanm Bio::DB::Sam
CREST的运行
extractSClip.pl -i sample. BAM --ref_genome ucsc.hg19.fasta -o outdir
#这一步运行后会得到一个后缀为cover的文件
CREST.pl -f outdir/sample. BAM .cover -d sample. BAM --ref_genome ucsc.hg19.fasta -t ucsc.hg19.fasta.2bit --cap3 /path/to/cap3 --blatclient /path/to/gfClient --blat /path/to/blat -o outdir
** ucsc.hg19.fasta.2bit这个2bit后缀的文件使用第一步安装的BLAT下的faToTwobit转化得到**
网友评论