Chorus2软件安装
- conda安装python3.x环境
conda info -e # 查看当前环境
conda create --name Chorus2 python=3.7 #创建环境
conda activate Chorus2 #激活环境
conda deactivate #退出当前环境
conda remove Chorus2 #删除环境
- 安装依赖包
所有安装的包默认在public/.../envs/Chorus2/bin下
conda config --add channels conda-forge
conda config --add channels defaults
conda config --add channels r
conda config --add channels bioconda
conda install bwa
conda install jellyfish
conda install Cython
conda install primer3-py
conda install pyfasta
conda install numpy
conda install pyBigWig
conda install pandas
- 安装Chorus2
软件位置:public/.../envs/Chorus2/bin
git clone https://github.com/zhangtaolab/Chorus2
../python3 /public/home/ztchen/anaconda3/envs/Chorus2/bin/Chorus2/Chorus2.py -h #检测Chorus2是否安装上
Chorus2挑选探针
- 准备基因组数据
甜橙基因组 - 挑选探针
python3 ~/anaconda3/envs/Chorus2/bin/Chorus2/Chorus2.py -j $jellyfish -b $bwa -g /public/home/ztchen/mlk/raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa -i /public/.../raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa -t 24 -l 50 --step 25 --homology 80 -s Select
参数说明:
上述用的绝对路径,方便以后理解,也可以用相对路径。
-g:基因组序列 fa格式
-i: 同-g一样
-t: 线程
-l: 探针长度
--step: 挑选探针步移长度为25
--homology: 若探针可比对到基因组两个或多个同源性大于80%的位置时,该探针将会被过滤掉
-s 用于保存输出结果的文件夹名
其中fa.bed为挑选出的探针,用于后面的分析
重复序列过滤
python3 ~/anaconda2/envs/Chorus2/bin/Chorus2/ChorusNGSfilter -g ~/mlk/raw_data/DH_Valencia_NGS/csi.chromosome.masked.fa -i $Ridge_pineapple_1.paired.fastq.gz,$Ridge_pineapple_2.paired.fastq.gz -z gz -t 24 -p $csi.chromosome.masked.fa.bed
-g: 基因组,fa格式
-i: 基因组,双端测序
-p: 上步中挑选的探针
-t: 压缩格式
-o: 输出文件,默认为output.bed
python3 ~/anaconda3/envs/Chorus2/bin/Chorus2/ChorusNGSselect.py -i ~/mlk/oligo_design/filter_2/output.bed -o filtered_output.bed -d 50 -ss
参数说明
-d:保证了两个探针第一个碱基之间的距离至少为50nt;
-ss: 只保留正链,不考虑负链
-i:以上步的输出文件out.bed为输入
-o: 默认输入为filtered_output.bed
RepeatMasker再次过滤
软件安装
- 切换环境
为方便使用,可以安装在Chorus2环境下。
conda activate Chorus2
- 安装TRF和搜索引擎RMBlast
conda install TRF
conda install RMBlast
- 设置perl环境的路径
不要用conda下的perl,容易出现报错。
vim ~/.bashrc
export PATH="/usr/bin/:$PATH"
source ~/.bashrc
- RepeatMasker软件下载与安装
wget http://www.repeatmasker.or/RepeatMasker-open-4-0-6.tar.gz #下载
tar xzvf RepeatMasker-open-4-0-6.tar.gz #解压
cd RepeatMasker
chmod -R 755 *
./configure
安装过程中,依次对perl、TRF和搜索引擎RMBlast进行路径设置,路径依次如下:
/usr/bin/ #perl路径
/public/home/.../anaconda3/envs/Chorus2/bin/trf #trf路径
/public/home/.../anaconda3/envs/Chorus2/bin/ #为搜索引擎的工作路径
- 下载Repbase数据库文件
下载地址
下载之前需要提前注册,但是注册后需要几天审核时间,因此可以从网上寻找资源。
由于之前下载过该数据,因此直接解压并上传到Libraries中即可。
- 检测RepeatMasker是否安装成功
cd ~/anaconda3/envs/Chorus2/bin/RepeatMasker
./RepeatMasker -h
网友评论