1、将参考基因组进行重亚硫酸盐的预处理转换
bismark_genome_preparation --verbose --bowtie2 ~/WGBS/ref/
结果:


2、将数据比对到已经转化了的参考基因组上
一次处理单个样本:
bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/control/control_P_R1.clean.fq -2 ~/WGBS/2_CleanData/control/control_P_R2.clean.fq -o ~/WGBS/map
一次处理多个样本:
bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/control/control_P_R1.clean.fq -2 ~/WGBS/2_CleanData/control/control_P_R2.clean.fq -o ~/WGBS/map;bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/insulin/insulin_P_R1.clean.fq -2 ~/WGBS/2_CleanData/insulin/insulin_P_R2.clean.fq -o ~/WGBS/map;bismark -p 8 --genome ~/WGBS/ref -1 ~/WGBS/2_CleanData/Insulin_hcg/Insulin_hcg_P_R1.clean.fq -2 ~/WGBS/2_CleanData/Insulin_hcg/Insulin_hcg_P_R2.clean.fq -o ~/WGBS/map
ps:--genome /路径/ref ref目录下要有Bisulfite_Genome目录和GRCm38.p6.genome.fa文件;-p 8 线程数,将整个任务分成若干小块同时处理,可以提高运行效率
用分号(;)分割命令,可以一次处理完所有要比对的序列
结果:

3、将bismark比对生成的bam文件进行排序和索引(排序和索引去重复后进行)
排序(排序的目的是为了下游分析的方便)
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools sort $i.clean_bismark_bt2_pe.bam -o $i.clean_bismark_bt2_pe.sorted.bam
对排序后的文件进行索引(生成.bai文件)
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools index $i.clean_bismark_bt2_pe.sorted.bam;done
结果:

一条命令完成排序和索引:
for i in control_P_R1 Insulin_hcg_P_R1 insulin_P_R1;do samtools sort $i.clean_bismark_bt2_pe.bam -o $i.clean_bismark_bt2_pe.sorted.GG.bam;samtools index $i.clean_bismark_bt2_pe.sorted.GG.bam;done
网友评论