美文网首页CHIP-Seq处理流程
CHIP-Seq(3):比对及质控

CHIP-Seq(3):比对及质控

作者: Li_bioinfo | 来源:发表于2022-03-21 10:20 被阅读0次

1.对过滤后的fq.gz文件进行比对,并查看比对情况

mkdir ../bowtie2#创建用来存放比对后文件的目录
ls *.fq.gz | while read id;
do
file=$(basename $id)
sample=${file%_*}
bowtie2 -t -p 32 -x ~/my_data/ref_data/hg19/bowtie2_index/hg19 --no-mixed --no-discordant -U $file   -S ../bowtie2/${sample}.sam > ../bowtie2/${sample}.log 2>&1 
#比对后将SAM文件转为bam文件,转之前要进行排序,可以一边排序一边转,转后要立即建立索引,无论干啥,生成bam文件后就要建立bam索引
samtools sort -@ 4 -O bam -o ../bowtie2/${sample}.bam ../bowtie2/${sample}.sam
samtools index -@ 10 ../bowtie2/${sample}.sorted.bam
#删除SAM文件,因为后面用不到,用的都是bam文件,删除缓解内存
rm -rf  ../bowtie2/${sample}.sam
done
#查看比对情况
multiqc ../bowtie2/*.log
image.png image.png

3.对排序后的bam文件进行QC

ls *.bam | while read id; do (samtools flagstat  $id > ${id%.*}.stat );done
#批量查看比对结果
cat *stat | grep %
22634043 + 0 mapped (94.42% : N/A)
20096669 + 0 mapped (93.96% : N/A)
22700264 + 0 mapped (95.22% : N/A)

4.使用samtools去掉多重比对的reads

samtools过滤多重比对reads的方法 - 开发技术 - 亿速云 (yisu.com)

ls *.bam | while read id; do
samtools view -h -q 1 -F 256 $id |grep -v XA:Z |grep -v SA:Z |samtools view -b - > ../clean_bam/$id ;samtools index -@ 10 ../clean_bam/$id;done

4.比对结果reads累积情况进行展示

对样本比对结果reads累积情况进行展示。一定长度窗口(bin)上reads数进行计数,然后排序,再依次累加画图。input (能测到90%DNA片段)在基因组理论上是均匀分布,随着测序深度增加趋近于直线,实验组在排序越高的窗口处reads累积速度越快,说明这些区域富集的越特异。

image.png
具体解释deeptools工具系列——ChIP数据质控富集程度 - 简书 (jianshu.com)
plotFingerprint \
-b D4_CpG_STAT3_ChIP.bam D4_CTR_STAT3_ChIP.bam D4_R848_STAT3_ChIP.bam \
--labels D4_CpG_STAT3_ChIP D4_CTR_STAT3_ChIP D4_R848_STAT3_ChIP \
--minMappingQuality 30 --skipZeros --region 19 --numberOfSamples 50000 -T "Fingerprints of different samples"  \
--plotFile fingerprints.png \
--outRawCounts fingerprints.tab \
--outQualityMetrics fingerprints_qc_metrics.tab
image.png

相关文章

网友评论

    本文标题:CHIP-Seq(3):比对及质控

    本文链接:https://www.haomeiwen.com/subject/hucadrtx.html