美文网首页CHIP-Seq处理流程
CHIP-Seq(4):使用macs3 callpeak 和de

CHIP-Seq(4):使用macs3 callpeak 和de

作者: Z_bioinfo | 来源:发表于2022-04-10 17:11 被阅读0次

1.callpeak

转录因子使用narrowpeak模式

mkdir ../macs3/ #创建callpeak 文件
macs3 callpeak -f BAM -t D4_CpG_STAT3_ChIP.bam -c D4_CTR_STAT3_ChIP.bam -g hs  --keep-dup all -n  D4_CpG_STAT3_ChIP  --outdir ../macs3/ -B  

macs3 callpeak -f BAM -t D4_R848_STAT3_ChIP.bam -c D4_CTR_STAT3_ChIP.bam -g hs   --keep-dup all -n  D4_R848_STAT3_ChIP  --outdir ../macs3/ -B 
查看输出结果
ls
D4_CpG_STAT3_ChIP_control_lambda.bdg  D4_R848_STAT3_ChIP_control_lambda.bdg
D4_CpG_STAT3_ChIP_model.r             D4_R848_STAT3_ChIP_model.r
D4_CpG_STAT3_ChIP_peaks.narrowPeak    D4_R848_STAT3_ChIP_peaks.narrowPeak
D4_CpG_STAT3_ChIP_peaks.xls           D4_R848_STAT3_ChIP_peaks.xls
D4_CpG_STAT3_ChIP_summits.bed         D4_R848_STAT3_ChIP_summits.bed
D4_CpG_STAT3_ChIP_treat_pileup.bdg    D4_R848_STAT3_ChIP_treat_pileup.bdg
#查看peak数
wc -l *.narrowPeak
  1399 D4_CpG_STAT3_ChIP_peaks.narrowPeak
   202 D4_R848_STAT3_ChIP_peaks.narrowPeak
  1601 总用量

2.制备hg19.chrom.size文件,第3步要用:获取参考基因组chrom.sizes文件的2种方式 - 简书 (jianshu.com)

3.对macs结果文件处理及可视化

R作图
Rscript D4_CpG_STAT3_ChIP_model.r
Rscript D4_R848_STAT3_ChIP_model.r
=====================================================
对bed文件进行处理,可以传到IGV中进行查看,这里观察到的是summit位置
awk '{print $1":"$2"-"$3}' 4_CpG_STAT3_ChIP_summits.bed > 4_CpG_STAT3_ChIP_summits_IGV.bed
awk '{print $1":"$2"-"$3}' D4_R848_STAT3_ChIP_summits.bed > D4_R848_STAT3_ChIP_summits_IGV.bed
head 2_WT_rep1_summits.bed
track:name="WT_rep1-(summits)"
chr1:121352256-121352257
chr1:121353174-121353175
chr1:121353264-121353265
chr1:121353383-121353384
===================================================
将bdg文件转为bw格式,可载入IGV中进行查看
mkdir ../bw/
bedGraphToBigWig D4_CpG_STAT3_ChIP_treat_pileup.bdg ~/my_data/ref_data/hg19/hg19.chrom.sizes ../bw/D4_CpG_STAT3_ChIP_treat_pileup.bw 
 
bedGraphToBigWig D4_R848_STAT3_ChIP_treat_pileup.bdg ~/my_data/ref_data/hg19/hg19.chrom.sizes ../bw/D4_R848_STAT3_ChIP_treat_pileup.bw  
bam,bw,bed文件
362e18a058d60a8789af22b2842cef45.png

4.查看TSS附件信号强度

1.背景知识
image.png

启动子(promoter):与RNA聚合酶结合并能起始mRNA合成的序列。

转录起始点(TSS):转录时,mRNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤。

UTR(Untranslated Regions):即非翻译区,是信使RNA(mRNA)分子两端的非编码片段。

5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3'-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的末端。

2.下载TSS.bed文件:参考这篇教程,https://www.jianshu.com/p/d6cb795af22a
3.绘图代码
mkdir ../tss
在tss前后3kb的位置画图
computeMatrix reference-point --referencePoint TSS -S D4_R848_STAT3_ChIP_treat_pileup.bw D4_CpG_STAT3_ChIP_treat_pileup.bw -R ~/my_data/ref_data/hg19/hg19.bed -a 3000 -b 3000 --missingDataAsZero --skipZeros  -o ../tss/tss.gz

plotHeatmap -m tss.gz --colorMap RdYlBu_r -out tss.png
image.png
computeMatrix reference-point函数的参数
#-b/--beforeRegionStartLength INT bp:区域前多少bp
#-a/--afterRegionStartLength INT bp:区域后多少bp
#-R/--regionsFileName File:指定bed文件
#-S/--scoreFileName File:指定bw文件
#--skipZeros:默认为False
#-o/-out/--outFileName OUTFILENAME:指定输出文件名
#--outFileSortedRegions BED file

#plotHeatmap和plotProfile函数参数
#-m/--matrixFile MATRIXFILE:指定matrix名字(computeMatrix的输出文件名)
#-o/-out/--outFileName OUTFILENAME:指定输出文件名,根据后缀自动决定图像的格式
#--plotFileFormat {"png", "eps", "pdf", "plotly","svg"}:指定输出文件格式
#--dpi DPI:指定dpi
#--perGroup:默认是画一个样本的所有区域群的图,使用这个选项后则按区域群画所有样本的情况
4.TSS附件信号强度结果解读

profile图(相当于Heatmap图中最上面的折线图单独展示)


9b92e4368b4f0694d808340f28a9ce78.png

Heatmap图


8be6af9fb2c22f51ed1377769d279718.png
拿一个热图做具体说明:
ac3c4f5cd2d4111f81205637df8d24b5.jpg

可以认为在距离TSS上游x处,所有基因normalization后的信号值的均值为0.060。

相关文章

网友评论

    本文标题:CHIP-Seq(4):使用macs3 callpeak 和de

    本文链接:https://www.haomeiwen.com/subject/qjvfjrtx.html