现在已经找出了转录因子的结合位点,那么这些位点所调控的基因具有什么功能,就得需要进行功能富集分析。有两种方法
方法一
great网站:GREAT Input: Genomic Regions Enrichment of Annotations Tool, Bejerano Lab, Stanford University
直接在网站里输入bed文件
这里需要转录因子结合位置的位置信息,只需要三列,
第一列:染色体号
第二列:起始位置
第三列:终止位置
cut -f 1-3 D4_CpG_STAT3_ChIP_peaks.narrowPeak > D4_CpG_STAT3_ChIP_peaks.bed
富集到免疫相关的功能,和原文一致
image.png
方法二
找到转录因子结合位点所对应的基因名字,使用DAVID网站DAVID: Functional Annotation Tools (ncifcrf.gov)
#####1.寻找转录因子结合位点所对应的基因名字,使用homer进行peak注释
#注意需要将bed文件改造为homer所能识别的格式,改造过程在第七步,使用homer寻找motif
annotatePeaks.pl D4_R848_STAT3_homer.bed hg19 > D4_R848_STAT3.xls
第一个参数为peak的bed文件,第二个参数为参考基因组的名称。输出结果如下所示
image.png
注释的内容包含两个部分,第一部分是距离peak区间最近的转录起始位点TSS,第二部分是对peak在基因组区域的分布,比如TSS,TTS,3’UTR,5’UTR等区域。第16列表示基因名字
网友评论