我的ChIP-Seq(5): peaks注释

作者: NICE_AGIS | 来源:发表于2019-03-20 11:54 被阅读0次

我的ChIP-Seq(5): peaks注释
GREAT网页版学习笔记（预测顺式调控元件）
ChIP-seq之ChIPseeker注释peaks
ATAC-seq 分析（上）
【表观调控实战】六、peaks相关性绘图与ChIPQC包使用
ChIP-seq数据分析实战训练（三）
【ChIP-seq 实战】九、使用R包注释peaks
在R里面对坐标进行注释
日常笔记：在IGV里同时查看多个region/gene
我的ChIP-Seq(3):比对和call peaks

注释一般有以下几种方法，但是一般经验有：

1.比对时下载UCSC格式的参考基因组，后续操作障碍少
2.数据准备要严格按照软件的说明，若遇到格式正确就是读不进的情况，试试dos2unix file

1.ChIPseek在线工具

特点：在线，使用简单，运算速度非常快，实质是后台调用了HOMER和bedtools
TSS区域不能自己定义，观察了一下软件的定义应该是+-1000bpTSS。
input：只需准备UCSC格式的bed文件或者txt，总之染色体号是chr的而不是NC_0000的。
out：所有注释的列表txt，diffpeaks基因组分布图，还可以得到peak sequence。

2.bedtools -intersect

原理：本质是找两个文件的overlap，这里两个文件一个是注释文件一个是peaks文件的话，就相当于把peaks文件注释了。
命令：bedtools intersect -wa -wb -a */A549K27.bed -b */hs19_anno.bed
input：注释和peaks文件都要是bed/gff/vcf/bam格式，xls转的时候要注意，先xls-txt-bed
在linux中cat打不开就是格式错误，需要认真准备，或：dos2unix file 转化成linux系统识别的格式。