chip-seq生信笔记

作者: freemandjango | 来源:发表于2020-06-12 16:34 被阅读0次

ChIP-seq和 CUT&Tag、CUT&RUN讲座视频笔记
ATAC-seq讲座视频笔记
RIC-seq讲座视频学习
Ribo-seq讲座视频笔记
CLIP、RIP-seq讲座视频笔记
(eccDNA)circle-seq讲座视频学习
ENCODE转录因子靶基因数据库
1/2--linux下利用conda安装所需的软件，数据库下载原
MACS:使用最广泛的peak calling软件之一
deeptools可视化

染色质免疫共沉淀技术（Chromatin Immunoprecipitation，ChIP）也称结合位点分析法，是研究体内蛋白质与DNA相互作用的有力工具，通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。

流程

知乎文章：https://zhuanlan.zhihu.com/p/90180058
简书流程文章：https://www.jianshu.com/p/21e8c51fca23
从数据到igv可视化分析：https://blog.csdn.net/qq_29300341/article/details/54811085

sdd

1.数据fastqc

使用fastqc软件

fastqc file1 file2

使用multiqc软件进行多个qc结果的合并

multiqc <analysis directory>

2.基因组比对

2.1bowtie2

bowtie主要适用于将短序列比对到参考genome上，速度快。

mapping序列到genome上，首先要建立genome的index。command需要待建立的genome文件，和输出index的文件夹。

bowtie2-build [options]* <reference_in> <bt2_index_base>

bowtie将reads对比到genome上，生成sam文件；sam文件是序列比对到基因组上的结果展示，或者展示多重比对结果。sam文件包括比对的注释信息（header section）和比对结果部分（alignment section）。注释信息是比对操作的说明，包括参考序列，程序说明等；比对结果事对每一个片段（segment）的说明，包括比对到参考序列的位置，mapping的质量等的说明。

bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i> | -b <bam>} [-S <sam>]

bowtie2对比序列，首先要看是单端测序还是双端测序，双端测序需要将两端测序的链匹配起来。还可以选定输出文件的后缀和存放的目录。

使用samtools将sam文件转换为bam文件（view），将bam序列进行排序（sort）。使用samtools对bam文件的对比结果，并输出统计结果，检验测序read的质量。

samtools view [options] <in.bam>|<in.sam>|<in.cram> [region ...]

options -b输出bam文件

samtools sort [options...] [in.bam]

对bam文件进行sort排序能进一步减小文件体积，加快运算速度。

3.实验组和control组对比差异

3.1 macs2比较不同组数据callpeak

chip-seq的可以检测的富集方式包括两种：1.broad domains和narrow peak。broad domain是组蛋白在整个基因组的修饰，narrow peaks是特定的突出指，如转录因子的结合。当需要对特定的目标靶点进行研究时，可以利用treat组和control组进行对比，找出二者的不同。所谓callpeak，是指寻找基因组上的表达峰peak，chip-seq是对蛋白结合的DNA进行测序，每个read都意味着有一个蛋白结合到基因组的该处上，基因组的peak就是read表达量最高的地方，调控因子一般都在gene的上游或者下游，离gene越近的调控因子与gene表达的相关性越高，所以要callpeak，寻找不同gene之间以及gene和转录因子之间的关系等。

macs2 callpeak [-h] -t TFILE [TFILE ...] [-c [CFILE [CFILE ...]]]

-t为treatment组数据，-c为control组数据，-g选择genome，还可以设置输出的目录和文件名，--bdg可以bdg文件，用于igv查看peaks。

macs检验值设立：https://www.jianshu.com/p/390f6d57488d

3.2 IGV分析

将callpeak生成的.bdg文件直接放入IGV(intergrative genomic viewer)。

4.motif分析

motif分析。寻找peak序列的共同模式序列。motif的输入文件为call的".bed"文件。“.bed”文件包含的信息为peak（summit）所在染色体和具体位置。

homer annotatePeak.pl

annotatePeaks.pl <peak file | tss> <genome version> [additional options...]
分为两种，一种只对peak的信息进行注释，展现peak相关的gene和到geneTSS
（transcription start site）的距离。

另一种是对peak和read的信息进行annotate，显示reads在peak summit 两侧的分布情况。
首先要用homer的makeTagDirectory对.bam文件进行处理生成tag文件夹。生成tag文件的处理，包括对bam文件的排序，质控，以及生成一些后续分析需要的重要参数。
然后再进行annotatePeaks.pl分析，加上参数
-d <tag directory 1> [tag directory 2] ... (list of experiment directories to show tag counts for)
再使用生成的annotation的文件，使用R进行绘图。

deeptools分析画图。

homer findmotifsGenome.pl

只需要macs得出的peaks的bed文件，和选择参考gene组就可以。
findMotifsGenome.pl <pos file> <genome> <output directory> [additional options]

deeptools可以完成homer进行的下游分析包括画图。

网友评论

本文标题：chip-seq生信笔记

本文链接：https://www.haomeiwen.com/subject/ilhntktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

chip-seq生信笔记

流程

1.数据fastqc

2.基因组比对

2.1bowtie2

3.实验组和control组对比差异

3.1 macs2比较不同组数据callpeak

3.2 IGV分析

4.motif分析

homer annotatePeak.pl

homer findmotifsGenome.pl

deeptools可以完成homer进行的下游分析包括画图。

相关文章

ChIP-seq和 CUT&Tag、CUT&RUN讲座视频笔记

ATAC-seq讲座视频笔记

RIC-seq讲座视频学习

Ribo-seq讲座视频笔记

CLIP、RIP-seq讲座视频笔记

(eccDNA)circle-seq讲座视频学习

ENCODE转录因子靶基因数据库

1/2--linux下利用conda安装所需的软件，数据库下载原

MACS:使用最广泛的peak calling软件之一

deeptools可视化

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读