1.数据下载
教程的示例数据是 test _ datset. FastQ,下载地址
https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq
(它包含10,000个 FastQ 格式的读数,Phred33质量,50bp 长读数,来自人类定向 BS-Seq 库)。
wget --no-check-certificate https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq
2.下载所需要的软件
conda install -c bioconda fastqc #质控
conda install multiqc
conda install -c "bioconda/label/main" sra-tools #下载数据
conda install bowtie2 #比对工具
conda install samtools
conda install bismark
3.主要流程
和RNA-seq前期流程类似 -- 质控、去接头、比对参考基因组、排序
后期就是要提取甲基化位点,包括CpG、CHG、CHH三种context,H代表非G位点(A、C、T)。得到bedgraph文件后将个样本汇总为一个GR (GenomicRanges)文件,便于后续分析
4.质控、去接头
mkdir fastqc
fastqc --outdir fastqc --threads 16 test_data.fastq
cd fastqc
multiqc *.zip #将质控结果整合
image.png
image.png
trim-galore 去接头(可选)
如果测序的reads含有接头序列,可进行该步骤
使用trim_galore对数据进行质量控制-过滤 - 简书
(jianshu.com)
Trim Galore ——自动检测adapter的质控软件 - 简书 (jianshu.com)
网友评论