美文网首页
BS-Seq(2) -- 数据下载,质控

BS-Seq(2) -- 数据下载,质控

作者: Z_bioinfo | 来源:发表于2022-12-11 18:32 被阅读0次

    1.数据下载

    教程的示例数据是 test _ datset. FastQ,下载地址

    https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq
    

    (它包含10,000个 FastQ 格式的读数,Phred33质量,50bp 长读数,来自人类定向 BS-Seq 库)。

    wget --no-check-certificate  https://www.bioinformatics.babraham.ac.uk/projects/bismark/test_data.fastq
    

    2.下载所需要的软件

    conda install -c bioconda fastqc #质控
    conda install multiqc
    conda install -c "bioconda/label/main" sra-tools #下载数据
    conda install bowtie2 #比对工具
    conda install samtools
    conda install bismark
    
    

    3.主要流程

    和RNA-seq前期流程类似 -- 质控、去接头、比对参考基因组、排序
    后期就是要提取甲基化位点,包括CpG、CHG、CHH三种context,H代表非G位点(A、C、T)。得到bedgraph文件后将个样本汇总为一个GR (GenomicRanges)文件,便于后续分析

    4.质控、去接头

    mkdir fastqc
    fastqc --outdir fastqc  --threads 16 test_data.fastq
    cd fastqc
    multiqc *.zip #将质控结果整合
    
    image.png
    image.png

    trim-galore 去接头(可选)
    如果测序的reads含有接头序列,可进行该步骤
    使用trim_galore对数据进行质量控制-过滤 - 简书
    (jianshu.com)

    Trim Galore ——自动检测adapter的质控软件 - 简书 (jianshu.com)

    相关文章

      网友评论

          本文标题:BS-Seq(2) -- 数据下载,质控

          本文链接:https://www.haomeiwen.com/subject/dxdxqdtx.html