美文网首页
2022-03-24利用BatMeth2分析甲基化数据

2022-03-24利用BatMeth2分析甲基化数据

作者: AsuraPrince | 来源:发表于2022-03-24 21:32 被阅读0次

    详细参考路径为:https://www.dna-asmdb.com/tools/batmeth2-tutorial/bt2-pipeline.html

    https://batmeth2-docs.readthedocs.io/en/latest/function/PlotMeth.html

    BatMeth2软件介绍:

    Batmeth2是一款操作简便的亚硫酸氢盐测序(BS-Seq)分析流程工具包,它可以在允许不同长度插入缺失(Indel)情况下准确地完成亚硫酸测序序列比对。为了方便DNA甲基化数据分析,BatMeth2可以从raw reads测序数据比对到数据可视化、并最后生成HTML可视化报告文件。

    相关功能包括:

    亚硫酸氢盐测序数据比对;

    甲基化水平计算,包括单碱基水平的甲基化水平、基因组区域或者基因转座子等功能区域的甲基化水平;

    差异甲基化胞嘧啶/区域(DMC/DMR)检测功能;

    甲基化水平可视化。

    这些功能可以作为一个全流程使用,也可以分步单独运行,非常有利于亚硫酸氢盐数据分析。

    BatMeth2 安装

    一、安装要求

    GCC(v4.8),GSL

    SAMtools(建议>1.3.1版本)

    Fastp,如果将原始数据做为输入文件,需要这个软件,否则不必

    Fastp下载:wget http://opengene.org/fastp/fastp

    Fastp权限更改: chmod 744 fastp

    二、安装Batmeth2的过程

    下载软件安装包BatMeth2-master.zip(https://github.com/GuoliangLi-HZAU/BatMeth2)

    解压软件安装包BatMeth2-master.zip

    将解压后的软件目录“BatMeth2-master”修改为“BatMeth2”

    安装过程

    cd BatMeth2

    ./configure

    make

    make copy

    如果不需要gzip格式的进程文件,你可以使用以下过程安装软件:

    cd BatMeth2

    ./configure

    make nogzip

    make copy-nogzip

    BatMeth2的二进制文件将创建于bin目录下

    BatMeth2 分析流程

    为了更方便地完成DNA甲基化数据分析,我们打包了所有功能,以完成易于使用的自动运行包,用于DNA甲基化分析。在执行BatMeth2期间,会生成有关样本统计信息的html报告。

    在进行数据分析前,需要准备基因组和索引文件

    首先准备fasta格式的参考基因组

    对于WGBS数据,建立索引:

    BatMeth2 index -g GENOME.fa

    对于RRBS数据,建立索引:

    BatMeth2 index_rrbs -g GENOME.fa

    数据分析

    对于原始数据,运行命令

    ###### COMMANDBatMeth2 pipel --fastp ~/location/to/fastp -1 Raw_reads_1.fq.gz -2 Raw_read_2.fq.gz -g ./batmeth2index/genome.fa -o meth -p 6 --gff ./gene.gff

    经过质量过滤后的数据,运行命令:

    ###### COMMANDBatMeth2 pipel -1 Clean_reads_1.fq.gz -2 Clean_read_2.fq.gz -g ./batmeth2index/genome.fa -o meth -p 6 --gff ./gene.gff

    BatMeth2 分析流程主要包含:测序序列质量过滤、DNA甲基化序列比对、DNA甲基化水平计算、DNA甲基化水平功能注释以及DNA甲基化水平可视化等功能。

    主要参数如下:

    数据质量控制

    --fastp fastp程序路径, 如果未指定--fastp参数,输入文件应该使用质控后的数据

    序列比对

    --aligner 指定比对程序,默认BatMeth2,可选程序bwa-meth, bsmap, bismark2, no(输出目录下已有比对结果文件)

    必要参数

    -i  输入文件,如果是双端数据,请使用-1, -2参数,输入文件可以使用逗号分隔

    -1  输入文件左端的文件,如果是单端请使用-i参数

    -2  输入文件右端的文件

    -g  比对使用的参考基因组路径

    -p  线程数,默认6

    -O  输出结果目录,默认是输出到当前目录下(./)

    -o  输出文件的前缀

    选用其他比对软件时:

    --go 选用其他比对软件(bsmap/bwa-meth/bismark)进行比对时,需指定该软件对应的基因组索引文件

    计算甲基化水平

    --Qual      当read质量分数>=Q,用于甲基化水平分析,默认是10

    --redup      去除PCR冗余,0或者1,默认是0.

    --region    设置计算甲基化水平区间大小,可用于后续差异分析,默认参数是1000bp。

    -f          对于sam格式输出文件,包含methState属性。[0或者1],默认为0

    --coverage  设置最小的覆盖度,默认是5

    --binCover  每个区域最小的nCs,默认是3

    --chromstep  染色体使用100000bp的重叠滑动窗口,步长为50000bp。 默认为:50000(bp)

    DNA甲基化功能注释

    --gtf/--gff/--bed  Gtf文件,gff文件或者bed文件

    --distance        分布于基因bocy和上下游的DNA甲基化水平。设置上游和下游的距离,默认是2000bp

    --step            基因及其两侧序列使用序列长度的5%的重叠滑动窗口,步长为序列长度的2.5%,默认步长为0.025(2.5%)

    -C                测序覆盖度不能超过该数值,默认是1000

    --coverage        设置最小的覆盖度,默认是5

    --binCover        每个区域最小的nCs,默认是3

    相关文章

      网友评论

          本文标题:2022-03-24利用BatMeth2分析甲基化数据

          本文链接:https://www.haomeiwen.com/subject/avbljrtx.html