美文网首页
NextPolish对基因组进行polish

NextPolish对基因组进行polish

作者: 斩毛毛 | 来源:发表于2021-02-08 11:05 被阅读0次

    NextPolish由未来组开发对基因组序列进行polish的工具,对三代以及二代均可进行polish。

    gituhp地址:https://github.com/Nextomics/NextPolish

    基因组进行de novo组装后,得到contig,必须使用三代(尤其是没有consensus,比如minimap2+miniasm),二代进行纠错。NextPolish是一个非常不错的选择,同时支持三代,二代,hifi进行纠错。

    1 安装

    本次安装的最新版本为v1.3.1, 下载后

    tar -vxzf NextPolish.tgz && cd NextPolish && make
    

    2 配置文件

    [General]
    job_type = local  ## local, sge, pbs... (default: sge)
    job_prefix = nextPolish # 输入名
    task = best # 有【all, default, best,1,2,5,12,1212..】1,2 针对二代reads,5 针对长reads,默认为best即可
    rewrite = no # 以后文件是否覆盖结构;默认 no
    rerun = 3 # 未完成jobs进行再次运行;默认 3
    parallel_jobs = 2 # 并行的任务;默认6
    multithread_jobs = 3 # 每一个任务线程; 默认 5
    genome = ./raw.genome.fasta # 基因组文件
    genome_size = auto # 自动即可
    workdir = ./01_rundir # 输入文件
    polish_options = -p {multithread_jobs} # 进行polish的进行数量
    
    [sgs_option] ## 短reads参数设置
    sgs_fofn = ./sgs.fofn #  含有二代reads路径的文本,每行一个文件
    sgs_options = -max_depth 100 -bwa # 默认用bwa进行比对,还可以选择minimap2
    
    [lgs_option] # 长reads 参数设置(如果仅用二代,这个可以删除)
    lgs_fofn = ./lgs.fofn # 含有长reads的文本文件
    lgs_options = -min_read_len 5k -max_depth 100
    lgs_minimap2_options = -x map-ont ## pacbio为map-pb, ont为map-ont
    

    3 运行示例文件

    nextPolish test_data/run.cfg
    

    结果为/NextPolish/test_data/01_rundir/genome.nextpolish.fasta
    序列小写字母表示低质量碱基,一般由于杂合导致

    参考

    相关文章

      网友评论

          本文标题:NextPolish对基因组进行polish

          本文链接:https://www.haomeiwen.com/subject/ebuxxltx.html