美文网首页3D基因组
hic分析之 hic-pro 介绍与安装

hic分析之 hic-pro 介绍与安装

作者: Ray钱 | 来源:发表于2019-08-20 22:18 被阅读12次

    一、hic-pro是什么,参考网页:

    [GitHub] https://github.com/nservant/HiC-Pro
    [DOCUMENTATION] http://nservant.github.io/HiC-Pro/

    hic pro 将下机的fastq文件

    SRR400264_00_R1.fastq.gz 
    SRR400264_00_R2.fastq.gz
    

    处理成有互作的

    dixon_2M.allValidPairs
    

    然后用转化为可视化的.hic文件(for juicer )

    二、install

    The HiC-Pro pipeline requires the following dependencies :

    • bowtie2 mapping工具
    • Python (>2.7) with pysam (>=0.8.3), bx(>=0.5.0), numpy(>=1.8.2), and scipy(>=0.15.1) python的库
    • R with the RColorBrewer and ggplot2 两个R包
    • g++ compiler
    • Samtools (>0.1.19)

    Bowtie >2.2.2 is strongly recommanded for allele specific analysis.

    To install HiC-Pro (>=2.7.8):

    tar -zxvf HiC-Pro-master.tar.gz
    cd HiC-Pro-master
    ## Edit config-install.txt file if necessary
    make configure
    make install
    

    注意编辑
    config-install.txt 和config-system.txt的时候,最好which 上面的依赖位置。

    三、参考文件

    需要三个参考文件,两个

    /PATH/TO/HiC-Pro_2.11.1/annotation
    chrom_hg19.sizes     
    chrom_mm10.sizes
    HindIII_resfrag_mm10.bed  
    HindIII_resfrag_hg19.bed
    
    

    1.根据限制性内切酶消化的参考基因组信息 .bed文件

    head HindIII_resfrag_hg19.bed
    chr1    0       16007   HIC_chr1_1      0       +
    chr1    16007   24571   HIC_chr1_2      0       +
    chr1    24571   27981   HIC_chr1_3      0       +
    chr1    27981   30429   HIC_chr1_4      0       +
    chr1    30429   32153   HIC_chr1_5      0       +
    chr1    32153   32774   HIC_chr1_6      0       +
    chr1    32774   37752   HIC_chr1_7      0       +
    chr1    37752   38369   HIC_chr1_8      0       +
    chr1    38369   38791   HIC_chr1_9      0       +
    
    

    2.染色体大小的表格文件

    head chrom_hg19.sizes
    chr1    249250621
    chr2    243199373
    chr3    198022430
    chr4    191154276
    chr5    180915260
    chr6    171115067
    chr7    159138663
    chr8    146364022
    chr9    141213431
    chr10   135534747
    (…………)
    

    3.bowtie2 indexes
    不细说

    四、用法

    #test
    HiC-Pro -i /PATH/TO/HiC-Pro_2.11.1/test-op/hicpro_latest_test -c /PATH/TO/HiC-Pro_2.11.1/HiC-Pro_2.11.1/test-op/config_test_latest.txt 
    

    先编辑config-hicpro.txt 每个任务,对应一个config文件
    看一下config文件是什么?

    # Please change the variable settings below if necessary
    
    #########################################################################
    ## Paths and Settings  - Do not edit !
    #########################################################################
    
    TMP_DIR = tmp
    LOGS_DIR = logs
    BOWTIE2_OUTPUT_DIR = bowtie_results
    MAPC_OUTPUT = hic_results
    RAW_DIR = rawdata
    
    #######################################################################
    ## SYSTEM AND SCHEDULER - Start Editing Here !!
    #######################################################################
    N_CPU = 2
    LOGFILE = hicpro.log
    
    JOB_NAME =
    JOB_MEM =
    JOB_WALLTIME =
    JOB_QUEUE =
    JOB_MAIL =
    
    #########################################################################
    ## Data
    #########################################################################
    
    PAIR1_EXT = _R1
    PAIR2_EXT = _R2
    
    #######################################################################
    ## Alignment options
    #######################################################################
    
    MIN_MAPQ = 10
    
    BOWTIE2_IDX_PATH =
    BOWTIE2_GLOBAL_OPTIONS = --very-sensitive -L 30 --score-min L,-0.6,-0.2 --end-to-end --reorder
    BOWTIE2_LOCAL_OPTIONS =  --very-sensitive -L 20 --score-min L,-0.6,-0.2 --end-to-end --reorder
    
    #######################################################################
    ## Annotation files
    #######################################################################
    
    REFERENCE_GENOME = hg19
    GENOME_SIZE = chrom_hg19.sizes
    
    #######################################################################
    ## Allele specific analysis
    #######################################################################
    
    ALLELE_SPECIFIC_SNP =
    
    #######################################################################
    ## Capture Hi-C analysis
    #######################################################################
    
    CAPTURE_TARGET =
    REPORT_CAPTURE_REPORTER = 1
    
    #######################################################################
    ## Digestion Hi-C
    #######################################################################
    
    GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
    LIGATION_SITE = AAGCTAGCTT
    MIN_FRAG_SIZE =
    MAX_FRAG_SIZE =
    MIN_INSERT_SIZE =
    MAX_INSERT_SIZE =
    
    #######################################################################
    ## Hi-C processing
    #######################################################################
    
    MIN_CIS_DIST =
    GET_ALL_INTERACTION_CLASSES = 1
    GET_PROCESS_SAM = 0
    RM_SINGLETON = 1
    RM_MULTI = 1
    RM_DUP = 1
    
    #######################################################################
    ## Contact Maps
    #######################################################################
    
    BIN_SIZE = 20000 40000 150000 500000 1000000
    MATRIX_FORMAT = upper
    
    #######################################################################
    ## Normalization
    #######################################################################
    MAX_ITER = 100
    FILTER_LOW_COUNT_PERC = 0.02
    FILTER_HIGH_COUNT_PERC = 0
    EPS = 0.1
    

    需要修改的地方:

    #######################################################################
    ## SYSTEM AND SCHEDULER - Start Editing Here !!
    #######################################################################
    N_CPU = 2
    LOGFILE = hicpro.log
    
    JOB_NAME =
    JOB_MEM =
    JOB_WALLTIME =
    JOB_QUEUE =
    JOB_MAIL =
    
    BOWTIE2_IDX_PATH =
    
    #######################################################################
    ## Digestion Hi-C
    #######################################################################
    
    GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
    LIGATION_SITE = AAGCTAGCTT
    MIN_FRAG_SIZE =
    MAX_FRAG_SIZE =
    MIN_INSERT_SIZE =
    MAX_INSERT_SIZE =
    

    注意一个细节:

    /PATH/TO/HiC-Pro/HiC-Pro_2.11.1/test-op/hicpro_latest_test
    ├── dixon_2M
    │   ├── SRR400264_00_R1.fastq.gz
    │   └── SRR400264_00_R2.fastq.gz
    └── dixon_2M_2
        ├── SRR400264_01_R1.fastq.gz
        └── SRR400264_01_R2.fastq.gz
    
    
    HiC-Pro 
    ### -i 需要输入input文件夹,要按照上面那个格式,将 hicpro_latest_test 作为input目录,下面可以加入样品分组目录。
    -i /PATH/TO/HiC-Pro_2.11.1/test-op/hicpro_latest_test  
    -c /PATH/TO/HiC-Pro_2.11.1/HiC-Pro_2.11.1/test-op/config_test_latest.txt 
    

    下一章 hic分析之分步工作原理

    写在最后,珍惜生命,别用mac。

    相关文章

      网友评论

        本文标题:hic分析之 hic-pro 介绍与安装

        本文链接:https://www.haomeiwen.com/subject/oynpsctx.html