美文网首页HiC分析三维基因组学
【三维基因组】高分辨率ABcompartment?尝试这两款!

【三维基因组】高分辨率ABcompartment?尝试这两款!

作者: XuningFan | 来源:发表于2020-07-09 18:41 被阅读0次
    image.png image.png

    在前面我们介绍了ABcompartment分析的软件 cworld 软件(https://www.jianshu.com/p/2cd156681a46),但是cworld 软件是用perl+python组合来写的,计算效率不高,需要内存大,这就导致了我们在进行高分辨率ABcompartment 分析的时候,往往会遇到这样的情况——程序运行了很久,最后报了一个“Memory Error”之后销声匿迹。针对这个问题,今天推荐两款软件:
    一juicer 软件
    juicer 软件能够以5kb的分辨率来计算eigenvector (如下图)。

    企业微信截图_386290ea-83e5-475c-a5d4-7d6fb5d7f122.png

    二 CscoreTool (https://github.com/scoutzxb/CscoreTool
    )是一款分析compartment的快速工具。

    image.png
    Usage: CscoreTool1.1 < windows.bed> < input.summary> < outputPrefix> < session> < minDis> [chrName]
    

    输入参数

    a. windows.bed此文件用于指定要分析的基因组窗口。它应该是等长的bed文件,覆盖目标区域,大概是整个染色体或整个基因组。
    windows.bed 文件格式:

    chr1    1       10000
    chr1    10001   20000
    chr1    20001   30000
    chr1    30001   40000
    chr1    40001   50000
    chr1    50001   60000
    chr1    60001   70000
    chr1    70001   80000
    

    b. input.summary该文件是Hi-C交互的主要输入文件(HicPro 生成的validpairs文件前7列)。
    vaildpair 前7列:

    D258GACXX130605:6:1106:12664:6611   chr1    755519  +   chr1    755925  -
    D258GACXX130605:6:2114:9811:10334   chr1    808619  +   chr1    175784252   -
    C24LCACXX130513:6:2205:5035:47173   chr1    841140  +   chr1    801416  -
    C24LCACXX130513:6:1203:16707:42415  chr1    853901  +   chr1    880189  -
    D258GACXX130605:6:1116:10492:97284  chr1    855471  +   chr1    855853  -
    C24LCACXX130513:6:2305:3295:12387   chr1    869064  +   chr1    838284  -
    D258GACXX130605:6:2215:16114:89299  chr1    893617  +   chr1    894051  -
    C24LCACXX130513:6:2204:16005:64911  chr1    910016  -   chr1    5806178 -
    C24LCACXX130513:6:1214:10668:2084   chr1    929444  +   chr1    940247  +
    D258GACXX130605:6:1101:5936:36199   chr1    931624  -   chr1    950942  -
    

    C. OutputPrefix这是输出文件的前缀。
    d. session这是要使用的会话数。会话的数量取决于可用的资源。该程序未完全并行化,因此使用更多会话只能部分提高速度。

    e.minDis这是要考虑的最小交互距离的标准。它应不小于分析分辨率。我们建议使用1000000(1M),因为与A / B间隔相比,更短距离的交互可能受TAD结构的影响更大。

    F. chrName这是一个可选参数。用户可以指定某个染色体进行分析。

    示例运行:

    CscoreTool1.1 hg19_chr1_10k.bed Test.summary Test_chr1_10k 12 1000000 chr1

    输出量
    有4个输出文件。

    XXX_bias.txt这是每个基因组窗口的估计偏倚因子。 XXX_hh.txt这是估算的距离曲线。相应的距离是10 ^(0.04 * n),其中n是第一列中的数字。 XXX_cscore.txt这是每个基因组窗口估计的Cscore。 XXX_cscore.bedgraph这是用于可视化的基础图文件。低映射窗口(偏差<0.2)或高拷贝数窗口(偏差> 5)已被过滤。 CscoreTool论文中涉及分析的所有基准图文件都可以在Bedgraphs.zip文件中找到。

    核心结果文件XXX_cscore.bedgraph:

    track type="bedGraph" name="test_cscore.bedgraph"
    chr1    710000  720000  -0.203475
    chr1    750000  760000  -0.857018
    chr1    760000  770000  -0.9999
    chr1    770000  780000  -0.9999
    chr1    780000  790000  -0.703065
    chr1    790000  800000  0.366704
    chr1    800000  810000  -0.9999
    chr1    810000  820000  -0.9999
    chr1    820000  830000  -0.9999
    

    相关文章

      网友评论

        本文标题:【三维基因组】高分辨率ABcompartment?尝试这两款!

        本文链接:https://www.haomeiwen.com/subject/dnkjcktx.html