美文网首页Hi-CHi-C文章收藏2023
HiC数据预处理后一些输出格式(整理中,欢迎补充)

HiC数据预处理后一些输出格式(整理中,欢迎补充)

作者: xuzhougeng | 来源:发表于2020-05-20 10:04 被阅读0次

    Juicer的输出文件: merged_nodups.txt

    1. read1的FLAG,对应SAM的第二列,FLAG
    2. read1比对的contig,对应SAM的第三列,RNAME
    3. read1比对的contig的位置,对应SAM的第四列,POS
    4. read1排序后的位置编号
    5. read2的FLAG,对应SAM的第二列,FLAG
    6. read2比对的contig,对应SAM的第三列,RNAME
    7. read2比对的contig的位置,对应SAM的第四列,POS
    8. read1排序后的位置编号
    9. read1的比对得分,对应SAM的第五列,MAPQ
    10. read1的CIGAR,对应SAM的第六列,CIGAR
    11. read1的序列
    12. read2的比对得分,对应SAM的第五列,MAPQ
    13. read2的CIGAR,对应SAM的第六列,CIGAR
    14. read2的序列
    15. read1的ID
    16. read2的ID

    Read所在链可以通过FALG计算,我统计之后发现只有0和16两个值(2048会被直接过滤掉),0表示'+',而16表示'-'。

    HiC-Pro的输出文件*.allValidPairs

    • read的ID
    • read1比对的contig,对应SAM的第三列,RNAME
    • read1比对的contig的位置,对应SAM的第四列,POS
    • read1所在链
    • read2比对的contig,对应SAM的第三列,RNAME
    • read2比对的contig的位置,对应SAM的第四列,POS
    • read2所在链

    相关文章

      网友评论

        本文标题:HiC数据预处理后一些输出格式(整理中,欢迎补充)

        本文链接:https://www.haomeiwen.com/subject/evxgohtx.html