美文网首页Hi-C数据分析
使用TADbit识别拓扑关联结构域

使用TADbit识别拓扑关联结构域

作者: 生信修炼手册 | 来源:发表于2019-08-19 17:13 被阅读3次

欢迎关注”生信修炼手册”!

TADbit是一个hi-c数据分析的软件,提供了从原始数据处理到染色质三维模型构建的完整功能,对应的文章链接如下

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5540598/

该软件的pipeline如下图所示

总体分成以下3个功能模块

  1. FASTQ

  2. Interacton Matrix

  3. 3D Models

第一个模块从原始的fastq文件开始,对序列进行质量过滤,采用GEM软件将clean reads比对参考基因组,然后进行筛选,构建原始的交互矩阵,并进行归一化处理,得到归一化之后的交互矩阵。

第二个模块用于可视化hi-c交互矩阵,并且可以在交互矩阵的基础上,识别TAD拓扑关联结构域,对TAD进行可视化,聚类等分析。

第三个模块用于构建染色质三维构象的模型,并进行结构分析。

本文简单整理下第二个模块的具体用法,详细步骤如下

1. 可视化hi-c矩阵

该软件采用python进行开发,采用了面向对象的编程思想,首先要做的就是构建一个object, 构建的过程中需要对应的hi-c交互矩阵, 软件自带的测试数据集包含了以下两个hi-c矩阵

HIC_gm06690_chr19_chr19_100000_obs.txt
HIC_k562_chr19_chr19_100000_obs.txt

对应GM06690K562两种细胞系19号染色体100kb分辨率下的交互矩阵。基于这两个交互矩阵构建对象并可视化的代码如下

可视化的效果图如下

2.  预测TAD结构域并可视化

有两种可视化的策略,第一种是在hi-c的热图上用矩形标记TAD区域,第二种称之为density plot, 用法如下

热图标记TAD之后的效果图如下

density  plot的效果图如下

3. TAD Alignment

将多个细胞或组织的TAD进行比较,可以分析其位置是否具有保守性。用法如下

效果图如下所示

TADbit的用法简单,可视化效果也很棒,唯一的缺点就是安装特别费劲。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

相关文章

  • 使用TADbit识别拓扑关联结构域

    欢迎关注”生信修炼手册”! TADbit是一个hi-c数据分析的软件,提供了从原始数据处理到染色质三维模型构建的完...

  • TAD:拓扑关联结构域简介

    欢迎关注”生信修炼手册”! 利用更低分辨率的Hi-C基因组互作图谱,科学家对染色质空间结构的了解不断深入。本文主要...

  • maya 保持UV的情况下重新拓扑

    使用maya减面重拓扑神器从新拓扑 从新拓扑后的UV发现UV散乱了 使用不同拓扑传递UV工具吧好的UV传递到从新拓...

  • 空间数据拓扑处理的基本操作

    1.拓扑概述: 拓扑表达的是地理对象之间的相邻、包含、关联等空间关系,是一种描述地理数据空间关系的模型。在ArcG...

  • LeetCode 第207题:课程表

    1、前言 2、思路 使用拓扑排序的方法,拓扑排序其实是使用的 BFS 算法,简而言之使用 BFS 算法解题。算法流...

  • Brand Design

    1 品牌调研 理解度?是否好理解? 识别度?是否好识别? 认知度?是否有听说?见过? 关联度?母子品牌是否有关联度...

  • 【生信】基因家族分析·学习组学大讲堂的笔记

    本文所选文章: 1、基因识别与鉴定 S1:下载基因组蛋白质序列 S2:搜索结构域 Hmmer搜索PF00011,找...

  • 2018-03-31

    销量预测,全国/区域性爆款识别,关联品识别__货品分层 分享,新人考核 全流程可视化

  • 3.4 使用广播信道的Ethernet

    目前Ethernet使用“双绞线”,采用“星形拓扑”,星形中心使用hub连接各站点。 使用hub的Ethernet...

  • Motif和domain的区别

    Protein domain: 结构域domain的概念由Wetlaufer于1973年首次提出,他定义结构域为可...

网友评论

    本文标题:使用TADbit识别拓扑关联结构域

    本文链接:https://www.haomeiwen.com/subject/qnjesctx.html