2020-03-19

作者: 止水_7c47 | 来源:发表于2020-03-19 20:27 被阅读0次

为了寻找我的RNA-seq差异基因集（172个基因）的转录因子，这两天研究了一下

Toolkit for Cistrome Data Browser http://dbtoolkit.cistrome.org/

利用它的第三个模块：What factors have a significantbinding overlap with your peak set?

下载了基因组中各基因位置信息列表（bed文件）和基因组中各转录因子结合位点信息列表（bed文件），具体步骤也可见下图

但是第二个——基因组中各转录因子结合位点信息列表（bed文件）我没下下来（本次操作不需要）

（2）利用基因组中各基因位置信息列表（bed文件）和我的差异基因集文本文件，通过R合成一个Toolkit for Cistrome Data Browser要求的bed文件——差异基因的基因位置BED文件（up 172 txt李同学帮助）。也可以通过EXCEL的VLOOKUP操作实现

（参考http://www.360doc.com/document/20/0319/09/66761008_900260546.shtml），但chr的加入需要手动一个一个加入，因为公式法加入的chr，Toolkit不识别。

（3）在EXCEL中修改差异基因的基因位置BED文件：

获得差异基因的基因上游启动子区域位置坐标BED文件（2up172zhou txt 周老师帮助）

一般对于正链基因（Strand为1）启动子的start和end 位置分别=基因起点-5000，基因起点-1。

对于负链基因（Strand为-1）启动子的start和end 位置分别=基因终点+1，基因终点+5000。

（4）运行Toolkit for Cistrome Data Browser，得到结果

（5）结果的理解可参考Cistrome DB ToolkitDocumentation

网友评论

本文标题：2020-03-19

本文链接：https://www.haomeiwen.com/subject/kahryhtx.html

2020-03-19