美文网首页生信分析工具包
Lisa——预测差异表达或共表达基因集的转录调控子(TRs)的新

Lisa——预测差异表达或共表达基因集的转录调控子(TRs)的新

作者: 表观遗传小助理 | 来源:发表于2020-05-15 21:51 被阅读0次

    Cistrome Data Browser(DB)http://cistrome.org/db)大家应该很熟悉了。它收集了GEO和ENCODE里人和小鼠的转录因子ChIP-seq(〜11,000)和染色质图谱(〜12,000组蛋白标记ChIP-seq和DNase-seq)的数据。


    今年年初,cistrome发布了一个用于预测差异表达或共表达基因集的转录调控子(TRs)的新工具——Lisa。并在今年2月份,发表了《Lisa: inferring transcriptional regulators through integrative modeling of public chromatin accessibility and ChIP-seq data》的文章。下面我们就结合这篇文章来了解一下这个新一代转录调控子预测的神器。

    Lisa界面展示

    这是从cistrome进入Lisa的界面Lisa (http://lisa.cistrome.org/),页面非常简洁。转录调控子(Transcriptional regulatory,TRs)包括转录因子(transcription factors,TFs)和染色质调控因子(chromatin regulatory, CRs),转录因子结合位点和组蛋白修饰共同塑造了基因的转录调控环境。

    Lisa整合了人和小鼠的DNase-seq与H3K27ac和 TR ChIP-seq的数据来预测基因集的TRs。最后,研究者通过使用敲低,敲除,过表达,刺激或抑制某个特定TF活性的实验获得的差异表达基因集来评估了Lisa和其他TR识别方法(BART、i-cisTarget和Enrichr)的性能。


    图1 Lisa界面展示

    Lisa预测机制

    Lisa主要通过两个模型来实现TR的预测,分别是Cistrome DB ChIP-seq peak的peak-RP模型和利用染色质景观H3K27ac ChIP-seq和DNase-seq模型

    一、Cistrome DB ChIP-seq peak模型调控TR预测

    “ peak-RP”模型基于TR ChIP-seq peak,在peak-RP模型中(图. 1a),假定TR结合位点对基因表达的影响随TR结合位点转录起始位点(TSS)之间的基因组距离呈指数衰减,多个结合位点的贡献被认为是累加的

    图. 1a peak-RP模型
    二、染色质景观模型调控TR预测

    Lisa染色质景观模型使用H3K27ac ChIP-seq和DNase-seq染色质图谱来模拟不同基因组位点的调控重要性(图. 1b)。


    图. 1b chrom-RP模型

    Lisa预测流程

    基于以上两个模型,具体是如何实现预测功能的呢?我们来看一下流程图c。


    图c Lisa模型和工作流概述
    • 1.Cistrome DB中H3K27ac ChIP-seq or DNase-seq数据计算每个基因chrom-RP得分;
    • 2.找到可以区分背景集和查询基因集的基因,确定chrom-RP模型;
    • 3.对于推测的结合位点,用ISD方法评估每个TR cistrome;
    • 4.比较删除信号得到的The chrom-RP模型和未删除的背景集,计算ΔRPs;
    • 5.基于TR ChIP-seq peak模型的peak-RP,推测调控cistrome,统计背景集和查询基因集的peak-RP的差异;
    • 6.结合 H3K27ac ChIP-seq,DNase-seq和peak-RP三种方法得到的p值,TR cistromes根据最后得到的p值排序。

    源自相关细胞系类型的cistromes 可以鉴定其他细胞类型的调控因子

    首先使用Pearson相关性分析根据peak-RP得分对 Cistrome DB中所有人(8471个)TR cistromes进行**热图聚类 **(图. 3)。

    • 在对LNCaP前列腺癌细胞系中雄激素受体(AR)激活的上调基因的分析中,Lisa为AR和已知协作子FOXA1鉴定到了一个重要cistrome的聚类(图. 3a)。
    • 在对胃癌细胞系(KATO-III)中GATA6敲低的分析中,发现胃和结肠样品中的GATA6和FOXA2 cistrome最显著(图. 3b) 。
    • 除胃癌细胞系外,在结肠癌细胞系中对GATA6 cistroms的鉴定表明,源自相关细胞系类型的cistromes 可以鉴定其他细胞类型的调控因子。


      图3 Lisa对调控TF ChIP-seq样本聚类的鉴定

    Lisa除了能鉴定TF之外,也能鉴定TF协作子

    研究者检查了Lisa对四种差异表达基因集的分析,这些基因集来自GR激活以及BCL6,MYC和SOX2敲低或敲除的实验。通过Lisa分析,分别找到了肺癌中GR(图. 4a)、DLBCL细胞系中BCL6(图. 4b)、MYC以及SOX2(图. 4c)等转录调控因子的协作子,如BLC6的抑制子NCOR1/2,以及KDM2B(图. 4d)等。


    图4 Lisa可以使用Cistrome DB cistromes准确识别关键的转录因子和协作子

    系统地评价Lisa,达到更好的预测效果

    从61项研究中收集了122个差异表达的基因集,这些研究涉及27个特异的人靶向TFs的敲低、敲除、激活或过表达。比较了使用TF ChIP-seq数据和TF motif方法的不同结果 (图. 5a),发现在过表达研究中,上调基因集的所有方法的预测性能都倾向于优于下调基因集。相反,在敲低和敲除研究中,预测性能更好的是下调基因集(图. 5b,c)。同时,发现使用来自染色质景观的TR ChIP-seq peak的ISD的方法与TR ChIP-seq peak-RP方法相似,但在很大程度上优于基于motif的方法。


    图5 干扰靶向TF的排名评估

    最后,嘉因生物的小编也在Lisa上面提交了20个基因,进行尝试,Lisa网站(lisa.cistrome.org)为每个查询基因集显示两个结果表。第一个表是基于TR ChIP-seq数据的总结,第二个表是根据DNA结合motif预测的TF结合位点。ChIP-seq数据表为每个TR最多显示五个ChIP-seq样本,并且按照p值进行排序。


    图6 Lisa预测结果展示

    稳健的方法结合可视化和数据探索功能,Lisa将成为分析人类和小鼠基因调控的一个有价值的新工具。


    文章转自微信公众号:嘉因生物

    相关文章

      网友评论

        本文标题:Lisa——预测差异表达或共表达基因集的转录调控子(TRs)的新

        本文链接:https://www.haomeiwen.com/subject/mxwhohtx.html