美文网首页
DRUG-seq(小规模高通量转录组测序)用于药物研发

DRUG-seq(小规模高通量转录组测序)用于药物研发

作者: 熊猫人和熊猫猫 | 来源:发表于2022-07-25 14:07 被阅读0次

    文献下载链接:DRUG-seq for miniaturized high-throughput transcriptome profiling in drug discovery
    发表期刊:《Nature communication》
    影响因子:17.69
    时间:2018年

    0. 文献背景

    RNA-seq是一个利用转录组变化作为指标来研究药物效应的强大工具,但标准的RNA-seq文库构建费用是昂贵的。因此作者开发了DRUG-seq这一方法,在降低RNA-seq文库构建费用(1/100)的同时,对8种剂量的433种化合物进行了分析,生成的转录谱根据作用机制成功得将化合物划分成不同的功能簇(相同靶标的化合物聚类在一起)。相同靶标的不同化合物的扰动差异可以通过转录组的表达差异来反映,进而理解一些化合物的脱靶效应。

    应用方向:
    (1) 新的化合物机制研究
    (2) 老药新用研究
    (3) 识别基于CRISPR/cas9的基因敲除的基因转录网络

    1. DRUG-seq方法介绍

    通过将特定的条形码(well barcode)序列引入到RT引物中,单个孔中提取的cDNA被标记,然后在第一链合成后汇集在一起,显著减少了多孔处理所涉及的人工劳动。


    图1. DRUG-seq的方法概览: 图a.DRUG-seq操作流程;图b.DRUG-seq的原理图

    1.1 well之间的交叉污染低

    实验设计:使用鼠源细胞系C2C12和人源细胞系293T在384孔板中交叉设置,执行DRUG-seq步骤

    结论:98%以上的小孔获得的UMI特异性>96%

    图2. 混合物种实验评估交叉污染; 图b.不同well中的UMI比对人、鼠参考基因组的数量: 横坐标表示比对到小鼠基因组的UMI数量,纵坐标表示比对到人基因组的UMI数量,一个点代表一个well;图c. 人和小鼠的基因表达相关性分析:红色表示相关性高,蓝色表示相关性低,可以看到人和小鼠的序列是完全可以区分的

    1.2 低测序深度满足化合物药效分析需求

    实验设计:
    (1)设置两种药物处理:选择一种有效的转录抑制剂Cmp_078(雷公藤甲素)和一种翻译抑制剂Cmp_263(高三尖杉醇酯)处为实验提供不同的反应机制。
    (2)设置4种剂量处理:样品分别用DMSO或增加0.1uM、1uM、10uM化合物处理(重复处理3次)
    (3)设置3种测序深度处理:DRUG-seq文库的测序深度分别设置为 2 million reads/well,13 million reads/well,42 million reads/well(population RNA-seq)。

    结论:
    (1) 2 million reads/well与13 million reads/well相比,并没有显著增加基因检出量(图a,表a,图s4a)
    (2) DRUG-seq的假基因检出与population RNA-seq相比没有偏好性(图s4.c)
    (3) 低丰度转录本的检出受到测序深度的限制(图b)

    图a. 不同测序深度下的基因检出数:横坐标表示测序深度,纵坐标表示基因检出数,从下-->上的3个不同三点图分别代表2 million reads/well,13 million reads/well,population RNA-seq的处理组,其中一个点代表一个well; 表a.DRUG-seq处理组的gene检出率与population RNA-seq媲美:population RNA-seq包含所有的L1000标志性基因,DRUG-seq 2mil/well包含83%的L1000标志性基因;图s4a. DRUG-seq 2mil/well的相关性分析:任意两样本的表达谱相关性系数高达0.92; 图s4c. 假基因在DRUG-seq 2mil/well与population RNA-seq的检出相当:横坐标表示基因在population RNA-seq的标准化检出量,纵坐标表示基因在DRUG-seq 2mil/well的标准化检出量,一个点表示一个gene,红色点为假基因; 图b.5种表达丰度的基因在3种测序深度中的标准化表达量:2 million reads/well,13 million reads/well,population RNA-seq分别用3种不同颜色的bar表示

    (4) 不同化合物的表达模式不受处理剂量、测序深度的影响(图c,图d)


    图c. 不同处理组聚类分析:表达谱相似的组被聚类在一起;图d.2 million reads/well,13 million reads/well,population RNA-seq的表达热图:处理类型如右侧图例,黄色表示基因高表达,黑色表示基因低表达

    额外补充:Connectivity Map数据库(CMap)使用扰动产生的基因表达特征, 发现疾病,基因和治疗之间的关系。数据库中共有百万多个扰动处理后得到的基因表达特征,这些扰动包括小分子化合物,基因过表达,基因敲低。研究药物治疗或者基因扰动导致的细胞差异表达信号可以与数据库中的所有表达信号比较相似度。相似度高表示连接(connected),相似的转录特征提示连接的两种扰动具有相同的生物学效应。研究者可以利用这种连接关系产生疾病治疗相关的假设,例如发现新的治疗性药物。
    CMap项目得到LINCS资金上支持,构建L1000平台,在扰动处理后得到1M个表达特征谱。

    2. DRUG-seq可用于分析化合物,并根据其转录谱对其进行聚类

    实验设计:
    (1)设置433种药物处理:选择433种已知靶点的化合物处理骨肉瘤U2OS细胞12h。
    (2)设置8种剂量处理:10μM、3.2μM、1μM、0.32μM、0.1μM、32nM、10nM和3.2nM(重复处理3次)

    2.1 筛选有效化合物

    433种化合物中,有88个被鉴定为有效化合物(因其50多个gene的表达发生显著变化)

    2.2 有效化合物--聚类分群

    根据转录特征,将有相似作用机制的化合物聚类分群(划分为5个类群)


    图a.有效化合物的tsne聚类分群图

    2.3 推断新化合物的作用机制

    cluster II:靶向翻译机制

    具有未知目标的化合物的MoA(作用机制)可以从cluster的邻居中推断出来:例如,cluster II 中,Cmp_308 (brusatol)是一个未知靶点的小分子药物,但由于其与Cmp_263(高三尖杉酯)、Cmp_253和Cmp_282(环己酰亚胺)紧密相邻,它们均靶向翻译机制中的组分如EIF4E、EIF2AK1和RPL6,这便暗示了Cmp_308 (brusatol)是一个靶向翻译机制的小分子药物。(有趣的是,最近的一份报告支持了这一观点,该报告证实了Cmp_308 (brusatol)通过靶向翻译机制抑制Nrf2。)

    2.4 同靶化合物的效价异质性分析

    cluster IV:靶向调节细胞周期

    cluster IV由许多靶向细胞周期机制的化合物组成,其中大部分控制G1-S或G2-M的转变。有趣的是,许多参与细胞周期功能的基因,如CDC20和CCNF,在这些化合物处理下被下调(图c),表明通过靶向单个组分,有系统的细胞周期扰动。然而,每个化合物对同一靶点调节的剂量依赖性动力学是不同的,反映了化合物的特异性和效价(图c)。


    图b. cluster IV中的化合物根据其靶标在细胞周期中的排列图;图c.图b中化合物处理后的剂量依赖性基因表达变化:横坐标为标准化的化合物剂量值,纵坐标为标准化的基因表达差异倍数

    2.5 同靶化合物的剂量敏感异质性分析

    cluster III:靶向表观遗传调控

    在Cluster III中,针对靶向表观遗传调控通路的化合物聚集在一起,如表观遗传调控基因Brd4、BrdT、HDAC1和HDAC4。以PLK1为靶点的Cmp_126(BI2536)和Cmp_127(BI6727,volasertib)也在附近,表明其共享通路调节。有趣的是,最近有文章将这两种化合物归类为双激酶溴域抑制剂。
    作为靶向Brd4的3种化合物,Cmp_466(JQ1)和Cmp_464(CPI-203)在结构上相似,尽管Cmp_048(I-BET151)差异较大(图d)。
    在10μM时,受所有三种化合物影响的基因有显著的重叠(图f:10 uM)。尽管这三种化合物在高剂量下对基因表达的影响相似,但Cmp_048(I-BET151)在中低剂量下的影响要温和得多,而Cmp_466(JQ1)和Cmp_464(CPI-203)则密切相似(图e)。很少有基因在0.32μM时被Cmp_048(I-BET151)异常调控,尽管它在更高剂量下与其他两种化合物影响相似数量的基因(图f)。这不仅表明DRUG-seq是识别具有相似MoA的化合物的强大工具,而且也证明了它足够敏感,可以对相关但不同的化合物进行详细比较。


    图d.3种靶向Brd4化合物的化学结构;图e.3种靶向Brd4的化合物处理后的剂量依赖性基因表达变化:横坐标为标准化的化合物剂量值,纵坐标为标准化的基因表达差异倍数;图f. 3种靶向Brd4的化合物剂量增加时失调基因数量的韦恩图

    3. DRUG-seq可用于分析CRISPR敲除细胞,以揭示基因功能和化合物调节作用

    实验设计:
    (1) 化合物效价统计实验:Cmp_282 (cycloheximide,抑制靶标基因RPL6的表达)处理U2OS细胞系12h,在“多孔板1”进行指定的DRUG-seq流程的建库测序(设置3次重复)
    (2) CRISPR编辑效率统计实验: U2OS细胞系经CRISPR诱导RPL6基因indel生成并稳定表达Cas9,4天后收集到“多孔板2”进行指定的DRUG-seq流程的建库测序(设置4次重复)

    3.1 移码突变比例统计

    CRISPR移码突变的比例区间为53-71%: sgRPL6_10 < sgRPL6_9 < sgRPL6_5


    图a. 上部为细胞表型图片(CRISPR敲除RPL6降低了细胞一致性),下部为CRISPR诱导RPL6基因indel的突变比例

    3.2 靶基因调控效能统计

    RPL6转录本表达降低比例区间为0-75%: Cmp_282 (cycloheximide)< sgRPL6_9(28%) < sgRPL6_10(65%) < sgRPL6_5(75%)
    Cmp_282 (cycloheximide)处理12h几乎没有影响RPL6转录本表达


    图b.RPL6 CRISPR敲除和1μM Cmp_282(环己胺)治疗的差异基因表达分析:靶基因RPL6用红色点表示,横坐标表示标准化的差异倍数,纵坐标表示差异显著性

    3.3 CRISPR编辑与化合物处理的敏感异质性分析

    由于CRISPR基因敲除与化合物处理的作用机制不同,因此CRISPR-cells和compound treated-cells的差异表达基因仅有部分重叠(101个核心基因):
    (1)Cmp_282影响细胞翻译机制:处理组的差异表达基因大多数参与了翻译和rRNA代谢过程,因而推断它会影响核糖体亚基的功能,从而影响翻译机制
    (2)Cmp_282还有其他未知靶点:还有一些基因受到Cmp_282的特殊影响,这些基因包括细胞死亡、定位和细胞对DNA损伤刺激的反应的调节因子,这可能表明Cmp_282(环己酰亚胺)有其他未知的靶点


    图c.CRISPR敲除和1μM Cmp_282(环己酰亚胺)处理下差异表达基因数量的维恩图: 包括所有CRISPR敲除和Cmp_282(环己酰亚胺)处理中101个核心基因的GSEA分析,以及CRISPR/化合物处理特异性基因的GSEA分析。选定的GSEA类别每个都用-log10(FDR)值表示

    相关文章

      网友评论

          本文标题:DRUG-seq(小规模高通量转录组测序)用于药物研发

          本文链接:https://www.haomeiwen.com/subject/ybvbirtx.html