为什么单细胞测序?
许多生物实验检查细胞群,假设所选细胞类型的所有细胞都是相同的,或者如果使用足够多的细胞,或者使用独立的细胞源重复实验足够多次,它们的差异不会过度影响结果。然而,组织很少是同质的,任何基于组织样品的表达谱都会混合其组成细胞的真实表达谱[1-6]。甚至在单个多细胞生物体内,每个细胞都可以而且通常包含一个独特的转录组、表观基因组和蛋白质组,甚至可能包含不同的基因组。更糟糕的是,这些都是高度动态的,所以“定格”分析可能会产生误导。此外,同一群体中单个细胞转录组的差异可能会对整个群体的功能产生重大影响。细胞群中单个细胞转录组的高分辨率时空分析将导致细胞间变化的更精确表示,而不是由整体测量反映的随机平均值。单细胞转录组分析允许我们在全基因组范围内访问基因调控网络,以发现基因和表型,从而最终改善人类疾病的检测、诊断和治疗
下一代测序(NGS)已经彻底改变了基因组和生物医学研究的规模和范围。最近的技术进步使得全基因组测序和全转录组测序成为可能。NGS扩展了我们对基因组和转录组的观点,允许在没有先验假设的情况下,以前所未有的吞吐量探索任何生物体的基因组和转录组。这是通过单核苷酸解析实现的。检测基因突变(如单核苷酸变异[SNV/单核苷酸多态性])、拷贝数变异、内含子、结构变异和核糖核酸编辑。RNA-seq以较大的动态范围和灵敏度定量分析基因表达,并通过成对末端测序、基因融合、等位基因特异性表达和新的替代转录物研究链特异性和短程连接性。此外,全基因组亚硫酸氢盐测序允许我们观察脱氧核糖核酸甲基化,并以单核苷酸分辨率绘制基因组表观基因组图谱。NGS也是药物发现和药物开发的有力工具。批量测序方法可用于药物开发,特别是在器官或组织水平[9-11]。然而,在这些组织中,细胞是非常不均匀的,因此药物反应和耐药性的机制可能比我们通过研究混合样本所能精确测量的更复杂。
药物靶点识别和药物反应机制可能是药物开发研究中最重要的阶段。利用大规模测序技术,我们通常可以识别大量的药物靶标候选物。然而,由于大规模测序中的噪声,很难找到某些疾病的特定候选物[1]。例如,我们可能发现细胞对特定药物的反应明显不同[12],即使使用转化的细胞系。动态细胞状态,如细胞周期、昼夜节律、对环境刺激的反应、压力的影响以及遗传和表观遗传变异都可能是影响药物反应的变异来源[13-15]。在组织和血液中,许多细胞相互交流并协同工作,当使用大规模测序时,这将进一步增加药物反应分析的复杂性[12]。在这篇综述中,我们描述了单细胞测序技术的现状,它可以提供一种新的、更强有力的和精确的方法来分析药物对治疗细胞和组织的影响[16]。我们的综述将讨论单细胞全基因组/外显子组测序(scWGS/scWES)、单细胞转录组测序(scRNA-seq)、单细胞亚硫酸氢盐测序(scBS)和单细胞测序的多组学。我们还将不仅强调这些方法的优势,还将强调它们所带来的挑战。最后,我们描述、阐述和推测单细胞测序在药物发现和药物开发中的潜在应用。
单细胞测序方法。
单细胞分离显然,单细胞转录组分析的第一步是分离单个细胞,这可以通过不同的方式完成。分离单细胞技术的一些例子包括显微操作、显微切割和微流体系统,这些技术已经成为许多评论的主题[7,1720]。每种方法在单细胞分离方面都有其自身的优势,这取决于研究者的目标以及转录组、基因组或表观基因组的哪一方面将被分析的性质。为了获得精确的结果,单细胞需要小心。应考虑高通量,因为制备和扩增方法会显著影响结果[21]。因此,我们坚信在许多情况下,自动制备系统是分离单细胞的理想选择。在分离单个细胞后,需要扩增和富集用于文库构建的序列材料,从微微克(单细胞水平)到纳米或微克(低输入文库构建)量。用需要很少或不需要纯化步骤的细胞和最少量的测序材料的聚合酶链反应扩增将获得最准确的测序结果。表1总结了当前可用的单细胞测序技术,随后对其进行了综述
给定生物体的所有细胞可能具有相同的基因组,但每个细胞都有一个反映基因子集表达的独特转录组,这可能受到表观遗传状态和不同微环境的影响[1,2,40]。细胞转录组的差异可能对整个细胞群体的功能有重要影响。单细胞转录组分析使我们能够在全基因组范围内访问基因调控网络,以确定发育过程中特定细胞生理功能、行为和表型背后的基因和途径。这些分析可以最终提高人类疾病检测的灵敏度和特异性,也可以指导治疗方法[4,41]。已经开发了许多方法来扩增单细胞转录组[17,42,43]。在实践中,当前单细胞研究中最常用的全转录组扩增方法是CEL-seq [44,45],SMART-seq [46],SMART-seq2 [47],STRT-seq [48],和UMI-SMART-seq2 [49],以及Drop-seq [50,51]技术。CEL-seq、STRT-seq、UMI-SMART-seq2和Dropseq具有高通量的多重条形码,可以揭示单细胞的定量和全局表达谱。全长转录组可以通过SMART-seq2进行扩增,通过深度测序,我们可以查看每个单细胞中更详细的信息,如核糖核酸剪接变异体、等位基因特异性表达,甚至SNVs。扩增方法的选择取决于调查的具体目标。对于scRNA-seq研究,理想的选择是高通量方法,因为需要分析大量单细胞来分类细胞类型和鉴定单细胞标记。当分析稀有细胞时,通过SMART-seq2分析的完整转录组可以提供更详细的信息。单细胞微流控自动制备系统是制备单细胞cDNA文库的一个非常好的选择,如C1流体技术(与SMART-seq2联用)[52-54],可扩展微流控[55],液滴-序列[50,51,56],和其他scRNA-序列微流控装置[57-60]。除了降低成本,微流体系统还可以提供高分辨率和一致的数据。作为质量控制的一部分,我们强烈建议使用外源性的插入式核糖核酸分子(如ERCC),这可能使定量生物信息学数据分析相对容易[61,62]。测序深度将取决于研究者的目标。popoly等人描述说,每个细胞0.05米的读数足以进行无偏的细胞类型分类和生物标志物鉴定[52,63]。但是对于某些稀有单细胞的表征,例如循环肿瘤细胞和肿瘤干细胞,可能需要更深的测序,例如每个细胞超过20M的读数,以满足某些生物信息学分析,例如转录组水平的单链抗体和单链抗体。许多为大规模核糖核酸序列分析设计的生物信息学工具也适用于单链核糖核酸序列数据[6467]。然而,在生物信息学中,scRNA-seq最具挑战性的部分是区分真正的生物变异和技术噪音[68]。如需了解更多详情,请参见奥利弗·斯特格勒等人最近对单链核糖核酸序列生物信息学方法的全面综述。
单细胞测序在药物开发中的应用
药物开发是一项耗时、昂贵且失败率高的工作,它包括许多步骤,包括药物靶标和候选物的鉴定、潜在耐药性的评估以及药物毒性和药代动力学的确定。许多药物可能在临床前研究中成功出现,但由于各种原因在临床试验中失败。通常,靶分子、细胞、组织或器官比临床前体外或体内模型复杂得多。然而,下一代测序可以提供一种大大提高药物开发效率的方法。我们可以通过基因组测序获得大量药物开发的新靶候选物,并将其与使用转录组或甲基分析的药物毒性或靶外效应分析相结合。不幸的是,一个持续存在的问题是,如果测序样品由混合细胞群组成,许多有价值的结果将被均质化,并且不能分析不同细胞的细胞反应。然而,利用单细胞测序技术,我们现在可以很容易地完成这些分析
药物开发是一项耗时、昂贵且失败率高的工作,它包括许多步骤,包括药物靶标和候选物的鉴定、潜在耐药性的评估以及药物毒性和药代动力学的确定。许多药物可能在临床前研究中成功出现,但由于各种原因在临床试验中失败。通常,靶分子、细胞、组织或器官比临床前体外或体内模型复杂得多。然而,下一代测序可以提供一种大大提高药物开发效率的方法。我们可以通过基因组测序获得大量药物开发的新靶候选物,并将其与使用转录组或甲基分析的药物毒性或靶外效应分析相结合。不幸的是,一个持续存在的问题是,如果测序样品由混合细胞群组成,许多有价值的结果将被均质化,并且不能分析不同细胞的细胞反应。然而,利用单细胞测序技术,我们现在可以很容易地完成这些分析
第二篇文献(用于药物筛选的通过瞬时条形码的多重单细胞核糖核酸序列)
摘要:为了用单链核酸序列同时分析不同条件下的多个样品,我们开发了一种通过瞬时转染单链核酸序列的通用样品条形码方法。通过单次Drop-Seq分析的48个混合样本的药物治疗实验揭示了每种药物的独特转录组反应和单细胞水平的靶特异性基因表达信号。我们的成本有效的方法广泛适用于多种实验条件的单细胞分析
与传统的批量测量不同,单细胞核糖核酸测序(scRNA-seq)有助于分析单个细胞1-3的转录组,并揭示了细胞群体的变异,如肿瘤异质性。Drop-Seq4、inDrop5和10X Genomics Chromium6等平台可提供数千个细胞的高通量单细胞信息。尽管有必要对各种条件或许多患者的样品进行scRNA-seq分析,但由于劳动密集型过程和高样品制备成本,以前关于多个样品的scRNA-seq分析方法仍然具有挑战性。为了克服这些限制,我们设计了一种多重scRNA-seq方法,包括短暂转染短条形码寡核苷酸(SBOs)来标记不同实验条件下的样品。单链寡脱氧核苷酸由样品条形码和多聚腺苷酸序列组成(补充图1a)。SBO的瞬时转染允许用唯一的条形码标记样品。将各种条件的条形码样品汇集在一起,同时进行单链核酸序列的处理(图1a)。小核糖核酸序列中的多聚腺苷酸序列确保了小核糖核酸和小核糖核酸在小核糖核酸序列过程中被一起捕获和反转录(补充图1b)
SBOs允许我们解复用和确定样本来源。这种基于简单转染的通用条形码方法能够实现样品多重化,识别多重化和阴性,并降低每个样品的制备成本。为了证明我们的方法对样本进行多路复用的能力和准确性,我们进行了一个6人/鼠物种混合实验。HEK293T细胞和NIH3T3细胞各两个样品携带一个独特的SBO,每个细胞系的一个样品携带两个SBO的组合(补充图2)。我们将所有的样本以相等的比例混合在一起,进行了一次滴序测试。在删除序列期间,细胞被故意超载,以增加多重任务的机会。我们获得了2,759个细胞条形码,其中至少检测到500个转录本,并且细胞被成功地分配到它们的样品来源。基于细胞外基质计数矩阵检测多重细胞和阴性细胞(见在线方法)。被分类为单态的细胞几乎只表达它们的样本条形码,而多重态和阴性态分别表达多重或没有样本条形码(图1b)。源自两个不同样本的SBO计数的散点图显示了排他关系,而来自同一样本的SBO计数在其表达式中显示了强相关性(图1c,补充图3)。使用SBOs的物种分类与基于转录组的物种混合图结果一致(图1d,补充图4)。我们还观察到单重态、多重态和负态之间的核糖核酸转录物分布有明显的差异,这表明多重态和负态的检测是明确的(图1e)。这些结果表明,我们的方法能够在单细胞实验中以高准确度和特异性进行样品多重化,并消除多重化和阴性
。
在药物发现过程中,基因表达谱可用于注释小分子的功能7和阐明生物途径8、9的潜在机制。虽然已经使用微阵列技术对大量小分子的基因表达进行了系统的分析10、11,但是它们仅限于批量测量。为了捕捉高度异质性样本(如肿瘤)的不同反应,单细胞基因表达谱分析是必不可少的,尽管目前的技术不适合多重筛选。我们设想,我们的方法可用于筛选受药物干扰的单细胞中的多个基因表达谱。我们在K562细胞系中进行了5倍时间序列的scRNA-seq,该细胞系来源于慢性髓系白血病并表达Bcr-Abl融合基因12。我们研究了K562细胞对伊马替尼的单细胞转录反应,伊马替尼是一种BCR-ABL靶向药物13,在治疗期间(见在线方法)。从五个时间点收集的多重样品中单个细胞的假时分析显示了分支的基因表达轨迹和随药物治疗时间的轨迹顺序进展(图2a)。分支轨迹显示伊马替尼治疗后存在两种过渡状态。样品在假时表现出异步模式,尽管平均值随着药物治疗时间而增加(补充图5c,d)。假时差异表达分析确定了几个在转变过程中改变的基因队列(图2b,补充图5a,b)。值得注意的是,红细胞相关基因如HBZ和ALAS2的表达水平随着假时的推移而增加(图2b)。这与先前的研究一致,该研究显示HBZ在伊马替尼处理的细胞中的表达增加14,15。还鉴定了两种过渡状态之间的差异表达基因(补充图5e)
接下来,我们询问我们的方法是否可以用于K562细胞中多种药物的同时单细胞转录组分析。我们选择了45种药物,其中大部分是激酶抑制剂,包括几种BCR-ABL靶向药物。三个二甲基亚砜样品用作对照(补充表1)。在药物治疗后,通过条形码和汇集所有样品进行48个复合体的单细胞实验。总共获得了3,091个细胞,并在消除多重性和阴性后将其分离。每种药物的平均表达谱被可视化为热图(图2c)。每种药物都有自己的反应基因表达模式。有趣的是,每种药物的平均表达数据的无监督分级聚类显示,诱导反应的药物通过它们的蛋白质靶标聚集在一起,而不诱导反应的药物显示出与二甲基亚砜对照相似的表达模式(图2c,补充图6)。此外,我们可以通过检查每种药物的细胞计数来评估细胞毒性。针对BCR-阿布勒或阿布勒的药物表现出最强的反应和毒性,而针对甲乙酮或甲氨蝶呤的药物表现出相对温和的反应。基于单细胞基因表达数据的差异表达分析确定了每种药物的DEGs(图2d、补充图7和补充表3)。我们注意到,在用伊马替尼处理的样品中,高表达的红细胞相关基因如HBZ、HBA和HBG被上调,基因如DDX21、NCL、ENO1和NPM1被下调(图2d)。针对BCR-阿布勒的其他药物也发现了类似的deg。长春瑞滨和奈拉替尼等药物显示出独特的基因表达信号和DEGs。对按其蛋白质靶标分组的药物的分析显示了每个蛋白质靶标的DEGs之间的不同关系(图2e,补充表4)。此外,两组的比较分析揭示了不同的表达谱(图2f,补充图8)
为了以单细胞分辨率全面分析药物筛选数据,我们对所有单细胞数据集进行了无监督聚类分析。我们观察到六个簇(图2g),它们可能由于高度复杂的转录空间而没有被清楚地分开。然而,对于每种药物来说,分配给每个簇的细胞的相对丰度是不同的(图2c,补充图9c)。大多数受BCRABL和MEK抑制剂影响的细胞集中在簇4中,而受mTOR抑制剂影响的细胞主要集中在簇3中。特别地,第5组中的大多数细胞属于经奈替尼处理的样品。通过差异表达分析验证了与每个聚类相关的几个标记(补充图10)。细胞周期状态的分析显示细胞周期状态和特定簇之间没有关联(补充图9a)。在用靶向BCRABL的药物治疗的样品中,高度增殖状态(G2期)的比例降低,这可能是由于药物诱导的细胞周期抑制16(补充图9b)。单个细胞越多,深度测序可以检测到每种药物的不同种类和不同的细胞反应。为了验证我们的方法的普遍适用性,我们在A375细胞系(BRAF V600E-阳性17)上用相同的药物组进行了48个复合药物筛选实验。与K562细胞相似,应答诱导药物在A375细胞中以靶特异性方式聚集在一起(补充图11、12和补充表5)。
我们的结果表明,多重scRNA-seq可以用于高通量筛选对药物的单细胞转录反应,药物靶标可以通过它们的转录模式来估计。我们开发了一种通过瞬时转染进行多重scRNA-seq的新方法,它比目前可用的方法有几个优点。成本是当在多种条件下进行scRNA-seq时,大大节省了时间。批量效应是scRNA-seq18的一个主要挑战,通过汇集和运行所有样本,可以显著降低批量效应,实现单细胞样本之间更精确的分析。我们的方法可以消除多重性和负向性,通过使用高浓度细胞作为输入,有可能增加scRNA-seq的产量。去除多重和阴性对单细胞分析也是有利的。虽然最近已经开发了一些使用天然遗传条形码和抗体标记的多重scRNA-seq方法,但是它们在遗传多样性样品中的应用有限,并且分别需要有价值的试剂和表面标记。我们使用基因转染的方法(1)非常简单,易于在单个实验室中应用,(2)具有应用于细胞核样品的潜力,以及(3)通过使用不同的基因转染组合,提供了高的复用能力。我们预计,我们的多路复用策略在scRNA-seq的广泛应用(包括药物筛选)中发挥着核心作用。
第三篇文章
摘要:在这里,我们报道了基因微扰数字核糖核酸,一个高通量的药物发现平台。药物发现依赖于高通量筛选,但目前的平台读数有限。RNA-seq是一个强有力的工具,可以利用转录组的变化来研究药物的作用,但是标准文库的构建是昂贵的。药物序列以1/100的成本捕获在标准核糖核酸序列中检测到的转录变化。在8个剂量的433个化合物的概念验证实验中,从药物序列生成的转录谱成功地将化合物按照作用机制(MoAs)根据其预期目标分组为功能簇。对于涉及相同靶标的化合物,检测到转录组变化中反映的干扰差异,证明了使用药物序列来理解靶标内外活动的价值。我们证明了药物序列捕捉共同的机制,以及在相同的目标化合物治疗和CRISPR之间的差异。药物序列为高通量筛选环境中的转录组读出提供了一个强有力的工具。
在过去的四年中,高通量筛选一直是药物发现的主要手段1。基于靶标的药物发现在很大程度上依赖于单一读数,如报告基因表达或对小分子治疗反应的酶活性修饰。然而,随着最近对基于表型的药物发现2的重新关注,人们对更全面和更少偏见的筛选方法越来越感兴趣,这些方法结合了基于靶标和表型筛选的方面,例如RNA-seq。然而,需要开发高通量和低成本的RNA-seq方法,使得在多种实验条件下筛选大组化合物变得可行。为此,已经开发了多个转录分析平台。基于定向测序的方法,如RASL-seq3,可以测量多达几百个特定基因或剪接事件。RASL-seq对于研究感兴趣的基因或基因组位点特别有用,在那里可以评估一组集中的事件3。Luminex L1000平台,用于连接图(CMAP),测量大约1000个标志基因的固定面板,转录组中大约一半的额外基因用计算机估算4,5。CMAP的最新版本提供了包括化合物、shRNA和cDNA5在内的各种微扰因子的大量表型数据,并为各种疾病研究的小分子先导物的鉴定提供了便利6,7。L1000为转录分析提供了一个非常有用和经济的平台。然而,它目前只测量大约1000个基因,并且依赖于剩余基因的插补,而不是直接测量。全转录组RNA-seq已成为一个有吸引力的选择,允许更深入地询问复杂的变化,但大多数标准方案是劳动密集型的,成本高得令人望而却步的高通量使用。最新的发展,PLAT-seq,允许在96个井的样本,每个样本约15美元8。然而,它需要用特殊的寡核苷酸(dT)移植板进行冗长的核糖核酸纯化步骤,并且在96孔的形式下,严重限制了可以在单个实验中测试的处理条件的数量(补充图1)。在384-和1536-孔格式中,拥有一种成本有效、大规模并行化的转录组分析方法,以无偏见的方式测量所有基因,从而完全捕获化合物或基因扰动诱导的转录多样性,用于药物发现,这将是理想的。
药物序列是一种用于高通量分析的成本有效的数字转录分析方法。我们开发了一种具有成本效益的方法,增加了称为(药物序列)的处理量,每个样品的成本为2-4美元,包括测序费用,并支持384孔和1536孔两种形式的分析。通过放弃核糖核酸纯化和采用多路复用策略,药物序列简化了多孔处理,以指导裂解和逆转录反应步骤,并大大减少了文库构建时间和成本(目前384孔板每孔0.9美元,1536孔板每孔0.2美元)。此外,药物序列允许完整的操作与高通量自动化集成(图1a)。通过在逆转录引物中加入特定的条形码,单个孔中的cDNAs被标记,然后在第一链合成后汇集,大大减少了多孔加工中的劳动量。逆转录酶的模板转换特性在第一链合成后增加了聚(dC),并允许结合模板转换寡核苷酸(TSO)以通过聚合酶链反应进行预扩增。标记和扩增后,文库被大小选择并用定制引物测序。逆转录引物还包含10个核苷酸的独特分子指数(UMI)9,以监测潜在的聚合酶链反应扩增产物(图1a,b,详见方法和补充方法)。
为了评估样品处理过程中潜在的孔与孔之间的交叉污染,在一个混合物种试点实验中,我们将小鼠来源的C2C12和人类来源的293 T细胞交织在同一个384孔板中,并在经标记的逆转录反应后汇集材料(补充图2a)。测序和读取图谱后,超过98%的井具有> 96%的物种特异性UMI。样品通过分级聚类中的物种进行分离,来自相同物种的孔彼此之间有很强的相关性,这表明孔之间有很高的再现性,并且在样品处理过程中交叉污染很少(补充图2b和2c)。药物序列是数字化的,计算转录物的3’端,与标准的核糖核酸序列相比,有可能降低阅读深度和测序成本。我们测试了降低读取深度对检测到的基因数量的影响,以及在复合扰动下捕获差异表达基因的准确性。选择了一种有效的转录抑制剂Cmp_078(雷公藤内酯醇)和一种翻译抑制剂Cmp_263(高三尖杉酯碱)来提供不同的MoA用于基准测试。用二甲基亚砜或0.1μM、1μM或10μM的增加剂量的化合物对样品进行三倍处理。药物序列文库的测序估计为200万个阅读/孔和1300万个阅读/孔,并与平均每个样品4200万个阅读的标准群体核糖核酸序列进行比较。与在群体RNA-seq中检测到的中位17 K entrez基因相比,药物-seq在2 mil读数/孔中检测到中位11 K基因,在13 mil读数/孔中检测到中位12 K基因(图2a),包括大多数L1000标志基因(补充图3a)。即使在2密耳读数/孔的浅读数深度,基因表达在各孔之间也是高度一致的(补充图4a和4b)。所有3’计数平台共同关心的问题是假基因的错误量化。然而,与群体核糖核酸序列相比,我们没有观察到在药物序列平台中假基因的显著偏斜量化(补充图4c)。与药物序列相比,群体核糖核酸序列的大部分增益来自FPKM在0和1之间的低表达基因,这表明低丰度转录物的回收受到起始材料的限制。比较每孔200万和1300万读取深度的性能,在1300万和200万的深度下测序超过6倍没有显著增加基因检测(图2b)。在ROC曲线分析中,通过群体核糖核酸序列检测的差异表达基因在两个读取深度都被药物序列可靠地检测到(补充图3b),并且这些基因响应于化合物处理将样品分成不同的处理组(图2c)。对治疗反应的化合物特异性剂量依赖性表达模式在平台和阅读深度之间保持不变(图2d,补充图3c作为对照)。即使在较低的阅读深度,药物序列也能捕获与特定扰动相关的转录组变化。这一测序深度可与之前公布的结果8相媲美,并将测序成本降低至标准文库的1/100(Illumina Hiseq 4000平台上的3/样品)。测序成本的持续下降将进一步降低药物序列的成本。
药物序列可用于分析化合物,并根据其转录谱对其进行聚类。
我们利用药物序列平台对骨肉瘤U2OS细胞中的433种具有主要已知靶标的化合物(补充数据3)进行了三倍分析,共8个剂量(10μM、3.2微米、1μM、0.32μM、0.1微米、32纳米、10纳米和3.2纳米)。最适宜的治疗时间取决于化合物和应用。我们选择12小时来平衡化合物有效性的检测和由于毒性造成的材料损失。在诱导转录组变化的433种化合物中,有52种也存在于连接图数据库中。我们将药物序列检测到的差异表达基因的数量与连接图中测量的转录影响分数进行了比较。尽管有不同的技术平台,但这两个测量结果关联良好(r=0.80,补充图3d),表明在药物序列中可靠地捕捉到了化合物效力差异。化合物处理后的转录信号可以将具有相似MoA的化合物分组,并促进新化合物的机理研究5。在433个化合物中,88个被鉴定为具有50个以上基因显著改变的有效化合物(|log2(折叠改变)| > 1和padj < 0.05)。使用这些基因的变化作为tSNE聚类分析的测量,我们观察到不同的特征(图3a)。同一簇中化合物的已知靶标可以在功能上暗示在不同治疗下受影响的共同途径。具有未知目标的化合物的MoA可以从它们在簇中的邻居推断出来。例如,在簇二中,虽然Cmp _ 308(brus ATO)是一个带有未知靶标的小分子(SMUT),但它与Cmp_263(高三尖杉酯碱)、Cmp_253和Cmp_282(环己酰亚胺)紧密地聚集在一起,它们分别靶向翻译机制的所有组成部分EIF4E、EIF2AK1和RPL6。这表明Cmp _ 308(brus环礁)也可能共享类似的MoA。有趣的是,最近的一份报告证实了这一点,该报告通过靶向翻译机器10确定了该化合物对Nrf2的抑制作用。虽然需要进行额外的后续实验来确认新提出的MoA,但这是对我们的平台和电子概念验证的宝贵验证。第四组由许多靶向细胞周期机制的化合物组成,其中大多数控制G1-硫或G2-M转变(图3a,b)。有趣的是,许多参与细胞周期功能的基因,如CDC20和CCNF,在这些化合物处理下被下调(图3c),表明通过靶向单一组分的系统细胞周期干扰。然而,对于每种化合物来说,同一靶的剂量依赖性失调动力学是不同的,反映了化合物的特异性和效力(图3c)
相关,而Cmp_048 (I-BET151)更明显(图3d)。在10μM处,受所有三种化合物影响的基因有显著的重叠,包括参与染色质组装/拆卸和细胞死亡的基因(补充图5)。虽然这三种化合物在高剂量时对基因表达的影响相似,但在中低剂量时,Cmp_048 (I-BET151)的影响要小得多,而Cmp_466 (JQ1)和Cmp_464 (CPI-203)则相互密切跟踪(图3e)。在0.32微米时,很少有基因被Cmp_048 (I-BET151)失调,尽管它在较高剂量下影响的基因数量与其他两种化合物相似(图3f)。这不仅表明DOUGE-seq是鉴定具有相似MoA的化合物的强有力的工具,而且表明它对相关但不同的化合物的详细比较足够敏感。
药物序列可用于分析CRISPR敲除细胞,以揭示基因和化合物的功能。
当靶特异性化合物不可用时,用CRISPR/CAS9进行基因编辑已日益成为早期药理学靶验证的重要工具。作为概念的证明,我们开始比较CRISPR敲除和化合物抑制的效果,一个充分验证的化合物,Cmp_282(环己酰亚胺),与它的既定目标,RPL6,使用药物序列。多重处理条件的能力使CRISPR控制和处理复制都在同一个平板上进行,大量的基因图谱允许进行全面的比较。每个实验设置两个板;一个板通过药物序列工作流程进行处理,另一个复制板进行处理和测序,用于特异性CRISPR诱导的indel生成,以确定功能等位基因缺失13的生成效率。此外,密切监测细胞融合以捕捉潜在的敲除表型。以RPL6为目标的CRISPR指南展示了显著的表型变化。转染后4天,在复制孔中观察到明显减少的融合,indel分析证实在53至71%之间有明显的移码突变(图4a)。在由sgRPL6_10和sgRPL6_5介导的敲除中,RPL6水平是最显著降低的转录物之一(分别为65%和75%,padj = 1.4×1040和8.5×1055),而由sgRPL6_9介导的敲除导致更温和的降低(28%,padj =0.0006)(图4b)。与CRISPR处理不同,化合物Cmp_282(环己酰亚胺)处理12小时没有减少RPL6基因(图4b)。有趣的是,CRISPR-和复合处理细胞的转录组之间只有部分重叠,这可能是由于CRISPR基因敲除和复合处理的不同机制和/或动力学差异:CRISPR慢,复合处理快。受化合物处理影响的基因确实与CRISPR敲除中失调的基因部分重叠(图4c),其中许多基因参与翻译和rRNA代谢过程。这一结果是对核糖体亚单位和影响翻译机制的化合物的功能的预期。使用这组基因,来自化合物和CRISPR扰动的处理样品被聚集在一起,并在分级聚类中与DMSO处理和非靶向对照样品明显分离(补充图6),表明在两种处理下的共享机制。有趣的是,有更多的基因受到该化合物的独特影响,这些基因包括细胞死亡、定位和细胞对脱氧核糖核酸损伤刺激的反应的调节因子(图4c)。这可能表明Cmp_282(环己酰亚胺)还有其他未确认的目标。
药物序列比L1000和RASL序列有优势
除了显著降低成本之外,与L1000和RASL序列相比,药物序列平台的另一个优点是能够直接测量> 10000个基因,而无需计算推断,其中许多不包括在L1000分析中(补充图3a)。为了比较两个平台的准确性,使用直接测量的基因或在L1000中测量+推断的基因的tSNE加K均值聚类与药物序列结果进行比较。药物序列中的聚类随着更好的分离而更准确(补充图7a-d)。由药物序列检测到的1351个差异表达基因,而不是由L1000+推断出的基因,在涉及线粒体功能、维甲酸反应、EZ2靶和位于9q34的基因的途径中被富集(补充数据4和补充图7e),强调了药物序列更全面的转录组的优势。这表明靶向方法如RASL-序列或L1000捕获了一些但不是全部的转录变化,这些转录变化是由较不偏向的方法如药物-序列提供的
讨论
总之,我们开发了一种大规模并行化、自动化、低成本的基于下一代测序的方法,用于在化学和遗传干扰下分析整个转录组的变化,并成功地将其应用于工业高通量筛选环境中。药物序列是一个强有力的工具,它比其他技术如RASLseq、PLATE-seq和L1000有优势。它更容易执行,具有更高的吞吐量,是不偏不倚的,是有成本效益的。药物序列是一个强大的工具,以协助新的化合物机理研究,化合物再利用的努力和鉴定遗传转录
网友评论