美文网首页生物分子网络构建和分析ATAC seq单细胞转录组
整合多种指标确定单细胞基因调控网络中的关键基因

整合多种指标确定单细胞基因调控网络中的关键基因

作者: 被格格巫抓到的蓝精灵 | 来源:发表于2021-08-03 15:30 被阅读0次

    今年三月份南京航空航天大学姜维老师团队发表在Molecular Therapy Nucleic Acids(8.886)一篇关于scRNA-seq基因调控网络的文章——Single-cell RNA-seq dissects the intratumoral heterogeneity of triple-negative breast cancer based on gene regulatory networks 。使用scRNA-seq对TNBC患者内不同亚型的GRN进行了全面分析。然后整合5种不同的指标,确定了每种亚型的关键调控子。从而分析TBNC的瘤内异质性,识别TNBC的关键基因。

    一、背景:

    乳腺癌是女性最常见的肿瘤之一,肿瘤内异质性高。传统上基于免疫组化特征,乳腺癌患者可以被归类为4种不同的亚型,这四个亚型的病理学特征和预后结果存在差异。随着单细胞技术的发展,我们可以在癌症研究的单细胞分辨率上深入了解遗传异质性。然而传统的基于bulk RNA-seq的乳腺癌分析是非常不够的,基于scRNA-seq数据构建了基因调控网络(GRNs),有助于识别疾病中的关键调控因子。

    二、数据与代码:

    1. 6名TNBC患者的scRNA-seq数据:GSE118390 <u>https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE118390</u>

    2. 来自TCGA的105正常样本和115 TNBC 样本的表达数据;

    3. 来自METABRIC数据库的186个TNBC的临床数据

    三、文章的整体流程

    流程图

    四、内容和结果

    一)TNBC患者的内在分子亚型

    • 作者首先从GEO数据库中获得了868个上皮细胞,并利用基因表达谱和基因组信息推断了它们的CNVs。基于CNV谱将上皮细胞分为3个不同的亚群,并推断cluster 1 和cluster3为肿瘤细胞,它们分别包括134个细胞和411个细胞(图1A、B)。

    • 使用tSNE进行降维,上皮细胞被良好的分为4个不同的亚群,包括一个正常亚群和三个肿瘤亚群(图1C)。

    • 使用PAM50模型识别每个肿瘤细胞的分子亚型,肿瘤细胞被分为5种——Normal-like、Basal-like、Her2+、 LumA、 LumB(图1D)。六名TNBV患者亚群的组成具有很大的差异性。PT039和PT081由相对较高比例的Basal-like细胞组成,其肿瘤大小相对较大。患者中Basal-like亚型的高组成可能与乳腺癌患者的进展有关(图1E)。

    PAM50:一个50个基因的signature,它将乳腺癌分为5种分子亚型:Luminal A, Luminal B, Her2 -enriched,Basal-like和Normal-like。其生物学特征和预后均存在差异。

    Fig.1
    • 使用Python CellPhoneDB包分析不同细胞类型的配体-受体相互作用。p < 0.05的配体-受体对被认为在两种细胞类型中存在显著的相互作用。巨噬细胞在细胞-细胞通信网络中起主导作用(图2A),揭示了巨噬细胞在肿瘤微环境中的重要作用。

    • 使用GSVA分析5种分子亚型的细胞活性。在50个hallmark基因集中,5种分子亚型展示了巨大的多样性,揭示了不同分子亚型的瘤内异质性(图2B)。Basal-like亚群显著的富集在G2/M检查点上,研究表明,调节G2/M检查点可以提高肿瘤治疗的疗效(图2C)。

    Fig.2

    二)分子亚型特异的GRNs

    基于共表达谱和转录因子结合motif构建正常的上皮细胞和5个分子亚型特异的GRNs。
    1. 计算显著的共表达TF-gene对;

    2. 靶基因显著富集的TF-binding motif被保留以供进一步研究

    3. 富集分数(ES) >1被认为是构建GRN的显著TF靶对。

    正常上皮细胞和5种分子亚型的GRN的度分布均近似符合幂律分布,在各亚型特异性GRN中,TF的度表现出很大的差异。在5个分子亚型特异性GRN中没有一致调控因子(TF-target pairs),但在5个GRN中有10个一致的TF。这些相同的TF可能在不同的分子亚型中发挥不同的作用。

    识别6个GRNs的关键基因
    1. 使用中心性度量来评估基因的重要性。中心性指标包括度、PageRank、中间性、特征值和近似性。

    2. 使用Q值整合5种中心性指标,每个网络综合Q统计量排名前1%的基因被认为是关键基因。

    评估关键基因是否在癌症基因中富集,从Cancer Gene Census获得了已知的癌症基因。作者发现每个亚群中的关键基因显著富集在已知的癌基因。在每个亚型中,涉及到的癌症基因的关键基因表现出极大的多样性。

    三)关键基因功能的多样性

    为了研究5种分子亚型中关键基因的功能,作者重点研究了这些分子亚型中的一致的关键基因。除正常上皮细胞外,ETV6在五个分子亚型特异性GRN中均被激活(图3A-3F)。

    Fig.3
    • ETV6在不同亚型中调控不同的基因(图4A),在Basal-like亚型特异性的GRN中ETV6的度最高(度为411),这可能是判断Basal-like亚型恶性特征的关键。通过GO分析发现,不同亚型中,受ETV6调控的基因参与了不同的作用,表现出高水平的瘤内异质性(图4B)。例如,Basal-like亚型在血管生成的BP被特异性注释,这是由于ETV6在Basal-like亚型中对SGPL1的特异性调控。

    • 在单细胞分辨率下,相比正常上皮,ETV6在5种分子亚型中组明显上调(图4C)。此外,在TCGA 数据集中,相比正常对照组,ETV6在Basal-like患者中与显著上调(图4D)。基于METABRIC数据集,ETV6高表达的患者与相对较差的临床预后相关(图4E)。

    • 因此,在这5个分子亚型中,ETV6的激活可能通过调节不同的基因而引起瘤内异质性。因此,异常调控的ETV6可能是肿瘤治疗的潜在靶点。

    Fig.4

    五、结论:

    作者使用scRNA-seq对TNBC患者内不同亚型的GRNs进行了全面分析。首先,作者使用scRNA-seq数据推断拷贝数变异(CNVs),鉴定出545个恶性细胞。然后根据PAM50模型对恶性细胞的亚型进行划分。细胞-细胞通讯分析显示巨噬细胞在肿瘤微环境中起主导作用。接下来,通过整合基因共表达和转录结合motif构建各亚型的GRN。接着,根据基因中心性指标识别出关键基因。然后分析关键基因对于瘤内异质性的影响。

    作者使用一种新的,确定单细胞基因调控网络中关键基因的指标——基因中心性指标。并为使用单细胞基因调控网络分析瘤内异质性提供了一种新的思路。作者结合不同维度的数据,利用生信分析,做出一篇如此完整的工作,值得我们借鉴~

    相关文章

      网友评论

        本文标题:整合多种指标确定单细胞基因调控网络中的关键基因

        本文链接:https://www.haomeiwen.com/subject/ukrevltx.html