美文网首页
新意难寻的基因家族是不是你的意难平?

新意难寻的基因家族是不是你的意难平?

作者: 概普生信 | 来源:发表于2022-03-04 15:00 被阅读0次

大家还记得之前的TMEscorem6Ascore铁死亡scoreRNA-writerscore、 焦亡score这个系列的文章,似乎已经类似lasso-cox经典系列,发文了很多文章是真的香,一个热点一个思路,影响因子区间在6分-27分。这不,乙酰化也来凑热闹了。

若有感兴趣的基因集可点击评估

文章于今年1月发表在Frontiers in Immunology(现影响因子:7.5607,2021年预测IF:8.048)。接下来让我们详细讲解这篇乙酰化文章吧,文章有点长,需要一点耐心,看完你就知道这个系列怎么做了。

Histone Acetylation RegulatorMediated Acetylation Patterns Define Tumor Malignant Pathways and Tumor Microenvironment in Hepatocellular Carcinoma

肝细胞癌中组蛋白乙酰化调节因子介导的乙酰化模式定义肿瘤恶性通路和肿瘤微环境

组蛋白乙酰化修饰是最常见的表观遗传学修饰方法之一,可以用于调节染色质结构、DNA修复和基因表达。现有的研究主要集中在组蛋白乙酰化在肿瘤发生、肿瘤进展和肿瘤微环境(TME)中发挥的重要作用,但尚未探讨组蛋白乙酰化调节因子在TME细胞浸润、药物敏感性和免疫治疗中的潜在作用和相互作用。本文基于组蛋白乙酰化调节因子的mRNA表达计算HAscore,确定三种组蛋白乙酰化模式及相应患者。三组患者在生存时间,免疫浸润,药物敏感性等多方面存在差异。

1.数据

研究队列:该研究共纳入TCGA-LIHC、ICGC-LIRI(日本)、ICGC-LICA(法国)、GSE14520等9套肝癌数据,涉及多达1599例肝癌患者的表达数据以及生存相关数据等进行进一步分析。

研究对象:其次,研究者检索组蛋白乙酰化修饰相关文献,对36个公认的组蛋白乙酰化基因进行整理和分析,以确定不同的组蛋白乙酰化修饰模式,其中包括9个writer,12个eraser, 15个reader(图1A)。

2.组蛋白乙酰化调节因子在HCC中的遗传和转录改变

富集分析表明36个基因主要与组蛋白修饰和癌症相关通路有关(图1B)。为确定HCC中组蛋白乙酰化调节因子的基因改变,研究者首先对36个组蛋白乙酰化调节因子的非沉默突变和拷贝数变异(CNVs)的landscape进行分析。在TCGA的HCC队列中,364个样本中有95个(26.1%)存在组蛋白乙酰化调节因子的基因改变,主要涉及错义突变和剪接位点突变(图1C)。此外,发现CNV,尤其是CNV扩增在这些调控因子中广泛存在(图1D)。为确定这些基因变异是否会对HCC患者组蛋白乙酰化调节因子的表达造成影响,研究者进一步比较正常和HCC样本中这些调节因子的mRNA表达(图1E)。结果显示,CNV的变化对组蛋白乙酰化调节因子的表达起着重要的调控作用。此外,根据这36个调控因子的表达,研究者基于无监督一致性聚类对HCC样本和正常样本进行区分(图1F)。

图1. HCC中组蛋白乙酰化调节因子的基因改变

3.基于36个调节因子确定与临床特征相关的组蛋白乙酰化模式

研究者共获取来自TCGA-LIHC、ICGCLIRI(日本)、ICGC-LICA(法国)等9个数据集的1599个HCC样本的临床数据和mRNA表达矩阵,以进一步分析36个组蛋白乙酰化调节因子的表达模式。为探讨组蛋白乙酰化调节因子的预后价值和表达关系,研究者将具有预后信息的TCGA-LIHC和ICGC-LIRI队列的mRNA测序数据整合到一个meta队列中,并基于单因素Cox回归识别与癌症预后相关的调节因子。结果表明,HDAC2、HDAC1等多种调节因子与HCC预后有关(图2A)。相关分析显示36个调控因子的表达之间存在显著的相关性。总之,组蛋白乙酰化调节因子之间存在着紧密的相互交流,共同构成一个复杂的网络,整体调控组蛋白乙酰化修饰,影响HCC的发展。

为确定36个调控因子的表达模式,研究者使用ConsensusClusterPlus对774例HCC样本(TCGA-LIHC、ICGC-LIRI和ICGC-LICA队列)的mRNA表达数据进行分类。通过无监督聚类,研究者发现3组不同的组蛋白乙酰化模式(HAcluster_A,HAcluster_B,HAcluster_C)。在GEO meta队列(GSE14520、GSE76427、GSE116174、GSE104580、GSE112790、GSE121248)中重复组蛋白乙酰化聚类,可以得到相似的结果。此外,主成分分析(PCA)显示,三种不同的组蛋白乙酰化模式之间的转录谱存在显著差异(图2D)。在TCGA-LIHC和ICGC-LIRI队列的联合数据集中,HAcluster_B组患者的生存概率低于HAcluster_A和HAcluster_C组(图2B)。GEO联合数据中可以得到类似结果(图2C)。与HAcluster_C和HAcluster_A相比,HAcluster_B中的组蛋白调节因子表达升高(图2E),表面HAcluster_B患者组蛋白乙酰化修饰最活跃,且修饰周期快。这可能是肝癌患者预后的一个危险因素。此外,HAcluster与HCC的临床特征密切相关。在TCGA HCC队列中,HAcluster_B显著富集病毒感染事件、血管浸润、高TNM分级和高组织学分级(图2E)。

图2.组蛋白乙酰化修饰模式及其临床特征

4.组蛋白乙酰化模式与肿瘤分子背景和免疫浸润相关生信分析

为进一步确定三种组蛋白乙酰化修饰模式在生物学功能上的差异,研究者基于KEGG基因集进行GSVA富集分析。与HAcluster_A和HAcluster_C相比,HAcluster_B富集于致癌激活,细胞周期和凋亡等通路,HAcluster_A和HAcluster_C在几个与生物代谢相关的通路中富集(图3A、B)。研究者根据另一研究中获得的致瘤特征数据进行GSVA富集分析,同样证实HAcluster_B在大多数恶性通路中富集(图3C)。此外,HAcluster_B中血管生成、EMT和癌干性的活性也相对较高(图3C)。

研究者进一步对组蛋白乙酰化调节因子与TME之间关联进行全面研究,首先基于ssGSEA算法来量化浸润TME的免疫细胞的相对丰度。Spearman相关分析显示,调节因子与TME浸润免疫细胞有很强的相关性(图3D)。此外,还分析三种组蛋白乙酰化模式下TME细胞浸润的差异(图3E)。HAcluster_B中被激活的树突状细胞和浆细胞样树突状细胞,自然杀伤细胞等数量较高,激活的CD8 T细胞以及其他重要的肿瘤杀伤细胞和gamma delta T细胞含量较低。以上结果表明,HAcluster_B是一种免疫抑制亚型,其免疫抑制细胞的活跃抵消高度激活的抗原抵制细胞的积极影响,导致HAcluster_B患者预后不良。为证实这一假设,研究者基于Bindea和Thorsson等人的相关基因特征数据,分析三种组蛋白乙酰化模式中的免疫抑制活性、免疫溶细胞效应和抗原呈递活性的变化。结果显示,HAcluster_B的免疫抑制和抗原加工活性最高,而HAcluster_B的免疫溶细胞活性最低,与之前的分析一致(图3F)。

图3.组蛋白乙酰化模式的生物学特征

5.个体化肝癌组蛋白乙酰化的模型构建生信分析

为全面了解三种HAculsters之间的生物学特征差异,基于之前在RNA-seq meta队列中分析的三个HAcluster,研究者确定591个与患者预后显著相关的DEGs来表征HAcluster。这些DEGs的GO富集表明,它们主要与组蛋白乙酰化、细胞周期等过程相关(图4A)。研究者发现,根据这些DEGs可将患者聚为3个表型相关的亚型,分别为geneCluster_A、geneCluster_B和geneCluster_C。大多数DEGs在geneCluster_B中高表达4B)。生存分析表面,geneCluster_b的患者预后最差(图4C)。研究者基于这些表型相关的DEGs构建一个评分模型(组蛋白乙酰化评分,HAscore),首先采用无监督聚类方法对预后相关DEGs进行分析,将患者分为若干组进行进一步分析。采用一致性聚类算法确定基因聚类的数量及其稳定性,并将这些基因的表达转化为Z评分,并进行主成分分析(PCA)构建修饰的乙酰化相关基因特征。选取主成分1和主成分2(分别为PC1和PC2)作为特征分数。

研究者发现HAscore与组蛋白乙酰化调节因子和表型相关DEGs的mRNA表达呈正相关。HAcluster_B和geneCluster_B的HAscore最高(图4D, E)。

接下来,研究者使用Survminer包将患者分为高HAscore和低HAscore组,并基于频率分布直方图对不同分类结果进行重叠分析。结果表明,高HAscore组样本均来自于geneCluster_B(204个样本中172个,占84.3%),geneCluster A和geneCluster_C中大部分患者是低HAscore组的主要组成部分(图4G)。以上结果表明,这三种分类计算方法具有较高的一致性。低HAscores的患者生存时间更长(图4F,4H),并且包含年龄,性别等临床特征相关的多因素cox回归分析表明在TCGA-LIHC和GSE14520队列中,HAscore是一个稳健的、独立的预后生物标志物(图4I)。

图4.个体化肝癌组蛋白乙酰化的模型构建

6.临床特征、分子特征和与HAscore相关的TME浸润细胞

研究者进一步探索导致不同HAscore组之间出现预后差异的潜在机制。首先,对HAscore与临床特征、分子特征和TME等特征之间的关系进行分析。首先探究HAscore与临床特征的相关性,如图5A,B所示,HAscore较高与AFP高表达、血管浸润、病毒感染等HCC预后危险因素相关,进一步表明高HAscore患者的生存预后较差。

另外,除NRF2信号通路外,几乎所有与癌症相关的恶性通路(如细胞周期、HIPPO等)均与HAscore显著正相关(图5C)。HAscore与肿瘤浸润免疫细胞、免疫功能的相关性分析表明HAscore与免疫抑制活性的细胞呈显著正相关,与免疫溶细胞活性呈负相关(图5C-D),说明HAscore与TME密切相关,高HAscore组被认为是免疫抑制亚型。

图5.不同HAscore组的临床特征、分子特征和TME浸润

7.HAscore与抗肿瘤药物敏感性

组蛋白乙酰化修饰与肿瘤的功能通路密切相关,HAscore在预测患者相关药物响应方面具有潜在价值。为验证这一假设,研究者使用GDSC数据库评估了癌细胞系中HAscore和药物反应之间的关系。基于Spearman相关分析,研究者发现西妥昔单抗等42种药物在低HAscores的细胞系中更敏感,HDAC6抑制剂ACY-1215 等74种药物则在HAscores高的样本中可能更敏感(图6A)。研究者进一步分析这些药物靶向基因的信号通路,在高HAscores样本中敏感的药物主要针对组蛋白乙酰化、有丝分裂、细胞周期和DNA复制等过程。与之前的分析一致,即大多数组蛋白修饰调控因子,细胞周期和DNA复制相关活性在高HAscore组中活跃。此外,在低HAscores样本中敏感的药物主要针对MEK2和RTK信号通路(图6B)。

为检验HAscore是否可以预测患者的药物反应,研究者基于几个使用相关抗肿瘤药物治疗的数据集,分析药物反应与HAscore之间的关系。在GSE5851数据集中,对晚期转移性结直肠癌患者进行西妥昔单抗单药治疗的分析显示,有应答者的HAscore显著低于无应答者(图6C)。低HAscore组的无进展生存期(PFS)明显长于高HAscore组(图6D)。HAscore药物敏感性相关ROC曲线的AUC为0.691(图6E)。这些结果与在低HAscore组西妥昔单抗的敏感性更高的发现一致。此外,在GSE22219数据集中,对环磷酰胺、甲氨喋呤和5-氟尿嘧啶方案治疗乳腺癌患者的分析显示,高HAscores患者的无进展生存期明显更长(图6F)。生信分析

基于GSE148623数据集的分析显示,对HDACi有响应者的HAscore更高,高HAscore患者的PFS更长(图6G, H)。总之,这些分析表明HAscore在预测患者药物反应方面具有潜在价值。

图6.HAscore与药物响应

8.HAscore与PD-L1或PD-1免疫治疗

HAscore与TME密切相关,研究者基于两个免疫疗法队列检测HAscore预测患者对ICI治疗响应的能力。首先,基于TCGA-ICGC和GEO队列,分析HAscore和TIDE之间的关系。结果表明,高HAscore组的TIDE得分均显著较高(图7A、B),且HAscore与TIDE评分呈正相关。此外,HAscore与MDSC浸润显著正相关,表明高HAscore组是一种免疫抑制亚型。此外,对抗PD-L1免疫治疗样本的分析显示,HAscore低的患者获益更多,生存时间更长(图7C)。抗PD-L1阻断剂完全缓解(CR)或部分缓解(PR)的患者比例在低HAscore组为27%,而在高HAscore组仅为13%(图7D)。图7E、F显示,低HAscore组的新抗原负荷和突变负荷较高(P = 0.00022;P = 0.012),低HAscore组的TIDE评分较低。这与TIDE评分低的患者似乎从IBI治疗中获得更多临床益处的发现一致。以上结果表明,低HAscores的患者在ICI治疗中可以获得更大的生存优势和临床益处。

图7.HAscore与免疫治疗

今天的文章内容大概就是这些,是不是思路超级清晰呢?还没完全消化吸收的小伙伴也不要怕,可以联系我们做定制化思路。大家要问这个系列还能发吗?答案是肯定的,毕竟文章陆陆续续的一直有,只要内容严谨,写作能力优秀,内容再稍微出彩,有新意一点,5分以上肯定没问题,如果有能力的话,再与临床和实验一结合,10分也不是没有可能~

若有感兴趣的基因集点击咨询

在做家族基因分析时,我们的首要任务是选好研究主题,只有主题有新意,有创意才能先人一步吸引到审稿人的目光。至于具体选择,不论是最近火热的铁死亡,自噬,衰老,DNA损伤修复还是免疫相关基因,完全取决于你和你想要研究的癌型的特点。

1.基因landscape:展示基因在相应癌症中的突变,拷贝数改变,差异表达,差异甲基化等,说明该家族基因与某癌症形成发展高度相关。

2.基因筛选:在家族基因过多或分类效能不足时对基因进行筛选,获取最佳基因集合。筛选方法主要包括:

a.差异分析(正常 vs 癌症;突变 vs 野生等)。

b.预后分析(高表达 vs 低表达;突变 vs 野生;拷贝数改变 vs 拷贝数不改变;单因素cox分析等)。

c.相关分析:与其他基因表达,免疫细胞浸润特征,与药物响应等的的相关性分析。

d.其他(变异系数等)。

3.模型构建:基于筛选出的特征基因构建分类模型。分类方法主要包括简单的多因素cox回归分析,lasso cox回归分析,特征基因表达一致性聚类,主成分分析,以及难度较高的神经网络,深度学习等。

4.模型评估:评估模型的分类效能。

a.预测性能评估:独立数据集验证,AUC(ROC曲线下与坐标轴围成的面积),C-index指数,与已知预后模型的比较。

b.独立性评估:多因素cox回归分析判断预测模型是否独立于性别,年龄等临床特征。

5.不同分子亚型的比较基因表达,通路活性,TP53突变,免疫细胞浸润比例,免疫得分,HRD打分等预后特征。

6.列线图模型的建立和验证。

7.亚型与药物响应将组织中分类模型应用到细胞系或其他用药数据中,评估不同类别与药物响应之间的关系。

8.结合实验或者自测数据对自己的结果进行验证。

9.其他:在以上基础上,可以适当利用单细胞分析,ATAC-seq分析等进一步充实文章内容,补充实验结果。

家族基因分析的流程大概就是这些,小编也会在文末中添加两篇基因家族分析相关的文章,感兴趣的小伙伴可以去自行阅读学习哦~

同学们完全可以在自己的分析过程中对以上步骤进行自由选择,随机组合,取你所想,用你所需。但切记不要照本宣科,千篇一律,但也不要内容堆砌,我们要在保证研究完整,严谨的同时,在最需要的地方做最合适的分析。

思路易得,但研究更需要创新和新意,如何能让“平平无奇”的基因家族分析变得更有灵魂和思想是我们每个生信从业者都要面对和解决的难题之一。遗憾的是,小编暂时能想到的只有以下这几点:首先是寄希望于一些小众或者最新发现的基因,试图在大家走火热研究思路的同时,开辟一条不一样的道路;其次是改进自己的模型构建方法,深入研究算法,提升效能;最后一点就是和实验和临床结合,让实验充分证实自己的结果,但是这个对于实力和财力都有着不小的要求。以上就是我的一点小小看法,肯定有不合适或者偏颇的地方,在这里也希望评论区的小伙伴们能多多留言,大家一起开拓思路,寻找答案。

其他基因家族分析相关文章:

1.A Novel Ferroptosis-Associated Gene Signature to Predict Prognosis in Patients with Uveal Melanoma

首先基于单因素cox分析识别出与TCGA中UM患者预后相关的铁死亡基因,接着通过LASSO Cox回归模型构建铁死亡相关基因的预后特征,进而在独立数据集中进行验证。最后还对铁死亡相关基因风险评分与UM常见拷贝数改变,自噬和免疫浸润之间关联进行分析。

2.Glioma-Associated Stromal Cells Stimulate Glioma Malignancy by Regulating the Tumor Immune Microenvironment

研究者基于TCGA和CGGA中胶质瘤数据集,利用单样本基因集合富集分析(ssGSEA)算法根据胶质瘤基质细胞(GASC)含量对患者进行分型。基于xCELL和CIBERSORT算法分析基质细胞和免疫细胞的组成并建立神经胶质瘤的风险评分和nomogram预后预测模型。

基因家族仍可做 创新型个性化生信分析 可评估

更多精彩文章:

22年一定要掌握的十大生信发文路线 - 简书 (jianshu.com)

SCI 热点跟踪 Cellular senescence:抗衰新机会 - 简书 (jianshu.com)

SCI 热点跟踪 Cellular senescence:抗衰新机会 - 简书 (jianshu.com)

相关文章

  • 新意难寻的基因家族是不是你的意难平?

    大家还记得之前的TMEscore[http://mp.weixin.qq.com/s?__biz=MzA5NjU5...

  • 意难平的家族关系

    小时候希望快快长大 长大了又希望回到小时候 都说家家有本难念的经,都是一地的鸡毛。我家也不例外,我可以说我是很讨厌...

  • 基因家族专题(2):数据下载与基因家族成员的鉴定

    确定的研究基因家族 在做基因家族的研究直接,首先你要确定你需要研究的对象(基因家族是什么?) 一般来说选择基因家族...

  • 意难平

    回望过去,你还有多少意难平, 想想也都随风而去,云淡风轻, 它只活在过去,而我们只要活好当 下,意难平,难追忆,随...

  • 基因家族分析(四)

    基因家族流程:基因家族分析(一) 基因家族流程:基因家族分析(二) 基因家族流程:基因家族分析(三) ======...

  • 组学大讲堂视频课程

    1. 文章越来越难发?是你没发现新思路,基因家族分析发2-4分文章简单快速,学习链接:基因家族分析实操课程、基因家...

  • 意难平,意难平

    人生真是一场游戏,一场梦,是一次单程旅行。 读《明朝那些事儿》,跟随张居正轰轰烈烈走完一生,内心受到极大的震撼。 ...

  • 心难导,意难平

    这个世界上除了人的其他生物,都在为了自身存在和繁衍的必要能量而奔波,直到他们生命终结的一刻。 而人类,在踏入文明社...

  • 心难平。意难消

    有一股无名的火,在心头燃烧,压都快压不住了。那是一种爱的涌动,犹如地下的火,在岩浆中翻滚,大家都知道,这最终要么冷...

  • 基因家族分析(三)

    基因家族流程:基因家族分析(一) 基因家族流程:基因家族分析(二) =======================...

网友评论

      本文标题:新意难寻的基因家族是不是你的意难平?

      本文链接:https://www.haomeiwen.com/subject/igcmrrtx.html