大家好,今天给大家分享的文章是今年1月发表在Genome Biology上的一篇文章,IF:10.806,是一项有关于肿瘤治疗中可变剪切的研究。
胶质母细胞瘤治疗中可变剪切的进展
背景
可变剪切(AS)是免疫治疗中肿瘤特异性新抗原靶点的可靠来源,胶质母细胞瘤(GBM)是成人大脑中最常见的原发性肿瘤,对标准疗法具有抵抗力。然而,复发性GBM的表达数据有限,对治疗中剪切模式的进展也知之甚少,基于这些背景,作者对其进行了如下研究。
方法部分
数据集
从加州大学获得了接受胶质瘤手术切除的患者组织,RNA经过纯化处理之后,通过Bioanalyzer和Qubit对RNA,DNA进行定量,以确保样本质量。非恶性人脑组织的RNA-seq数据是从GTEx数据库获得的。细胞表面蛋白和蛋白结构域的注释分别来自CSPA和UCSC。成对的纵向GBM数据是来自TCGA和INCB。
de novo RNA-seq数据分析
在Illumina NovaSeq平台上进行双末端测序,每个样本产生超过2.77亿个读长对。对于原始数据,使用Trim Galore对读长进行质控,包括修剪序列和移除接头。质控后的读长通过HISAT2与grCh38进行比对。基于ENSEMBL中的参考基因组,使用featureCounts对基因表达进行定量。然后,根据featureCounts获得的counts,应用R包“DESeq2”在原发性和复发性病例之间进行差异表达分析,“Fdrtool”包用于校正p值。
可变剪切分析
使用MAJIQ和VOILA进行可变剪切分析。MAJIQ-Build用于定义和量化已知和新的局部剪切变异(LSV)的剪切图,使用ENSEMBL中的GFF3参考文件作为输入来定义已知的LSV。MAJIQ-Delapsi用于识别不同的可变剪切事件,然后使用VOILA对MAJIQ的输出进行汇总和可视化。
其他生物信息学分析
外显子跳跃事件用于主成分分析,在GTEx的非恶性脑数据中设置阈值(PSI[剪切百分比]=0)来获得肿瘤特异性剪切事件。RNA结合蛋白基序的富集是通过oRNAment执行的。基于“Wikipathway cancer”数据库使用WebGestalt进行GO term过表达分析。研究者还获得了9例GBM患者的scRNA-seq数据,通过“Seurat”包中的AddModuleScore函数来计算谱系评分。此外,scRNA-seq的细胞类型分类是通过ELSA完成的。
为了验证结合点并评估其细胞类型特异性,研究者使用BLASTn将来自scRNA-seq,TCGA和INCB数据集的序列映射至AS-接合衍生的参照。基于3个阅读框,通过翻译来自grCh38参考基因组的核苷酸序列来产生结合点衍生的多肽。然后将这些结合点衍生的多肽与CPTAC数据库的GBM质谱数据进行比较,并使用CPTAC中的插件OpenMS进行多肽筛选。
新抗原预测
研究者使用seq2HLA从RNA-seq数据推断患者的HLA I类血清型,其方法原理是将RNA-Seq读长与HLA等位基因的参考数据库进行比对,并确定每个类别的HLA类型、置信度得分和特定于位点的表达水平。为了获得结合点衍生的序列,在结合点坐标周围的参考中提取了50个碱基对的序列。然后,使用结合点衍生序列和患者特定的HLA血清型作为输入,运行NetMHCpan来预测裂解肽和HLA结合亲和力。
结果部分
复发性GBM的AS分析
该研究纳入了来自23名患者的37个GBM样本(19例原发,18例复发),另有34个样本是患者匹配的纵向样本(图1A)。研究者通过MAJIQ 在非恶性大脑,原发性和复发性GBM之间构建了一个AS的综合模型(图1B)。从结果可以发现,在主成分分析中,非恶性脑样本形成了一个不同的簇,与原发性和复发性GBM样本分开(图1C)。PSI值是通过MAJIQ的贝叶斯模型计算得出的,对AS事件的GO分析显示,其主要富集在生长因子信号传导,肿瘤生长因子和促炎信号等生物学过程(图1D)。当比较原发性和复发性疾病时,AS事件类型的相对比例是稳定的(图1E)。
图1
自体T细胞治疗靶点的识别
研究者首先在癌症特异性结合点中筛选GBM特异性靶点,这些结合点在以前的泛癌分析中已被确定。在GBM中表达的细胞表面蛋白中识别了2011个结合点事件,其中37.8%属于细胞外结构域,因此适合作为CAR T细胞(嵌合抗原受体T细胞)的靶点(图2A)。然后,研究者比较了GBM scRNA-seq数据,以验证结合点序列是在肿瘤细胞中表达,而在非恶性胶质细胞或免疫细胞中不表达(图2B)。从结果来看,他们发现了多个由GBM肿瘤细胞特异性表达的结合点,其中包括长期被研究为GBM侵袭介质的细胞外基质受体(如PTPRZ1;图2C)。此外还发现几个在单个肿瘤内10-35%的肿瘤细胞和5-10%的GBM病例中表达的靶序列(图2D)。
图2
研究者还针对肿瘤特异性AS事件验证了RNA-seq数据,在GBM样本与非恶性脑样本之间识别了差异剪切基因,然后只保留那些在非恶性大脑中不存在的事件。与之前的差异剪切分析相比,肿瘤特异性事件要少得多(图3A),共确定了221个肿瘤特异性的AS事件(图3B),且大多数只发生在复发性GBM中。当比较GBM scRNA-seq数据时,研究者发现在细胞表面蛋白中有21个结合点事件,它们在肿瘤细胞中特异性表达并存在于细胞外结构域中(图3C,D)。根据前人的方法,研究者获得了跨越结合点的多肽序列,并将它们与CPTAC数据库进行了比较。结果发现,超过75%的样本表达了至少一个CPTAC验证的结合点(图3E),每个样本平均有3-4个结合点被验证(图3F)。他们认为这是一个保守的低估,因为由于胰蛋白酶的切割特性,在质谱数据中,可变剪切衍生的跨接多肽表现性不佳。因此,他们认为所有的RNA水平的候选物都适合作为CAR T细胞靶点进行进一步的验证。
图3
虽然主要关注点是识别CAR T细胞的靶点,但研究者也筛选了TCR T细胞治疗的靶点。与CAR T细胞相比,TCR T细胞的灵活性较低。因此,为了确定TCR T细胞治疗的靶点,首先需要从相关的RNA-seq数据中确定每个患者的HLA I类血清型(图4A)。然后,从50个碱基对的参考中提取序列,并使用NetMHCpan预测相关蛋白质产物中的裂解肽。根据患者的血清型,NetMHCpan进一步用于预测产生的多肽与HLA的结合。最后共识别了704个结合点衍生的新抗原(图4B),并且单个结合点可能会导致多个新抗原。此外,在复发性GBM中,推断出的新抗原数量和这些抗原的预测结合亲和力均有所增加(图4C,D)。
图4
AS事件在复发性GBM中的富集
接下来,研究者通过MAJIQ进行了差异PSI检验,比较了原发样本和复发样本。在95%的置信度水平下,在107个基因中识别了172个AS事件,预期PSI差异大于10%,许多事件都发生在对恶性进展至关重要的基因中。例如,生长因子受体(FGFR1,FGFR2,EGFR)和基质蛋白(TNC,FN1)在原发性和复发性GBM中显示出显著的PSI差异(图5A)。此外还发现,那些富集在本数据中的复发性GBM的AS也富集在其它GBM RNA-seq数据集中(图5B)。
图5
复发性GBM优先表达侵袭的异构体
大部分结合位点位于编码区,较少位于非翻译区和内含子区(图6A)。此外,还识别了几种富含丝氨酸和精氨酸的剪切因子(SRSF)RNA结合蛋白(图6B)。SRSF剪切因子先前被认为与癌症进展有关,因为它们具有结合可变外显子并抑制或促进外显子跳跃的能力。
一些预测的SRSF结合位点出现在复发性GBM中特异保留的外显子中。例如,MAP4K4的外显子19优先保留在复发性GBM中,但在原发性GBM中优先剪切(图6C)。此外,SRSF5和SRSF9基序(分析中表达最高的2个基序)在外显子19中富集(图6D)。这种外显子19在复发时的富集在本研究数据中(图6E)是明显的,并在公共的纵向GBM RNA-seq数据中得到验证,这既是通过MAJIQ建模(图6F),也是根据表达相关结合点的原发性和复发性病例数得以验证的(图6G)。
为了确定MAP4K4异构体表达的细胞类型特异性,通过筛选scRNA-seq数据时发现,与具有更高分化表型的细胞相比,类干细胞中支持外显子19的连接序列增加了2倍以上(图6H)。此外,这种异构体主要在间充质亚型的类干细胞中被发现。与此异构体在刺激MAPK8中的作用一致,研究者发现复发性GBM中MAPK8表达明显增加(p = 0.045)。在细胞外基质侵袭实验中,发现SRSF5过表达增加了侵袭性,这种影响被替莫唑胺治疗加剧(图6I)。
图6
以上的研究增强了我们对复发性GBM中AS进展的理解,也认识了免疫治疗的新潜在靶点,希望能对大家的科研有所帮助。
参考文献:The evolution of alternative splicing in glioblastoma under therapy
个性化生信分析需求可填写生信意向表单
更多精彩文献解读可关注生信人
网友评论