基因的可变剪切造就了转录本的多样性,作为一种常见的基因表达调控机制,对于生物体的生长、发育和适应环境等方面都具有重要作用:
- 增加基因编码的多样性: 可变剪切使得一个基因可以编码多种不同的蛋白质,从而增加了基因的功能多样性和灵活性。
- 调控基因表达水平: 可变剪切可以影响基因的表达水平,通过剪切不同的外显子或选择性保留或排除内含子,调节基因的转录水平。
- 调节蛋白质功能: 不同的剪切变体可能会产生不同结构和功能的蛋白质,从而影响蛋白质的功能和相互作用。
- 响应环境变化: 可变剪切可以在细胞受到内外环境信号时调节基因表达,使细胞能够适应不同的生理和环境条件。
- 参与疾病发生: 可变剪切异常与多种疾病的发生和发展密切相关,例如癌症、神经系统疾病等。对可变剪切的研究有助于深入理解疾病的发病机制,并为疾病的诊断和治疗提供新的靶点和策略。
分 类
由此可见,可变剪切的功能还是很重要的。所以,在bulkRNA
中有不少软件可以用来研究样本的可变剪切情况。为了研究可变剪切,软件首先根据剪切的方式将可变剪切划分成不同的种类,比较经典的是分成五类:ES
、IR
、MEE
、A5
、A3
。然后,通过类似IncLevel
或者PSI
这样的指标来衡量剪切情况,从而计算出在不同情况下是否有差异。
![](https://img.haomeiwen.com/i23667126/d9fb01301fea5855.png)
不成熟的见解
可变剪切可以将差异的视角从基因水平调整到转录本水平。如通过RNA-seq
来寻找两种条件下的差异基因,也许基因层面在两种条件下并不是差异的,但在转录本水平却是差异的,这正是由于虽然基因在不同条件下表达了不同的转录本和表达丰度,但是不同转录本在基因层面的丰度总和接近,所以从基因水平来看并不差异,可当视角切换到转录本水平却是可以寻找到差别。由于转录本是可变剪切的结果,若可变剪切有差异,可以很自然地联想到其结果可能会是转录本也有差异。
从bulk RNA-seq
角度来看,用差异可变剪切来衡量是否有转录本的差异似乎有些鸡肋!目前,已经有不少软件可用于转录本表达定量,如kallisto
、salmon
等,如果单纯的想从转录本水平的丰度看是否有差异,使用这些软件定量后,再做个差异分析,这岂不是更直接了当,还需要可变剪切这样较隐晦的方式么?
毕竟,大部分研究都是基于重测序,也就是说已经有组装好的参考基因组和基因注释,每个基因所有可能的转录本结构也已清晰,而目前市面上分析差异可变剪切的软件大都需要基于基因注释文件,换句话说,这些软件的结果描述了形成某种确定转录本的剪切方式在两个条件下是否有差异。如果可变剪切的方式都能与注释中已有的转录本对应起来,从这角度来说,相较于转录本差异分析来说差异可变剪切处境有些尴尬!
也许,可变剪切考察更多的是剪切方式本身的不同,也许由于处理的原因,导致剪切发生异常,发生在一些不该出现的位点,这时差异可变剪切便可以发挥效用,寻找出不同条件下的差异。那么,对于这种情况,是否也可用定量差异的方式来解决呢?比如先组装不同条件下样本的转录本,形成转录本的合集,然后再来做转录本的定量和差异。
当然,分析方法肯定会随着技术的迭代而更新,通往目的地的途径也是多元化的,能够简单有效的解决问题才是关键。以上仅是个人在学习可变剪切过程中产生的一点不成熟的看法,观点可能是狭隘的,欢迎交流!
网友评论