美文网首页生信研究生必备
IsoformSwitchAnalyzeR:差异转录本分析(1)

IsoformSwitchAnalyzeR:差异转录本分析(1)

作者: 生信云笔记 | 来源:发表于2022-03-05 12:08 被阅读0次

日常瞎掰

  RNA-seq最常用来研究两种condition下有哪些基因的表达值发生了改变,即差异表达基因(different expression gene),从而找到影响特定处理的一些关键基因。当然这是比较直接一种方式,大部分情况下都是从基因水平来看差异。有时候基因水平的信息量是不够的。我们都知道基因在转录时会发生可变剪接从而生成不同的转录本,也许从基因水平来看两种条件下没有差异,但转录本水平却发生了不同。这无疑也是一个不错的角度来研究差异。下面我们就来介绍一个分析差异转录本的好物——IsoformSwitchAnalyzeR。
  这个R包是专门用来分析转录本差异以及可视化的,用起来也是相当的方便。好了,废话不多说了,下面让我一起来见识一下这个R包。

庐山真面目

  首先来看一下该软件的工作流程示意图,这样有助于我们对这个软件有一个整体的认识,知道这个软件都可以包含哪些分析内容:

  从流程图上,我们可以看出这个软件主要包含两大块:一是提取差异转录本和及其序列信息;二是可变剪接以及其他的额外分析。这两个大块分析内容分别对应一个一键式的分析函数:isoformSwitchAnalysisPart1()和isoformSwitchAnalysisPart2()。当然如果你为了省时省力完全可以用一键式的函数来完成分析,又或者你是R语言高手也可以选择分步来完成分析。

使用

  看了软件的工作流程图,对软件有了初步的了解后,那下面我们就开始使用起来吧。在用软件前,我们至少需要准备好四类文件:
1、样本转录本的表达定量文件;
2、转录本的GTF文件;
3、转录本的fasta文件;
4、Design文件,至少包含两列(前列名分别为sampleID、condition),第一列是样本名,第一列为样本分组名。
  转录本定量的软件可为Kallisto、Salmon、RSEM、StringTie。所有样本定量结果的统一放到一个目录下,每一个样本的结果再放到以样本名命名的子目录里面即可。这里以Kallisto定量的结果为例,展示一下目录:

准备好需要的文件就可以开始分析了,下面来看看如何将数据导入到R里面:

>library(IsoformSwitchAnalyzeR)

>exp <- importIsoformExpression(parentDir='kallisto')
>design <- data.frame(sampleID=paste0('sample',1:6),condition=rep(c('case','ctrl'),each=3))
>design
  sampleID condition
1  sample1      case
2  sample2      case
3  sample3      case
4  sample4      ctrl
5  sample5      ctrl
6  sample6      ctrl
>aslist <- importRdata(isoformCountMatrix=exp$count,isoformRepExpression=exp$abundance,designMatrix='design.txt',isoformExonAnnoation='transcript.gtf',isoformNtFasta='transcript.fasta')

  上面的代码就可以将表达量数据读入R里面并结合design信息来生成IsoformSwitchAnalyzeR对象aslist,后续的分析都基于这个对象来完成。

##分步式差异转录本分析
>aslist <- preFilter(
    switchAnalyzeRlist = aslist,
    geneExpressionCutoff = 1,
    isoformExpressionCutoff = 0,
    removeSingleIsoformGenes = TRUE
)

>aslist <- isoformSwitchTestDEXSeq(
    switchAnalyzeRlist = aslist,
    reduceToSwitchingGenes=TRUE
)

##一键式差异转录本分析
aslist <- isoformSwitchAnalysisPart1(switchAnalyzeRlist=aslist)

  分析差异转录本的方法上面已经提到过可以用一键式函数来完成,也可以用分步式来完成,其实通过上面的代码来看两种方式都挺方便的。这里需要注意的一点是检测差异转录本的方法有两种:DEXSeq和DRIMSeq,在一键式函数里面默认的方法是DEXSeq。这里还有一点值得注意的是当分析的转录数据很多时,第二种方法会需要非常长的时间。最后顺便提一嘴,每个函数都有很多可调整的参数,分析过程中可根据需要设置。

结束语

  到此,第一大块的分析内容就结束,相当简单的几句代码就得到了差异转录本。当然这只是最基础的功能,这个R包还有很多高级的功能可以使用。时间不早了,今天先说到这了,后面我们再接着说~~~

相关文章

网友评论

    本文标题:IsoformSwitchAnalyzeR:差异转录本分析(1)

    本文链接:https://www.haomeiwen.com/subject/qxjmhrtx.html