基因集功能富集分析
一组基因直接注释的结果是得到大量的功能结点。这些功能具有概念上的交叠现象,导致分析结果冗余,不利于进一步的精细分析,所以研究人员希望对得到的功能结点加以过滤和筛选,以便获得更有意义的功能信息。
富集分析算法
富集分析方法通常是分析一组基因在某个功能结点上是否过出现(over-presentation)。这个原理可以由单个基因的注释分析发展到大基因集合的成组分析。
由于分析的结论是基于一组相关的基因,而不是根据单个基因,所以富集分析方法增加了研究的可靠性,同时也能够识别出与生物现象最相关的生物过程。
常用的功能富集网站有agrigo、David等
david网站这里以目前应用较为广泛的DAVID为例对基因集进行具体分析。DAVID是一个综合工具,不但提供基因富集分析,还提供基因间ID的转换、基因功能的分类等。
基于GO的基因功能预测
1、对差异表达基因进行功能预测
在基因芯片的数据分析中,研究者可以找出哪些差异表达基因属于一个共同的GO功能分支,并用统计学方法检验结果是否具有统计学意义,从而得出差异表达基因主要参与了哪些生物功能。
- 蛋白质互作网络用于基因功能预测
目前,利用相互作用网络进行功能注释主要有两种方法,即直接注释方法(direct annotation schemes)和基于模块的方法(module assisted schemes)。 - 利用GO体系结构比较基因功能
通常认为如果两个基因产物的功能相似,那么它们的表达也就相近,同时它们在GO中注解的结点就相似,所以只要能找出GO中结点对的相似度,就可以近似估计两基因表达的相似度,从而判断两基因产物的功能的相似度。
基于KEGG的基因功能预测
通路分析是现在经常被使用的芯片数据基因功能分析法。与GO分类法(应用单个基因的GO分类信息)不同,通路分析法利用的资源是许多已经研究清楚的基因之间的相互作用,即生物学通路。研究者可以把表达发生变化的基因集导入通路分析软件中,进而得到变化的基因都存在于哪些已知通路中,并通过统计学方法计算哪些通路与基因表达的变化最为相关。
网友评论