生信分析工具-R2

作者: judyhappy | 来源:发表于2020-03-07 13:52 被阅读0次


    疫情期间,很多小伙伴不能去实验室做实验,没有数据,没有图表,心里空落落的~

    今天,介绍一个强大的网站,没有实验一样可以搞科研,利用组学大数据看看你心爱的那个蛋白、基因可能参与哪些过程吧!

    R2:https://hgserver1.amc.nl/cgi-bin/r2/main.cgi,该网站提供了大量转录组数据集,可以从基因差异表达,相关通路,生存分析等多种层面开展肿瘤信息学基础分析。

    TP53是著名的抑癌基因,对于各种类型癌症发生发展发挥重要功能。但是,除了已知的细胞周期等过程外,TP53在肝癌中是否还影响其他过程呢?这里,我们以“TP53在肝癌中相关功能”为例,说明R2网站的用法。

    步骤1. 选数据集和方法

    图1

    点击Change Dataset,网站提供了大量的组学数据集,用户根据需要进行筛选,选择需要的数据集,这里我们选择来源于TCGA数据库的肝癌数据集。

    图 2

    点击View a Gene,下拉框中选择需要的分析方法,为了推测TP53参与调控的其他生物学过程,这里我们选择“Find correlated genes with a single gene”,通过相关性分析识别TP53相关的基因集合;

    图3

    第4栏Gene输入基因名称: TP53

    图 4

    点击下方“Next”进入下一步

    步骤二:参数选择

    图 5

    最简单粗暴的方式就是先保留默认值,不进行任何改动;

    其中,值得注意的是,Statistics栏里面默认是Use R

    p-value, Yes, 这里我们也可以选择No,然后对应设定相关系数阈值为0.3(系统默认是0.5);

    图 6

    Gene Filters下方GeneCategory(见上图)可以根据研究需要仅仅选取感兴趣的目标基因进行分析,例如当你对你输入的基因可能相关的信号通路感兴趣时,可以选择“Signal transduction”,若对输入基因是否和药物靶标相关,则可以选择“drug target”, 诸如此类。当然,当你完全迷茫,漫无目的时,就简简单单选择“All”。这里我选择“ALL”。

    类似地,在KEGG Pathway下方可以选择你感兴趣的通路,例如“Oxidative phosphorylation“。注意,系统对你GeneCategory及KEGG Pathway等Filter的选择会进行交集处理,因此我建议当进行自定义选择时,仅仅就其中一项进行选择,其他默认选择“ALL”。

    步骤三:看结果,下图给出了选定肝数据集中TP53与哪些基因相关。

    图 7

    上述结构是与你输入的兴趣基因TP3相关的,相关系数绝对值大于0.3的基因。通常,一个输入基因相关的基因还是蛮多的。

    对于这一系列基因,我们可以采用通路富集分析、相互作用网络分析等方式进行功能描述。

    R2贴心的提供了这些小工具。

    接下来,就可以利用右侧列出的小工具进行下一步分析啦!

    选择右侧“Gene set analysis”,

    图 8

    通路富集分析,根据需要选择参数,其中r-min, r-plus代表负相关和正相关,可以单独选择也可以全都选择(系统默认均未选取时代表二者都选择)。

    结果如下,相关通路包括: Wnt signaling pathway, Adipocytokine signaling pathway, B cell receptor pathway 

    图9

    其中Genelist中红色标注基因与输入基因间负相关,绿色则表示正相关;

    点击通路对应的链接,还可以对每个通路的结果进行可视化展示:

    例如,Adipocytokine signaling pathway通路中与TP53相关基因:

    图 10

    接下来,我们想继续探索TP53与PPARA之间的相关性,回到R2网站主页,在分析方法栏选择“Correlated 2 Genes”.

    图11

    点击“Next”进入参数设定界面,其中Graphics下面的Graphtype可以选择“XY-plot”;

    图 12

    结果以散点图的形式给出该数据集中TP53与PPARA间的相关性;

    图12

    为了体现线性相关程度,还可以在下方绘图选项中增加一条拟合直线;

    图 13

    然后,点击“Adjust Settings”,稍等片刻,出结果:

    图 14

    该结果说明随着TP53表达量的增加,PPARA的表达量显著下降,暗示着两者间负调控关系;

    上述结果是单一数据集的,可能说服力不够,这时我们可以利用多数据集的分析。

    回到主页,选项设定如下:

    图 15

    R2功能很是强大,具体的小伙伴们可以参考OnlineTutorial:

    图 16

    R2提供了丰富的生物信息学工具,不需要下载数据,不需要写代码,轻松进行数据分析,为你的研究添砖加瓦。

    最后,衷心感谢R2开发者提供了如此功能丰富又免费的软件啊!

    相关文章

      网友评论

        本文标题:生信分析工具-R2

        本文链接:https://www.haomeiwen.com/subject/fmqcdhtx.html