美文网首页
差异表达分析简便且免费的工具,我们已经研发出来啦~

差异表达分析简便且免费的工具,我们已经研发出来啦~

作者: 概普生信 | 来源:发表于2021-07-15 09:29 被阅读0次

    GEO虽是一个宝库,但是使用GEO进行数据分析可不是一件简单的事!

    首先,GEO的数据检索非常不方便,例如,我想获取有预后信息的乳腺癌数据,显然使用GEO官方检索起来很难。

    其次,GEO大部分数据都基因芯片数据,不能直接用于转录组分析。需要把芯片的表达转换为基因的表达,这就要求用户有一定的编程能力。

    再次,即使你有一些编程能力,你还需要熟悉各种分析方法。对于非生信专业来说,这显然非常头大。

    GEO官方也意识到了这些问题,提供了GEO2R功能,可是这对于广大用户来说,还是远远不够。作为一个工具人,于是就有了easyGEO(https://easygeo.cn),正如其名,就是为了使用GEO更容易一些。下面就以获取乳腺癌差异基因为例说明easyGEO的用法。

    一、检索数据

    打开easyGEO地址:https://easygeo.cn。

    点击“查看更多”按钮,跳转到GEO数据列表页面。

    疾病选择:“breast cancer”。

    选中“生存数据”复选框。

    这样就可以看到所有有预后信息的乳腺癌数据了。由于我们需要对正常样本与乳腺癌样本进行差异表达分析,还需要有正常样本,这里选择数据GSE52568(https://easygeo.cn/#/series/GSE42568)进行差异表达分析。

    二、数据预处理

    在数据详情页面,点击“数据预处理”按钮即可进入。

    在预处理页面只需要关注一个参数,那就是基因名称所在列,easyGEO会根据该列将探针转换为基因。哪一列是基因名称所在列可以在平台的注释信息(点击“平台信息”按钮),本例中为Gene Symbol。

    点击开始预处理按钮即可进行数据预处理。

    三、差异表达分析

    待预处理完成,在预处理任务的右侧即可进入差异分析流程。

    使用在线工具进行分析的时候,往往会碰到一个很棘手的问题,虽然工具提供的功能很好,但是往往需要用户把数据下载下来进行处理,得到特定的格式之后再把结果上传,然后再使用在线工具进行分析。一个常见的场景就是分组。

    例如:

    需要根据临床信息表中的年龄数据、肿瘤大小等连续数据分为高低两组。

    临床信息表中的分组数据的合并,例如癌症IIa、IIb两个分期需要合并为同一个分期。

    为了解决上述问题,easyGEO内置了一个分组工具。关于分组工具的使用方法见如何使用easyGEO分组工具(https://easygeo.cn/#/faqs/using-easyGEO-grouping-tool)。本例中使用tissue列快速新建分组。

    这个时候,如果不需要调整参数,直接点击生成报告就可以了。查看示例报告(https://apts.gaptools.cn/media/geo/1414486662113001472/easyGEO-de-GSE42568-61560.pdf)。

    重要的事情说三遍:

    easyGEO地址:https://www.easygeo.cn

    easyGEO地址:https://www.easygeo.cn

    easyGEO地址:https://www.easygeo.cn

    相关文章

      网友评论

          本文标题:差异表达分析简便且免费的工具,我们已经研发出来啦~

          本文链接:https://www.haomeiwen.com/subject/vadppltx.html