作为一个生物学家(zha),差异表达分析似乎是一项必备的技能。然鹅对于一个没有任何编程基础的生物学家,写代码是那么神秘莫测而又遥不可及,让人脑壳疼。那么今天小编就为大家介绍一款神器,不用写一行代码就可以轻松做差异表达分析,并且主流的差异表达算法DESeq,limma,edgeR任君挑选。
这个神器就是DEapp,是一个网络工具
https://yanli.shinyapps.io/DEApp/
主页是这样的,有详细的介绍和清晰的导航
这个工具支持根据单因素分组,也支持根据多因素分组。今天我们就以单因素分组为例,大家感兴趣可以自己去尝试多因素分组分析。
1. 上传表达谱和分组信息(这里表达谱数据为RNAseq得到count数)
支持三种格式,csv文件,制表符隔开的文件和分号隔开的文件。从本地电脑上选择上传,点击提交。
成功提交后,会看到如下的summary信息,就可以点击GO TO STEP 2了
2. 数据过滤,boxplot和PCA展示
数据过滤,指定CPM的cutoff,还有样本的cutoff,点击提交
boxplot和PCA展示
接下来就可以GO TO STEP 3了,可以根据个人喜好选择一个的差异表达分析的算法。这里以limma为例,点击中间的按钮。
3.差异表法分析
填写分组信息,设置P值的cutoff和Fold change的cutoff,提交。
查看差异表达分析结果,图和表都给出来了。火山图是不是似曾相识。点击Download就可以下载这张表。在火山图上右键,就能保存这站图片。这张表还比较强大,可以像Excel一样进行排序和查找。
到这里基于limma的差异表达分析就做完了,是不是很简单。如果想使用其他两种方法来做,也很容易。在页面的最下面,选择相应的算法就可以了。火眼晶晶的你是否已经发现,这里还有个“彩蛋”,GO TO STEP 4。是的,你可以去比较这三种方法的优劣,甚至可以取个交集。点击GO TO STEP 4
4.比较三种差异表达分析算法的结果
选择方法,设置分组,设置cutoff,都跟前面一样。提交之后就能得到结果。
三种方法比较总结
三种方法比较的韦恩图
点击Download就能把比较的结果下载下来。如果你觉得三种方法的交集更可靠,可以只挑出中间的2490个基因作为最终结果。
该工具除了提供网页版本意外,也可以下载到本地。网络应用实际上有一些局限性
1.这个网站搞不好那天就不存在了
2.服务器搞不好哪天就负载过重down掉了
3.用的人多了,你的任务还要排队,什么时候排得上谁也说不准
4.上传文件有大小限制
5.数据安全性谁也不能保证
而本地版本的DEapp就没有这些局限性。本地版本的下载及使用可以参考下面这篇文章
利用该工具的GEO数据实战请参考下面这篇文章,这篇文章将手把手教你如何使用这个工具基于GEO数据做差异表达分析
网友评论