bioconductor是R语言一种重要的项目,是专门利用R处理生物数据,类似于biopython与bioperl等,不过Bioconductor功能更加强大,不只是辅助处理一些生物数据。而是有些生物数据可以完成一整套分析内容,例如芯片数据和RNAseq数据等。Bioconductor分成独立的软件算法,实验数据,注释三部分,这三部分可以组合起来,完成一个完整的数据分析过程,不过Bioconductor的扩展包很多,学习难度较大,不过里面提供了很多完整的workflows,利用workflows学习起来更容易。
十七:Bioconductor Workflows
http://www.bioconductor.org/help/workflows/
1、打开Bioconductor workflows网址,这些workflows会按照功能分成8个大类,根据自己数据分析类型,选择对应的链接,例如是基因表达数据还是单细胞数据。
2、一般最常用的是基因表达,基因表达其实包括芯片和RNAseq,其实Bioconductor最早就是用来分析芯片数据的,因为R擅长处理矩阵,而芯片数据恰好就是“矩阵”。
3、我们以Gene Expression中第一个workflow为例,这个是利用Deseq2包来分析RNAseq数据的例子,点开之后其实是一遍文献,这是这种workflow另一个显著的特点,它本身是一篇文献,也是包含脚本数据和讲解的技术文档。
4、可以照着脚本文档介绍一步步进行操作,完成整个分析流程,文档非常详尽。
5、完成前面操作,第六步只需一条命令即可进行RNAseq差异表达基因的分析。
6、同样workflows中也包含很多数据可视化的案例。
7、同样也包含了基因注释部分,注释也是Bioconductor包三大分类中重要一项。
8、每个案例最后会给出本workflows所使用的工具以及版本,方面进行重复试验。顺便吐槽一下,使用Bioconductor一个讨厌的地方就是扩展包之间千丝万缕的联系。
Tips:为了提高效率,我们已经贴心的为大家下载好了所有的文档,聊天窗口中回复“Bioconductor”,即可获得下载链接。
---------- END ----------
欢迎订阅我们的微信公众号:基因学苑
网友评论