美文网首页
基因组数据分析-随笔

基因组数据分析-随笔

作者: 生信石头 | 来源:发表于2018-12-20 13:42 被阅读227次

写在前面

机缘巧合,近段时间参与了基因组组装与分析相关工作。大体了解了这一过程之后,才慢慢明白。这些分析,消耗脑力,也消耗体力,与此同时还有期望与耐心。
无论如何,项目总归是一个项目,完成一个项目,可能并不是为了完成项目,而主要还是了解这类项目的处理逻辑。更重要的,应是一些分析经验和思维。

经验影响了数据敏感度

慢慢地,我倾向于向生信数据分析的下游发展(关于生信分析的上下游,见之前的推文)。下游分析,极大地依赖于分析人员对生物学问题的认知。或许,这些才是生物信息学区别于IT或者其他信息学的地方。
在过去的一年多,可以非常明显地发现几种状态:

  1. 只有数据,没有信息(也就是完全不懂分析)
  2. 只有结果,没有故事(也就是,能跑跑软件,看得懂结果却猜不到生物学问题)
  3. 只有猜测,没有实证(看着一个结果,猜了各种各样的故事,却没有一个亮点)

当然还有更多状态,但对于我个人,目前来说,主要处于2和3。
我们会做出不少结果,却不一定能从结果中看出分析是否有问题,或者挖掘出生物学问题。前两天在博士课题组的支持下,到福建农观看大佬们的讨论,立马感受到,项目经验之重要,敏锐的感觉来自于实践与思考
累计经验方式,可能是处理尽可能多的数据,完成尽可能多的项目

失之毫厘,谬以千里

在验证一个猜测的时候,我与小庭子做了一些分析。遇到这么一个软件,其文档要求上一步骤的操作,必须限制阈值。而我忘记了。
从某个角度来说,相信用户上一步操作一定正确,那么就会引发更多的使用问题。使用了没有阈值限制的输入,我们得到了一个惊人的(预期结果之一)结果
在小庭子的提示下,做了另外一个补充分析(此时我又加上了阈值),结果符合预期。
设想,如果不做这个补充分析,那么或许,我们就会选择一开始的结果。最终做更多的(白费力气)的分析。
所以,总的来说,

  1. 软件的参数很重要
  2. 软件的输入,还是要尽可能地按照软件的说明来

写在后面

忘了

相关文章

  • 使用anvi'o 进行微生物pangenomics泛基因

    1.数据下载 2.数据解压 2.泛基因组数据库的构建 泛基因组分析 后面还可以对其泛基因组功能进行分析,感兴趣的大...

  • [Metagenome-1] Metagenomic Data

    宏基因组数据分析 宏基因组,和metataxonomics(16s rRNA analysis),是使用全基因组测...

  • GATK分析

    从零开始完整学习全基因组测序(WGS)数据分析:第1节 测序技术 从零开始完整学习全基因组测序(WGS)数据分析:...

  • 人类全基因组基本分析

    参考生信技能树直播我的基因组中的分析,学习人类全基因组基本分析流程 1、数据准备 1.1 练习数据下载 学习所用的...

  • 分析流程

    基因组重测序数据目的:需要检测基因组中的变异,找到并定位这些突变位点 条件:参考基因组、重测序数据、 分析流程: ...

  • 基因组数据分析-随笔

    写在前面 机缘巧合,近段时间参与了基因组组装与分析相关工作。大体了解了这一过程之后,才慢慢明白。这些分析,消耗脑力...

  • 为什么宏基因组数据分析比较难?

    生物数据分析包括很多种类,比如人基因组,植物,动物,微生物,还有RNA,单细胞RNA等等,其中宏基因组数据分析是比...

  • 全基因组分析实践(参考:碱基矿工)

    参考:碱基矿工从零开始完整学习全基因组测序数据分析:第4节 构建WGS主流程GATK4.0和全基因组数据分析实践(...

  • 生信分析常用基因组数据库汇总

    【原创】生信分析常用基因组数据库汇总 一、综合性基因组数据库 1、NCBIAssembly 目前最常用的综...

  • GWAS流程知多少-Hail

    Hail是一个用于可扩展数据探索和分析的开源库,特别是基因组学,为各种规模的基因组分析提供强劲支持,云原生的基因组...

网友评论

      本文标题:基因组数据分析-随笔

      本文链接:https://www.haomeiwen.com/subject/xpnskqtx.html