不知不觉已经过去了四周,这个系列的开篇语写于2017年10月14日,距离今天差不多是一个月的时间了。这个月的时间学的内容并不算多,大致也就是如下几个内容:
- *nux基础: 这个尤为重要,学会了*nix(Linux或unix)之后,如果能够在日常科研生活中进行使用,那么你的效率将会大大提高。
- 数据格式: 数据的保存具有一定的格式,处理数据的前提在于知己知彼,这样才能选择合适的工具。这个部分内容包括知道什么是本体论,fasta和fastq长什么样子。
- 数据库: 一个优秀的数据库提供了分析所需的必要条件,想想如果没有NCBI这些数据库,分析将会多么困难。
这些内容都特别基础,当然越是基础的东西可能越是重要,我遇到的大部分问题都可以归结为基础不扎实。当然从下一周开始,我们将会接触数据分析的第一步,质量控制。
质量控制重要程度在目前看来可能没有那么高,因为现在测序仪器的精确度上升后,大部分测序错误都被避免了。但是质量控制可能不只是判断碱基的质量。我们可能还要考虑实验的重复性等问题。下一周我们负责学习的内容是第8章和第9章。任务是:
- 目前常用的测序仪及其测序原理
- 二代,三代或者四代测序仪的优缺点是什么
- 质量控制一般需要哪几步
- FastQC的结果如何解读
- 使用multiQC聚合fastqc的输出结果
- (额外任务)质量控制除了检查碱基质量以外,还有那些类别
后续部分是第四周的笔记汇总
网友评论