想学生信原理但是数学不好?不想看一串串公式也想明白各种分析的原理?StatQuest会是一个非常不错的选择!
StatQuest: 该系列视频是北卡罗来纳大学教堂山分校制作的(相当牛的学校了)。视频长度不长,基本上都是十几分钟,而且语速也不快,如果还是觉得有困难可以调整语速或打开字幕,一般6级过了的人基本上都没什么问题。视频链接都是youtube上的(可能需要fq?)。这是我看过的最好的视频系列(没有之一),主要是因为他把非常难懂的东西,用很简单的例子让你明白。这是很不容易的(说“人话”,适合初学者看)。有的视频看一遍就可以完全理解了,有的视频(比如某个算法的例子)看两遍也能理解个90%以上了。之前因为对于生信的原理没有关注,这个系列的视频可以作为很好的入门教程来看。
“墙裂”推荐!!
这个系列的笔记我不打算用截屏+翻译这样的方式来记录了,因为视频里展示的PPT很多都是动画,如果截屏的话要上百张的图片,有点本末倒置了。我认为如果想学,就要自己亲自去看一遍视频(视频又不长,十几分钟就当消遣了,还练习了英语)。
推荐视频:
以下推荐的视频都是我亲自看过的,而且最好按顺序观看,因为都是在前一个视频的基础上进行讲解的:
(1)初学者不理解RNA-seq测序到底是怎么测的?看文献也找不到头绪?读综述太抽象?这个视频讲解的非常简单明了:
StatQuest: A gentle introduction to RNA-seq
(2)是不是不太理解为什么RNA-seq里生物学重复比技术重复更重要?你知道生物学重复/技术重复/mix重复对结果的影响吗?下面这个视频用了很简单的例子来解释了这个困惑:
StatQuest: RNA-seq - the problem with technical replicates
(3)你也许知道RPKM, FPKM, TPM都是什么,但是你知道其中的计算过程吗?也许你知道哪一个方法更好,但是你知道背后的原因么?这里你只需10分钟的时间就可以弄明白:
StatQuest: RPKM, FPKM and TPM, Clearly Explained!!!
(4)edgeR是一个很常用的RNA-seq分析软件,但是你知道它是怎么进行normalization的吗?你知道edgeR是如何计算scaling factor的吗?可能很多教程里会用一大堆公式来说明,但是如果你数学不好(像我一样),估计看都看不下去。可是你又想了解一下怎么办?看视频:
StatQuest: edgeR, part 1, Library Normalization
(5)同样的,DESeq2你肯定不陌生,但是你知道它是怎么normalize你的counts吗?不用看很多很长的公式,你也可以理解其中的原理(这个视频看一遍可能会跟不上,看个两三遍就能明白了~):
StatQuest: DESeq2, part 1, Library Normalization
(6)在我们分析RNA-seq或其他的测序数据过程里,经常会看到p-value这个值。我们通常还会利用p-value挑选变化显著的基因,比如p-value<0.05或者p-value<0.01。但是当你说p<0.05/p<0.01代表变化很显著的时候,你知道它真正的意思是什么吗?一个10分钟的小视频为你解释p-value到底是什么:
StatQuest: p-values: What they are and how to interpret them
(7)知道了p-value代表的真正含义以后,你知道p-value分几种吗?它是怎么被计算出来的呢?你知道p-value由哪几个部分组成吗?
StatQuest: How to calculate p-values
(8)学习了p-value以后,这有一个新名词(不新了,只是我不知道而已。。。),叫p-hacking。你了解什么是p-hacking吗?知道它是怎么产生的吗?p-hacking在我们的实验分析中是很不好的,那么如何避免它?
StatQuest: p-hacking: What it is and how to avoid it!
(9)上面学习了p-hacking以后,如何能减少假阳性的存在呢(事实不显著,但是p<0.05)?FDR可以帮助我们做这件事情。
StatQuest: False Discovery Rates, FDR, clearly explained
以上的视频笔记,我是用OneNote记录的,以下就是笔记内容,有的视频我只记录了一两句话,有的视频我就记录的多一些。想系统学习的同学还需要自己去看视频。毕竟每人的知识点掌握的不一样,我的查漏补缺不一定适合每个人。
网友评论