本文是《生物信息学中的数据挖掘方法及应用》第一章的简单学习和整理。
全书介绍见:https://mp.weixin.qq.com/s/Anp_rlbo47qzPYy5BinbnQ
生物信息学的研究对象:基因组数据、蛋白质组数据、基因表达数据。我只选择了基因表达数据部分。
主要了解一些芯片背后的理论知识。
1.关于“调控”
基因:能够转录翻译成蛋白质的DNA片段,占基因组总数的不足2%。
基因间区域:控制基因表达的变化--“调控”,是基因组参与的最复杂的过程之一。
搞清楚不同状态下的基因表达水平,是了解基因调控的重要途径。
2.基因表达水平检测技术
(1)检测蛋白的丰度--尚且存在一些问题,非普遍方法。
(2)检测mRNA的丰度,间接测定基因表达水平,这是芯片的理论基础。
3.基因芯片
(1)分类
cDNA芯片、寡核苷酸芯片
二者的不同点:
cDNA芯片:实验室制备、双色杂交、最终测量值为相对值,一个基因只对应一个长探针。
寡核苷酸芯片:工业化生产、单色杂交、最终测量值为绝对值,一个基因对应多个探针。
(2)制备过程
①首先在特定条件下培养细胞,收集和提取细胞中的 mRNA 样本,并为其做标记,一般情况下使用荧光标记;
②准备基因芯片,芯片上会有高密度的序列特异性探针;
③样本与芯片探针杂交;
④洗去非特异性 mRNA 的结合;
⑤根据标记信号测量 mRNA 丰度 。
网友评论