SNP通常联合基因表达进行分析
SNP主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多
- 1 、下载SNP数据
- 2、寻找突变频率最高的基因
- 3、接着根据突变进行分类,分为野生型和突变型
- 4、看野生型和突变型的基因表达是否有差异
- 5、看野生型和突变型的生存是否有差异
SNP(single nucleotide polymorphism),单核苷酸多态性,在基因组上由单个核苷酸变异形成的遗传标记,一般指变异频率大于1%的单核苷酸变异。
用英文的描述方法是这样的“If more than 1% of a population does not carry the same nucleotide at a specific position in the DNA sequence, then this variation can be classified as a SNP.”,值得注意的一个词是“population”同英文文章中对样本表述的“array”,指的是在一大群个体中出现大于1%个体中基因组DNA上某个特定位点碱基较参考基因组发生变化,则认为是一个SNP。
SNP发生的类型
SNP发生包括转换、颠换、插入和缺失,理论上每个位点都可以有4种形式的变异,但是实际上发生的只有转换和颠换两种,据说发生转换和颠换频率是2:1
A 腺嘌呤
G 鸟嘌呤
T 胸腺嘧啶
C 胞嘧啶
转换
[一种能量形式变成另外一种能量形式],主要发生在CG序列,由于CG(可以联想一下研究DNA甲基化常谈到的CpG岛)中的C碱基常发生甲基化(mC),可自发脱氨形成胸腺嘧啶(T),即常常发生的转化是C to T。补充一点帮助大家记忆哈,脱氨基是不是伴随能量的变化,跟转换的基本概念完美衔接。
颠换
异型碱基的置换,一个嘌呤被另外一个嘧啶替换或一个嘧啶被另外一个嘌呤置换
SNP(singlenucleotide polymorphism),单核苷酸多态性,在基因组上由单个核苷酸变异形成的遗传标记,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富,一般指变异频率大于1%的单核苷酸变异。在人类基因组中大概每1000 个碱基就有一个SNP ,人类基因组上的SNP 总量大概是3 ×10^6 个。因此,SNP成为第三代遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。
SNP发生的位置
一句话概括,SNP可以发生基因组的任何位置,基因编码区/基因非编码区/基因间区等,关系如下:
image.png发生在编码区
先补充一个概念:密码子简并性
(氨基酸对应三联密码子),所以发生SNP不一定会引起编码氨基酸的改变,
这就引入了Synonymous SNP
(同义突变,不引起任何变化) 和Non-Synonymous SNP
(非同义突变,大家关注的焦点)概念。
错义突变:编码的某种氨基酸的密码子变成另一种氨基酸密码子,从而多肽链的氨基酸种类和序列发生改变,错义突变通常会使多肽链丧失原有功能。
无义突变:编码某一氨基酸的密码子变成UAA、UGA或UAG(终止密码子),导致多肽链翻译的中止,从而形成一条不完整的多肽链。
发生在基因非编码区或基因间区
可能会影响转录因子与DNA结合、影响非编码RNA序列、影响基因的剪接、mRNA的降解等。
受到单核苷酸多态性(SNP)影响的基因表达被称为单核苷酸多态性表达(ESNP)。
三个碱基组成一个密码子,翻译成一个氨基酸,碱基的变异可导致不同种类的氨基酸的变化,比如:
一个氨基酸变成另一份氨基酸:错义突变(missense)
一个氨基酸变成终止密码子:无义突变(nonsense)
虽然碱基发生变化,但是编码的氨基酸没有变化:同义突变(silent)
注意这里的中英文对应关系哦,尤其是nonsense和silent。
移码突变(Frame shift)
-
移码突变为一种特殊形式的del/ins,但是在描述的时候,不能列出缺失的那一部分的位置和氨基酸。
-
突变后的第一个氨基酸未必对应DNA水平的突变碱基。
网友评论