IUPAC (International Union of Pure and Applied Chemistry) 核苷酸代码是一种用于表示核苷酸序列中所有可能碱基的标准化表示方法。这些代码不仅包括四种标准碱基 (A, C, G, T/U),还包括一些特殊符号,用于表示多个可能的碱基。以下是 IUPAC 核苷酸代码及其含义:
- A (Adenine)
- C (Cytosine)
- G (Guanine)
- T (Thymine) - 用于 DNA
- U (Uracil) - 用于 RNA
特殊符号:
- R (puRine) - A 或 G
- Y (pYrimidine) - C, T 或 U
- M (aMino) - A 或 C
- K (Keto) - G, T 或 U
- S (Strong) - C 或 G (三键氢键)
- W (Weak) - A 或 T (两键氢键)
- H (not G) - A, C 或 T
- B (not A) - C, G 或 T
- V (not T) - A, C 或 G
- D (not C) - A, G 或 T
- N (aNy) - A, C, G 或 T
使用这些代码可以更精确地表示核苷酸序列,特别是在存在未知或不确定碱基的情况下。例如,序列 "ACGTURYSWKMBDHVN" 表示一个包含所有可能碱基的核苷酸序列。
网友评论