LULU和NANA的CCR5基因图谱和氨基酸序列已经流传出来,大家畅所欲言,讨论得很热烈。我想做一个小结,敬请斧正,说得不对的地方,还望方家海涵。
先要说明,基因测序和氨基酸序列图谱中,CCR5Δ32没有注明是谁的。根据逻辑推理,我默认是LULU的。从氨基酸序列图来看,有五个序列,从上到下依次为野生型、LULU、CCR5Δ32、NANA、NANA。推测CCR5Δ32属于LULU。因为一个人有两个等位基因,NANA的两个已经明确,LULU的一个已经明确,因此CCR5Δ32可以默认为LULU的,对吧?图右下角有图例,涂蓝的是跨膜,折线为二硫键,涂红为LULU和NANA的氨基酸序列与野生型不同之处,可是只有三处。涂黑是CCR5Δ32和NANA的氨基酸序列与野生型不同之处,可是图中并没有任何地方涂黑,我估计是忘记涂黑了。应该把CCR5Δ32涂黑。可是NANA的不同之处就三个了,不合逻辑,因此CCR5Δ32理应属于LULU。
第一,两个婴儿的基因型:
①LULU
LULU 的两个等位基因,一个切除了32个碱基对,位置见图1。另一个切除15个碱基对,位置见图1。图中文字是我添加的。
图1这样,LULU 的基因型可以记作CCR5Δ32/Δ15;
②NANA
NANA的两个等位基因,一个切除了4个碱基对,位置见图1。另一个插入一个碱基对,位置见图1、图2。
图2这样,NANA的基因型可以记作CCR5Δ4/+1。
第二,两个婴儿的氨基酸序列:
图3是CCR5野生型跨膜蛋白和两个婴儿的CCR5跨膜蛋白的氨基酸序列。
图3第一小行:野生型;
野生型CCR5蛋白质是一个由352个氨基酸残基组成的7次跨膜蛋白,其相对分子质量约为38700道尔顿。
第二小行:LULU(默认) CCR5Δ15的氨基酸序列
CCG5Δ15是在第180个密码子之后删除了15个碱基。
由于每一个遗传密码子都是三个核苷酸组成(三联碱基),删除15个核苷酸,恰好是3的整数倍,因此,CCR5Δ15后面的核苷酸序列保持不变,其表达的氨基酸序列也不变。因此,这个序列的蛋白质比野生型只少5个氨基酸残基,其相对分子质量约为38200道尔顿。
第三小行:LULU CCR5Δ32的氨基酸序列
CCG5Δ32是在第185个密码子之后删除了32个碱基。
由于每一个遗传密码子都是三个核苷酸组成,删除32个碱基,不是3的整数倍,等于删除了10个三联碱基后还剩2个碱基,这样,后面的密码子都得重排。但是,在93个碱基(表达31个氨基酸残基)之后,恰好出现了终止密码子,提前结束表达。
CCR5Δ32蛋白质,其氨基酸残基比野生型少(352-185-31=136)个,有216个氨基酸残基,其相对分子质量约为23800道尔顿。比野生型少了很多。
第四小行:NANA CCR5+1的氨基酸序列
NANA 的CCR5+1是185个密码子后插入了一个碱基对(A-T),图2中用小写字母表示的。插入属于移码突变。移码突变将带来重大的影响。我们知道,每一个密码子都是三联碱基,不论你在任何位置插入一个(或者碱基数除以3余数为1或2)碱基,后面的密码子都变了。具体到NANA的密码子,在第185密码子之后,经过33个碱基(表达11个氨基酸残基)之后,剩下的部分恰好跟CCR5Δ32剩下的序列重合。
NANA 的CCR5+1蛋白质有227个氨基酸残基,其相对分子质量约为25000道尔顿。
第五小行:NANA CCR5Δ4的氨基酸序列
NANA 的CCR5Δ4基因是在第185个密码子+2个碱基对之后,删除4个碱基对。由于每个密码子都是三联碱基,删除4个碱基对,等于一个密码子+1个碱基对,这样第185个密码子之后的密码子就要重排了。重排的结果是,在30个碱基(表达10个氨基酸残基)之后,出现了终止密码子TAA。RNA在执行表达任务时,遇到TAA、TAG、TGA就会停下来。核基因的遗传密码,共有64个,其中61个可以编码氨基酸残基,3个终止密码子。现在遇到TAA了,蛋白质表达到此结束。就算NANA 的CCR5Δ4基因还有一长串核苷酸,也等于“莫须有”,成为无用的核苷酸片段。见图4。
图4这样算下来,NANA 的CCR5Δ4蛋白质只有195个氨基酸残基,其相对分子质量约为21500道尔顿,只有野生型的55%。
综上,LULU和NANA的CCR5基因型都是突变型,其中有3个是缺失型移码突变,1个是插入型移码突变。LULU 的等位基因是CCR5Δ32/Δ15,NANA的等位基因是CCR5Δ4/+1。如果我们区分具体的突变,野生型和4种突变型可以视为5个复等位基因,那么LULU和NANA两位婴儿都是突变杂合子。我们现在不知道CCR5Δ32和CCR5Δ15或者CCR5Δ4和CCR5+1哪个是显性基因,哪个是隐性基因,但是我们可以肯定,不管哪个是显性基因,其表现型都是残缺不全的CCR5跨膜蛋白。不过,CCR5Δ15跟野生型较为接近,CCR5Δ32、Δ4和+1跟野生型差距较大,残缺得很厉害。四个突变的位置是在同一个膜段。
或者,如果我们是以野生型为比较基准,那么两位婴儿又都可以视为突变型纯合子。总之是不会有野生型的表达产物了。只能得到残缺不全的蛋白质。
CCR5蛋白是一个7次跨膜蛋白,跨膜蛋白,要想正确表达功能,需要一二三四级结构全部正确无误才可以。跨膜蛋白是一个构象异构体,可以根据信号改变构象实现通道的开合,特异病毒只能跟特异的构象结合,否则是不能通过跨膜蛋白进入细胞膜内,攻击细胞核的。
贺建奎副教授的基因编辑目标就是得到残缺的CCR5跨膜蛋白,破坏HIV等病毒的辅助受体,使“LULU和NANA”获得免疫力。另外,CCR5蛋白残缺还有其他很多好处。拥有野生型CCR5蛋白反而可以视为一种准遗传病。现在两个婴儿的CCR5跨膜蛋白果然都是残缺的,应该说初步完成了任务。
网友评论