背景
昆虫起源于约4.8亿年前,是地球上最繁盛的动物类群,已被描述的种类超过100万,占所有动物种类的50%以上。这个古老的动物类群在发育、行为、社会性、生态等方面展现出极其丰富的多样性,是地球上最成功的动物类群。
讲到昆虫的遗传,一般认为是从父母中直系遗传得来,但许多微生物在与昆虫共生时,会悄悄将其基因传递给昆虫。这类跨物种的基因交流,即水平转移基因(HGT)常常被科学家忽视。
水平基因转移(HGT)是塑造原核和真核基因组的重要进化力量。HGT获得基因在昆虫中偶有报道,昆虫谱系包含大于50%的动物。研究人员系统地检查了218个不同昆虫高质量基因组中的HGT,发现它们通过来自非后生动物供体的741次不同转移获得了1,410个表现出不同功能的基因,其中包括许多以前没有报道过的基因。鳞翅目动物的HGT获得基因的平均数量最多。HGT获得的含有内含子的基因比缺乏内含子的基因表现出更高的表达水平,这表明内含子的增加可能与HGT适应有关。最后,研究人员使用CRISPR-Cas9系统编辑了一个的未报道基因LOC105383139,该基因被转移到飞蛾和蝴蝶的最后一个共同祖先中。在小菜蛾中,缺乏LOC105383139的雄性对雌性的求偶行为明显减少。由此研究人员得出结论,HGT是昆虫适应的主要贡献者。
那么昆虫如何获得“飞来”的外源基因?这些基因对昆虫生存具有什么样的影响?经过多年的研究,浙江大学农业与生物技术学院昆虫科学研究所最新的研究指出,昆虫基因组内存在大量的水平转移基因,并发现“飞来”的外源基因对昆虫求偶起到重要作用。
原名:HGT is widespread in insects and contributes to male courtship in lepidopterans
译名:HGT广泛存在于昆虫基因组中,并增强雄性昆虫求偶行为
期刊:Cell
IF:66.85
发表时间:2022年7月
通讯作者:沈星星、黄健华和 Antonis Rokas
通讯作者单位:浙江大学和范德堡大学(Vanderbilt University)
DOI号:10.1016/j.cell.2022.06.014
实验设计
image.png结果
1 大量水平基因转移到昆虫中
为了系统地识别昆虫中假定的HGT获得基因,研究人员从GenBank和Lepbase数据库中下载了218个公开可用的基因组。这218种昆虫的基因组代表了19个目中的11个(即,已确定超过1,000个种的目),其中包括包括蜉蝣目(2)、直翅目(1)、蜚蠊目(4)、缨翅目(2)、半翅目(19)、虱毛目(1)、膜翅目(68)、鞘翅目(19)、鳞翅目(39)、管翅目(1),和双翅目(62)。
研究人员使用稳健且保守的基于系统发育的方法来检查来自218个昆虫基因组中长度大于等于100kb的重叠群中存在的2,806,851个基因的蛋白质序列,以寻找HGT存在的证据。研究人员在192个昆虫基因组中发现了总共1,410个基因,这些基因可能是通过来自非后生动物来源的741个不同途径获得的(图1),其中包括包括来自细菌的1,115个(79.0%)基因,来自真菌的194个(13.8%)基因,来自植物的43个(3.0%)基因,来自病毒的36个(2.6%)基因,以及来自其他谱系的22个(1.6%)基因。
图1 | 1,410个假定的HGT获得基因在218种昆虫的最大似然系统发育中的分布。218种昆虫,代表11/19个种丰富的目(即描述的种超过1,000种的目)。系统发育是从对1,367个单拷贝BUSCO基因的分析中推断出的串联ML树。这1,410个推定的HGT获得基因可能是通过741个不同的HGT事件获得的,其中588个是物种特异性的,另外153个存在于两个或多个物种中。堆积条表示来自不同HGT供体资源的HGT获得基因的数量(红色:细菌,橙色:真菌,绿色:植物,蓝色:病毒,灰色:其他)。代表分类群的图像取自PhyloPic(http://phylopic.org)。为了衡量这1,410个HGT获得基因推断的可靠性,研究人员
首先, 使用Conterminatorv1.c74b5来检测是否发生污染,发现这1,410个HGT获得基因中没有一个被确定为潜在污染物。
其次,研究人员使用PCR和Sanger测序(参见STAR方法)检查了8/11目的代表性的16只昆虫的54个随机选择基因的恢复率。结果表明,16种测试昆虫的PCR成功率在33.3%和100%之间变化,平均值为83.3%(45/54个基因)(图2A)。
第三,研究人员将1,410个HGT获得基因列表与193个先前发表的基因列表进行了比较,发现了有164/193(85%)个HGT获得基因是重叠的。
第四,研究人员检查了包含1,410个HGT获得基因的928个基因组重叠群的序列长度分布以及不包含HGT获得基因的89,481个基因组重叠群的序列长度分布。研究人员发现含有HGT获得基因的重叠群通常比缺乏它们的重叠群长(图2B)。
第五,研究人员检查了928个重叠群中1,410个HGT获得基因的比例分布,发现928个重叠群中没有一个包含频率大于5%的HGT获得基因(图2C)。
最后,研究人员检查了昆虫受体中HGT获得基因与非后生动物供体中共1,410个HGT获得基因的最接近同源物之间的蛋白质序列相似性,发现其相似性值介于12%和89%之间,平均值为39%(图2D)。
总的来说,这些结果表明存在于长度为大于等于100kb的重叠群中的1,410个HGT获得基因的列表是可靠的。
图2 | HGT基因推断的可靠性。
(A)使用PCR和Sanger测序实验验证HGT获得的基因。由于昆虫基因组DNA的限制,在218种昆虫中验证所有1,410个HGT获得基因具有挑战性,检查了16个昆虫物种中的54个HGT获得基因,代表11个目中的8个。请注意,用于此分析的昆虫采样不均匀可能无法完全反映跨目HGT推断的准确性。对于54个HGT获得基因中的每一个,使用两个单独的PCR反应,然后对扩增子进行Sanger测序来验证昆虫基因组中HGT获得基因的存在(详见STAR法)。
(B)具有和不具有HGT获得基因的基因组重叠群的序列长度分布。较深的分布是包含1,410个HGT获得基因的928个重叠群的序列长度分布,而较浅的分布是不包含HGT获得基因的89,481个重叠群的序列长度分布。
(C)928个重叠群中每个包含1,410个推断的HGT获得基因的HGT获得基因的比例分布。
(D)昆虫受体基因组中的序列与其在非后生动物供体基因组中所有1,410个HGT获得基因的最接近的序列之间的蛋白质序列相似性分布。
在通过每个目包含的基因组数量评估1,410个HGT可获得基因时,研究人员发现鳞翅目获得的HGT获得基因平均数量最多(每个种16个基因),其次是半翅目(每个种13基因)、鞘翅目(每个种6个基因)、膜翅目(每个种3个基因)和双翅目(每个种2个基因)。从741个不同的HGT事件中,有588个是物种特异性的,而其余153个涉及两个或多个物种。在涉及两个或更多物种的153个不同的HGT事件中,分别在五个最大的目鳞翅目、双翅目、膜翅目、鞘翅目和半翅目中发现了63、20、15、12和8个。在检查基因组大小、基因含量、物种分化时间和基因组完整性时,研究人员发现HGT获得的基因数量与基因组大小、基因含量、物种分化时间和基因组完整性的相关性较低。
通过结合BLAST和系统发育学检查假定供体生物体的1,410个HGT获得基因,研究人员发现1,410个HGT获得基因可能来自670个假定的供体物种(细菌:533/670[80%],真菌:74/670[11%];植物:25/670[4%],病毒:29/670[4%],其他:9/670[1%])(图3A)。总体而言,除了常见的内共生细菌属Wolbachia(3%)外,细菌属Serratia(3%),Bacillus(2%),Pseudomonas(2%)和Paenibacillus(2%)也是普遍的供体生物(图3A)。
此外,一些HGT的供体是特定目。例如,真菌属 Exophiala 和 Encephalitozoon 分别是半翅目特异性和膜翅目特异性供体;细菌属的Streptomyces,Listeria和Erwinia分别是鞘翅目、鳞翅目的和双翅目的特异供体。
由于一些研究认为宿主昆虫共生体中的基因已水平传递到宿主昆虫基因组中,因此研究人员调查了假定的HGT供体生物与已知昆虫共生体之间的关联。具体来说,研究人员计算了SymGenDB中20种昆虫(来自7/11目)中每个HGT供体属的相对丰度以及每个已知共生体属的相对丰度。研究人员发现HGT供体属与已知昆虫共生属之间的相对丰度相关性显著(r=0.68,p value=7.6X10-9)(图3B)。当不考虑HGT受体昆虫和共生体的宿主昆虫之间的一对一对应关系时,这种强烈的相关性仍然存在。这些结果推断了宿主昆虫的共生体——尤其是Rickettsia和Wolbachia谱系中的共生体——可能参与外源基因向昆虫基因组的转变的可能性。
对1,410个HGT获得基因的基因本体(GO)分析表明,大多数与代谢和细胞相关术语有关(图3C)。除了先前报道的功能(例如,解毒、体色和防御),研究人员发现了多种功能,包括但不限于免疫、求偶行为、新陈代谢、营养、适应极端环境、生长和发育。研究人员在排名最靠前的五个顺序中发现了GO类别(BP,生物过程;CC,细胞成分;和MF,分子功能)的相似功能分布。
图3| 宿主昆虫的共生体可能参与了外来基因向昆虫基因组的转变。这1,410个外源基因可能是通过来自670个推定的HGT供体物种的741个不同的HGT事件水平获得的。
(A) 670个假定供体物种的分布。
(B) HGT供体物种与已知昆虫共生体之间的丰富关联。计算SymGenDB中20种昆虫(来自7/11目)中每个HGT供体属的相对丰度以及每个已知共生体属的相对丰度。皮尔逊相关系数用于检验这两个变量是否显着相关。
(C) 基因本体论(GO)术语分析研究中的1,410个HGT获得基因和先前研究中报告的193个HGT获得基因的生物学过程。
2 HGT获得基因中内含子的起源和昆虫HGT的适应
从1,410个HGT获得基因中,有849个包含1,534个长度大于等于100bp的内含子,而其余561个基因缺少内含子(图4A)。比较推定的HGT供体生物和它们的HGT昆虫受体基因之间的内含子表明,在将这些基因插入昆虫基因组后,获得了849个基因中存在的共1,534个内含子。具体而言,在1,410个HGT获得基因中,有519个基因在HGT供体生物和受体昆虫中不包含任何内含子(即没有内含子的增减);42个基因在HGT供体生物体中含有53个内含子,但在受体昆虫中没有保留它们(即内含子丢失);有849失去了245个内含子(损失是根据观察到HGT供体生物体的相应基因中存在245个内含子来推断的),但在基因转移后受体昆虫中获得了1,534个内含子(即内含子增益)(图4A)。由于HGT获得基因的鉴定是基于蛋白质序列,因此849个HGT获得基因中这1,534个获得的内含子的来源尚不清楚。为了解决这个问题,截至2022年4月20日,研究人员针对由NCBI的核苷酸(nt)数据库组成的自定义数据库,对内含子的DNA序列进行了BLASTN搜索,在218个昆虫基因组,设置e值为1e-5和“-task blastn-short”选项。研究人员发现1,013/1,534(66%)内含子有BLAST命中,平均同一性为86%,而521/1,534(34%)没有BLAST命中(图4B)。对1,013个内含子的最佳匹配的进一步分析表明,所有最佳匹配都来自它们的原生昆虫基因组。通过表征这1,013个从原生昆虫基因组中获得的内含子的特征,研究人员发现891/1,013(88%)个内含子是富含重复序列的DNA序列,包括DNA转座子(51.6%)、LTR转座子(25.8%)和未分类的重复序列(10.6%)(图4C)。通过对假定的供体和受体基因组中1,410个HGT获得基因以及所有天然昆虫基因的基因结构进行表征,研究人员发现昆虫中HGT获得基因的长度明显长于HGT供体物种中的对应基因,但它明显短于昆虫中的天然基因(平均而言,受体基因组中获得基因的长度:5.00kb,HGT供体基因组中转移基因的长度:1.54kb,受体基因组中天然基因的长度:12.27kb)(图4D)。与所有天然昆虫基因相比,假定的供体和受体基因组中的1,410个HGT获得基因具有相似的编码序列(CDS)长度(平均而言,受体基因组中外源基因中的CDS长度为1.45kb,转移基因中的CDS长度在HGT供体基因组中为1.45kb,受体基因组中天然基因中CDS的长度为1.46kb)(图4D)。相比之下,受体基因组中1,410个HGT获得基因的内含子长度明显长于假定的供体基因组,但明显短于天然基因中的内含子长度(平均而言,外源基因中的内含子长度在受体基因组中为3.55kb,HGT供体基因组中转移基因的内含子长度为0.09kb,受体基因组中天然基因的内含子长度为10.81kb)(图4D)。这种趋势可以通过内含子获得事件来解释(平均而言,受体昆虫中外源基因中的内含子数量:1.43,HGT供体物种中转移基因中的内含子数量:0.23,以及昆虫中天然基因中的内含子数量:5.05)(图4D)。
为了进一步探索内含子增益是否与HGT获得的基因对昆虫基因组的适应有关,研究人员进行了两次单独的分析。首先,检查了HGT获得基因的基因结构随进化时间的变化(图4E)。由于推断物种特异性HGT获得基因的进化分歧时间是不可行的,研究人员专注于存在于两种或更多昆虫物种中的822/1,410HGT获得基因。研究人员发现基因长度、内含子长度和内含子数量随着进化时间的推移明显增加,而CDS长度在进化时间中没有显著变化(图4E)。其次,使用90个可公开获得的转录组数据,比较了代表性的6/11目的32种昆虫的转录组数据集的HGT获得基因的表达水平,其中包含内含子和缺乏内含子的HGT获得基因。请注意,研究人员仅在每个转录组数据集中比较了具有和不具有内含子的HGT获得的基因(例如,仅使用来自同一阶段和给定物种的相同组织的转录组数据)。在32个昆虫数据集中,与缺乏内含子的HGT获得基因相比,26个(81.3%)的HGT可获得且含有内含子基因的基因表达水平平均高11倍,只有6个(18.7%)的HGT可获得且含有内含子基因的基因表达水平比缺乏内含子的HGT获得基因平均低4倍(图4F)。总的来说,研究结果表明,来自天然昆虫基因组的富含重复的内含子获得,这使得外源基因能够将它们的长度增加到天然基因的平均长度,这可能与昆虫基因组中HGT的适应有关。
图4 | 来自天然昆虫基因组的富含重复内含子的增益可能与昆虫中HGT的适应有关。
(A)将1,410个HGT获得的基因整合到昆虫基因组中后,849个获得了1,534个长度为R100bp的内含子(橙色);42个丢失了53个内含子(蓝色);和519没有内含子增益或损失(灰色)。
(B)1,534个获得内含子的起源。1,013个内含子与原生昆虫基因组中的序列高度相似(绿色),而其余521个内含子的序列与原生昆虫基因组没有相似性,很可能是从其他生物体中获得的(灰色)。
(C)从原生昆虫基因组中获得的1,013个内含子的转座因子(TE)组成。
(D)HGT供体中的转移基因(橙色)、受体物种中的外源基因(红色)和受体物种中的天然基因(绿色)之间的特征比较。左边三个方框分别对应基因长度、CDS长度和内含子长度。右框对应于每个基因的内含子数。
3 飞蛾和蝴蝶的最后一个共同祖先从 Listeria 菌属的供体中获得了一种增强雄性求偶行为的外来基因
研究人员评估了列表中常见的HGT获得基因 LOC105383139 的遗传功能,该基因是飞蛾和蝴蝶的最后一个共同祖先从 Listeria 菌属的供体中获得的(图5A)。该基因属于Pfam数据库和Alphafold2预测的锌结合醇脱氢酶家族,但对其在供体生物或受体昆虫中的功能知之甚少。LOC105383139的基因家族系统发育,包括几乎所有检查过的飞蛾和蝴蝶的基因序列,除了飞蛾Chilosuppressalis和蝴蝶Leptidea sinapis,还显示其中12个物种包含多拷贝同源物(例如Papilio machaon),而有25个物种仅包含一个单拷贝同源物(例如Plutella xylostella)。在搜索了所有37个公开可用的鳞翅目基因组后,研究人员发现只有六个飞蛾和两个蝴蝶基因组报告了性染色体。在所有的八个基因组中,研究人员发现基因LOC105383139位于常染色体而不是性染色体中。为了评估该基因的功能,研究人员使用CRISPR-Cas9系统在小菜蛾 Plutella xylostella (十字花科蔬菜的一种严重农业害虫)中使用两个sgRNA在第2代(G2)创建纯合突变体(MT-139)(图5B)。
在饲养小菜蛾期间,研究人员最初发现敲除(MT-139)蛾子的后代数量减少5到6倍,但与野生型(WT)飞蛾相比,五种发育表型没有显着差异,包括体型、摄食、运动、睾丸大小和精子活动。为了确定MT-139飞蛾后代数量减少的根本原因,研究人员首先测量了MT-139和WT飞蛾在48小时内产卵的数量。研究人员发现,15对基因敲除雄性(MT-139♂)+基因敲除雌性(MT-139♀)产生的卵子数量显著低于15对野生型雄性(WT♂)+野生型雌性(WT♀)(平均而言,MT-139:46个卵子和WT:101个卵子)(图5C)。然而,15只敲除基因且未交配的雌性(MT139-未交配雌性)产生的卵数与15只野生型未交配(WT-未交配雌性)产生的卵数相似(平均而言,MT-139-未交配雌性:28个卵子和WT-未交配雌性:25个卵子)(图5C)。接下来,研究人员在70小时内检查了从卵到孵化的四个发育阶段。研究发现,MT-139飞蛾的成功孵化率(图5D中的IV期)大大低于WT飞蛾的成功孵化率(MT-139:孵化卵率=9.5%和WT:孵化卵率=56%)。在MT-139飞蛾的未成功孵化的卵中,超过80%的卵在I期(无原肠胚形成)停留70小时(图5D),而在WT飞蛾中,只有35%的卵在I期停留70小时。值得注意的是,在检查的30对MT-139飞蛾中,有20对(66.7%)被发现所有卵都卡在I阶段(无原肠胚形成)。然而,在WT飞蛾中,只有4/26(15.4%)对的卵被卡在第一阶段。研究人员还检查了MT-139-雌性未交配和WT-雌性未交配产生的未受精卵的发育阶段。研究发现,MT-139-雌性未交配和WT-雌性未交配的所有未受精卵都完全卡在I阶段。这些结果表明,MT-139飞蛾卡在I期(无原肠胚形成)的卵子比例较高可能是由于MT-139飞蛾中未受精卵的比率较高(图5D)。通过进一步观察,研究人员发现MT-139飞蛾的交配率明显低于WT飞蛾。为了精确量化交配行为,研究人员分别评估了WT和MT-139飞蛾出生一天后在连续48小时的求爱指数和交配指数。求偶指数是在给定时间段内成功求偶的百分比,表现为雄性扑翼并倾斜腹部向雌性靠近。交配指数是雄性与雌性交配约1小时的成功交配对的百分比。研究人员使用了四种处理方法进行行为实验:WT♂+WT♀、WT♂+MT-139♀、MT-139♂+MT-139♀和MT-139♂+WT♀(每个处理使用24对1日龄雄蛾和雌蛾进行三次重复)(图5E和5F)。引人注目的是,研究人员发现MT-139♂对MT-139♀和WT♀的求偶尝试比例明显低于WT♂(平均求偶成果的百分比为:MT139♂+MT-139♀:46%;MT-139♂+WT♀:48%;WT♂+WT♀:86%;WT♂+MT-139♀:84%)(图5E)。此外,MT139♂与MT139♀和WT♀的交配百分比显著低于WT♂(平均配对成功的百分比为:MT-139♂+MT-139♀:13%;MT-139♂WT♀:10%;WT♂+WT♀:65%;和WT♂+MT-139♀:64%)(图5F)。
研究人员还利用公开获得的求偶数据和求偶情况下的转录组数据(眼睛和大脑),研究了基因LOC105383139在两种密切相关的蝴蝶(Heliconius melpomene和Heliconis cydno)中的作用。研究发现,H. melpomene雄性对雌性的求爱明显多于H. cydno雄性(平均五次试验中对雌性的求爱次数:H. melpomene:18,H. cydno:6)与H. cydno雄性相比,H. melpomene雄性的LOC105383139基因的表达水平高6.5倍(LOC105383139基因在5个雄性成虫体内的平均表达水平为:H. melpomene:每百万分之一的外显子模型每千碱基130次读取[RPKM];H. cydno:20RPKM)。进一步分析了15对成年鳞翅目昆虫的公开转录组数据,发现雄性鳞翅目鳞翅目昆虫的LOC105383139基因的表达水平也显著高于雌性鳞翅目昆虫(图5G)。总的来说,这些结果表明LOC105383139基因的功能之一是增强雄性求偶行为,而LOC105383139基因是蛾和蝴蝶通过HGT获得的最后一个共同祖先。
图 5 | 鳞翅目昆虫普遍存在的HGT获得基因 LOC105383139 增强雄性求偶行为。HGT获得基因LOC105383139属于锌结合醇脱氢酶的大蛋白家族,在本研究中几乎存在于所有飞蛾和蝴蝶中,飞蛾Chilo suppressalis和蝴蝶Leptidea sinapis除外。
(A)基因LOC105383139的简化基因家族系统发育。红色的树枝代表飞蛾和蝴蝶,而绿色的树枝代表细菌。
(B)使用带有两个sgRNA的CRISPR-Cas9系统在小菜蛾中编辑单拷贝基因LOC105383139生成纯合突变系(MT-139)的简化示意图。下面的框中给出了三个具有代表性的突变系。
(C)野生型雄性+野生型雌性(WT,n=15对)、基因敲除雄性+基因敲除雌性(MT-139,n=15对)、野生型未受精雌性(WT-未受精,n=15雌性)和基因敲除未受精(MT-139-未受精,n=15雌性)在48小时内产卵数量的比较。
那么问题来了,什么基因与雄性求偶相关的外来基因LOC105383139相互作用?研究人员首先量化了小菜蛾从卵到成虫的13个不同发育阶段的基因表达水平(参见STAR方法)。与15对公开获取的鳞翅目转录组数据结果(图5G)一致,qRT-PCR结果显示,雄性和雌性蛾的不同发育阶段相比,成年雄性的表达水平最高。此外,研究人员还检测了雄性飞蛾的五种组织(触角、头部、胸部、腹部和生殖系统)中外源基因LOC105383139的表达水平。有趣的是,研究人员发现外源基因在腹部和生殖系统中高表达,但在触角、头部和胸部中低表达。接下来,研究人员生成了1天龄的野生型雄性成虫(WT雄性)、野生型雌性成虫(WT雌性)、敲除雄性成虫(MT-139雄性)和敲除雌性成虫的全身转录组数据(MT-139雌性)。研究发现在MT-139雄性与WT雄性相比,有462个基因显著低表达,359个显著过表达。GO术语富集分析表明,在MT-139♂与WT♂比对分析中,462个低表达基因中的求偶行为、生殖过程、代谢过程、生物调节和对刺激的反应等生物过程显著富集,而发育过程、定位、代谢过程和免疫系统过程在359个过表达基因中显著富集。对MT-139_和WT_分析中462个低表达基因的生物学过程进行分析,确定了9个基因(FBgn0028572:quick-to-court,FBgn0003068:period,FBgn0000535:etherago-go,FBgn0263111:cacophony,FBgn0020277:lush,FBgn0011279:odorant-bindingprotein69a,FBgn0283510:peptidyl-a-hydroxyglycine-a-amidatinglyase1,FBgn0004573:5-hydroxytryptaminereceptor7,Drosophilamelanogaster中的FBgn0005626:tyrosine3-monooxygenase),上述基因可能与求爱行为有关(GO术语:0007619)。与此相反,在359个过表达基因中未发现与求爱相关的基因。这些结果表明,这9个与外源性基因LOC105383139相互作用的求偶相关基因以及其他可能的差异表达基因可能参与了雄蛾的求偶行为,但它们在小菜蛾中的作用值得进一步的实验研究。研究人员还对MT-139♀与WT♀的差异基因表达和GO术语富集进行了分析,并确定了348个显着低表达的基因和375个显著过表达的基因。然而,这些低表达/过度表达的基因主要参与代谢过程、发育过程、细胞过程、生物调节、运动、对刺激的反应和信号传导,但与雌虫的择偶行为(配偶认可和接受)和产卵均无显著关系。
结论
在这项研究中,218种昆虫的基因组代表了19个物种丰富的目(即,已确定超过1,000个种的目)中的11个,并且研究人员系统地推断出1410个基因通过741个不同的HGT事件转移到非后生动物(主要是细菌)来源的昆虫中。
1 HGT获得基因在昆虫中的分布情况如何 ?
许多先前的研究表明昆虫中存在HGT,但研究的分类单元抽样策略集中在少数感兴趣的昆虫或特定的昆虫目。迄今为止,McKenna等人对鞘翅目(甲虫)目中的HGT进行了全面调查,他们使用154个转录组或基因组专门研究了通过HGT从细菌和真菌中获得的10种植物细胞壁降解酶(PCWDEs)。尽管这些先前的研究对于确定HGT在昆虫中的发生和生态方面具有重要意义,但稀疏和零星的昆虫基因组采样阻碍了更好地理解HGT获得的基因在最大和最多样化,并且包含超过所有描述的动物50%——昆虫谱系中的分布。研究人员对1,410个HGT的系统鉴定表明,鳞翅目获得的HGT获得基因的平均数量最多(每个种16个基因),其次是半翅目(每个种13个基因)、鞘翅目(每个种6个基因)、膜翅目(每个种3个基因)和双翅目(每个种2个基因)(图1)。此外,对假定的HGT供体生物和已知的宿主昆虫共生体的检查表明,昆虫共生体中的基因很可能水平转移到宿主昆虫中(图3A和3B),这与之前的发现一致。
2 哪些因素有助于昆虫外源基因的适应?
总的来说,许多研究都同意HGT获得的基因参与了对受体基因组的适应,但对昆虫基因组中这些外源基因适应的因素的看法各不相同。例如,密码子的使用是决定转移基因命运的重要因素,因为需要与宿主的转移RNA(transferRNA,tRNA)库兼容。选择也被认为是细菌中HGT适应的主导力量,但对于大多数转移是否对受体有益、中性甚至有害,仍存在很多争议。此外,最近的一项研究认为,内含子在外源基因和天然基因之间的基因长度没有显著差异,在外源基因适应受体浮游植物基因组方面也没有发挥重要作用。在本研究中,研究人员发现849/1410个HGT获得基因含有富含重复序列的内含子,这些内含子可能是在初始基因转移后从天然昆虫基因组中获得的(图4A-4C)。此外,在分化时间背景下,HGT获得基因之间的基因结构比较表明,内含子增加事件发生在进化时间内,这使得这些外源基因的长度增加到了天然基因的平均长度(图4D和4E)。**更重要的是,含有内含子的HGT获得基因的表达水平显著高于缺少内含子的基因(图4F),这与之前在不同生物体(绿色微藻、植物和昆虫)中的研究一致,表明内含子增加可以提高基因表达水平。总的来说,研究结果表明,从天然昆虫基因组获得的富含重复序列的内含子可能参与了HGT对受体基因组的适应。
3 昆虫中外源基因的生物学功能是什么?
许多先前的研究已经报道了HGT获得基因对昆虫的重要性状有贡献的例子,由于非模式昆虫的基因组编辑的挑战,只有一些人构建了突变体来验证其功能。在这些先前报道的HGT中,有三个经过充分研究并表明转移基因可以具有生态多样性功能,包括体色、解毒和防御。在本研究中,1,410个由HGT获得的基因不仅包括大多数(~85%)先前报告的基因(包括前面引用的三个例子),并且还包括额外的多样化功能,包性但不限于新陈代谢、求偶行为、营养、适应极端环境、生长发育。在1,410个HGT获得基因列表中,最常见的基因LOC105383139被供体细菌属 Listeria 水平引入几乎所有飞蛾和蝴蝶中,本研究通过CRISPR-Cas9系统和一系列行为实验在小菜蛾Plutella xylostella中进行了验证。令人惊讶的是,研究人员发现缺乏 LOC105383139 基因的雄性小菜蛾向雌性小菜蛾求爱的次数明显减少,表现出交配行为水平的降低。在果蝇和家蚕交配行为的主控基因 fruitless 和doublesex已得到较好的研究,但之前没有一项研究报告称,外来基因也可能与求爱行为有关。**
综上所述,本研究结果提供了昆虫中HGT获得的基因资源。这个资源将使用者能够研究这些外来基因的功能,不仅在本研究的物种中,而且在其他昆虫中也是如此。此外,这些获得HGT基因昆虫的进化速度和方式也为昆虫生物科学、害虫防治和昆虫生物多样性提供了指导。
研究的不足之处
本研究表明,HGT在昆虫基因组中广泛存在,并且可能有助于昆虫适应。本研究也有一些局限性。首先,不同昆虫目之间不成比例的基因组采样可能会影响对目间HGT获得基因和HGT供体来源(例如共生体)数量估计的精确度。其次,尽管研究人员认为昆虫原生基因组的内含子增益可能与昆虫基因组中HGT的适应有关,但不能排除外来基因如何在昆虫基因组中进化的其他解释,例如在快速适应环境变化下的选择性约束。第三,小菜蛾中基因LOC105383139的破坏显著降低了雄性对雌性的求爱,但其在其他鳞翅目物种中的功能作用尚未通过基因组编辑技术得到验证。
二、水平转移基因适应进化成为昆虫基因组的成员
那么历经几亿年,这些外源基因在昆虫体内为何没有被清理掉,能够在昆虫基因组中扎根?
“我们发现水平转移基因伴随着昆虫适应性进化,它的基因结构和功能也随之变化,在进化过程中它们从受体昆虫基因组中获得了多次重复的内含子(intron),从而免于被昆虫清除掉,达到‘存活’在昆虫基因组上的目的。”沈星星说。内含子的获得,一方面使HGT基因的长度增加,达到其他昆虫自身基因的平均长度,另一方面使得HGT基因的表达水平上升,有利于更好地发挥它们的生物学功能。
三、揭示昆虫繁衍的新奥秘
这1410个水平转移基因,经过岁月的冲刷,在昆虫体内到底发挥了什么作用?于是对这些水平转移基因开展了功能分析和验证研究,取得了令人振奋的发现。
黄健华介绍:“我们选择小菜蛾进行基因编辑,一方面是因为小菜蛾是国际上蔬菜的重大害虫,对于甘蓝、白菜、油菜、西兰花等十字花科作物危害非常大,每年都造成巨大损失。另一方面,团队近二十年来一直开展小菜蛾的生物防治研究,在实验室内建立了纯合的小菜蛾野生型饲养体系,便于基因功能验证。”
研究人员首先对占比最高的水平转移基因包括LOC105383139(蛾类与蝴蝶均获得该外源基因)开展了系列功能研究。利用CRISPR-Cas9基因编辑技术获得了LOC105383139敲除的突变体,发现从李斯特菌Listeria中获得的水平转移基因LOC105383139对雄性小菜蛾成虫具有特殊作用。
研究人员惊奇地发现,相比较野生型小菜蛾,突变体小菜蛾后代数量减少了约70%,但是突变体小菜蛾的生长发育,如体长、取食、生殖器官等均未受到影响。那么什么原因导致突变体小菜蛾后代数量急剧减少的呢?研究人员通过行为学实验进一步验证,发现突变体小菜蛾雄虫对雌虫的求偶欲望显著地降低了,也就是说,一旦缺少这个基因,雄虫求偶能力就急剧下降。至此,本研究证实了HGT基因 LOC105383139 有助于增强雄虫对雌虫求偶行为,发现了细菌帮助昆虫求偶的“成人之美”新机制。这也是HGT基因影响动物求偶行为的首次报道。
对于这项研究的前景,沈星星介绍,从蛾类与蝴蝶HGT基因的研究中,我们发现了昆虫繁衍的“新钥匙”,这对未来重要农业害虫的绿色防控提供了新思路,这种导致昆虫后代数量急剧降低的机制,对于寻找害虫控制的新靶标和关键环节具有重要而深远的现实意义。
本研究还提供了高质量的昆虫HGT基因资源库,这些资源将有助于其他研究者开展昆虫水平转移基因的生物学功能研究。此外,本研究发现的HGT基因进化模式也为生物学、生物多样性等研究提供了重要的新视角。
原文链接:https://doi.org/10.1016/j.cell.2022.06.014
转自:
https://mp.weixin.qq.com/s/PZCaHvt8xE79uUik4RKwoA
https://mp.weixin.qq.com/s/DMAgJa5A2qBsOSWDUrPeKQ
https://mp.weixin.qq.com/s/MpK926QS22fRBKF_ahzb1g
网友评论