美文网首页
菌虫共生真菌测序

菌虫共生真菌测序

作者: 周小钊 | 来源:发表于2020-08-09 16:40 被阅读0次

    最近做的地衣共生没有什么头绪,找到的文献都是宏基因组相关,无奈,只好找了菌虫共生菌的基因组分析作为借鉴,看看能不能从中发掘出有用的方法。

    这篇文献2020年5月发表在ASM上,主要对Sirex noctilio的真菌共生体Amylostereum areolatum进行基因组测序分析,与我进行的工作类似。

    摘要

    Amylostereum areolatum是一种全球入侵物种-欧亚树蜂(Sirex noctilio)的共生真菌,这种互惠共生关系与木蜂有关,可协助其昆虫伙伴的破坏过程,并为其提供营养。A. areolatum的定植和生长对S.noctilio的发育和传播有重要影响,但两者之间相互作用的机制尚不清楚。在这项研究中,对这种共生真菌的第一个基因组进行了测序、组装和注释。首次组装了A.areolatum基因组为57.5 Mb (54.51% GC含量),有15611个蛋白编码基因。鉴定了580个碳水化合物活性酶(CAZymes), 661个基因与病原-宿主相互作用,以及318个基因编码转运蛋白。基因组注释揭示了10种萜类/植物烯合成酶,可分为三个亚类。第二类萜烯合成酶基因簇在整个红菇(Russulales)中保存良好。在这个簇中,编码甲羟戊酸激酶(MK)、EGR12(COG1557)和非植物萜环化酶(CD00687)的基因是已知的生物合成和调控基因。通过对该真菌基因组序列的分析,从分子水平上证明了A.areolatum挥发物对S.noctilio寄主选择的影响。进一步阐明了A. areolatum是一种严格的专性共生真菌。蜂在通过产卵将其引入合适的寄主基质前对其进行保护,同时为S.noctilio幼虫的生长提供适宜的环境和营养。

    Sirex noctilio与一种共生真菌A.areolatum一起,对世界各地的松树物种造成了严重的危害。在我国,它导致蒙古松大面积死亡。木蜂与其真菌之间存在一定的依赖互惠关系。研究表明,真菌的生长速度会影响黄蜂的体型:较大的成虫会出现在真菌生长速度较高的地方。通过对该真菌的基因组序列分析,证明了A.areolatum挥发物在分子上影响S. noctilio寄主选择的可能性。进一步阐明了A. areolatum是一种严格的专性共生真菌,为S. noctilio幼虫的生长提供了适宜的环境和营养物质。这些结果将为我们理解这种菌虫共生的机理奠定基础。

    引言

    木蜂与真菌共生体间存在着严格的专性依赖互惠共生关系。S. noctilio有一个专门的器官来储存共生真菌,贮菌器(mycangium)。首先,在真菌被引入合适的宿主基质之前,贮菌器可以保护真菌。 在产卵期间,雌性木蜂通过产卵器将其共生真菌和植物毒毒液黏液与卵接种到寄主树中。当成虫出现时,真菌从蛹腔壁被吸进囊膜。通过这种方式,雌性收集虫室中产生的虫卵,传播并接种到新树中。反过来,这种真菌也对S. noctilio的发育乃至繁殖潜力至关重要。A.areolatum感染并干燥木材基质,为虫卵和幼虫提供更适合的微环境。此外,共生真菌的纤维素,半纤维素和果胶的降解酶含量较多也可能是S. noctilio对幼虫至关重要的一环。S. noctilio的发育及其繁殖潜力与共生真菌的活力密切相关。研究表明,S. noctilio幼虫在三龄或四龄时都以A.areolatum提供的降解物为食,然后以白色腐烂的木材为食。真菌的生长速度影响了S. noctilio的体型大小;较大的成虫出现在真菌生长率较高的地方。碳水化合物活性酶(CAZymes)和毒力相关基因在真菌定植和生长中起着重要作用。白腐真菌能有效地降解木质纤维素生物质,特别是从植物中提取的木质纤维素。许多已被研究的毒力相关基因被发现与操纵植物防御促进真菌感染有关。这些基因在防御机制、信号转导、碳水化合物运输和代谢、细胞内运输、分泌和囊泡运输等方面发挥重要作用。

    ​ 挥发性成分在吸引雌胡蜂到植物寄主的过程中起着重要的作用。先前的研究表明S. noctilioA.areolatum的挥发性成分的反应比对受袭树木的反应更强。这些真菌挥发物也能吸引S. noctilio到受A.areolatum感染的寄主那里。对A.areolatum及其他蒙古松内生真菌的挥发性有机化合物(VOCs)进行了分析,发现倍半萜类化合物对已交配的S. noctilio有吸引力,但对未交配的S. noctilio无吸引力。虽然萜类化合物可能在木蜂的空间聚集中发挥重要作用,但迄今为止在A. areolatum中尚未发现萜类生物合成酶,而且基因组测序方法是通过识别参与次生代谢物活性的基因来发现萜类化合物生物合成途径的常用方法。

    ​ 在本研究中,作者完成了A.areolatum的基因组测序,分析了碳水化合物酶、毒力基因和次生代谢基因。这些发现将有助于解释这样一个假设,即在的S. noctilio生命周期中,有一种酶起着至关重要的作用,例如通过降解植物细胞壁为夜蛾幼虫的定殖和生长提供营养,以及通过产生倍半萜类化合物来吸引雌虫产卵。本研究结果为更好地了解S. noctilioA. areolatum之间的互利共生机制奠定了基础。

    Sirex系统的最新见解。(a):对与S. noctilio交配和寄主位置有关的视觉和嗅觉线索的研究证实了新出现的个体具有强烈的趋光反应,并确定了推测的信息素,这两者都有助于树冠上方观察到的交配群。这一认识,再加上植物挥发物(kairomone)诱饵的优化,将使研究人员能够开发出更有效的监测工具。(b) S. noctilio种群中抗性的可能进化或真菌种群毒性降低的进化会导致S. noctilio和菌株之间的不相容性,因此并非所有的卵都被真菌寄生。(c) 通过松树寄主与其他S. noctilio或真菌有性繁殖来实现水平及因转移。(d)Amylostereum areolatum分解木材中的木质素和纤维素,释放出碳水化合物,这些碳水化合物作为液体从木材中挤压出来,并被发育中的幼虫摄取。细菌有助于纤维素的消化,很可能为幼虫固定氮。(e) 氮对真菌也有限制,但可以通过细菌或线虫寄生获得。这种寄生可能会影响树木中的线虫数量。(f)幼虫在化蛹期离开真菌定殖区。

    结果

    基因组特征

    二代测序(illumina)与三代测序(PacBio)相结合,经过质量控制,得到HiSeq数据6839 Mb (118 coverage)和PacBio数据4314 Mb (74 coverage)。

    重复原件与转座酶

    ​ 除了编码蛋白质的基因序列外,真菌基因组的一个重要部分是重复元件。在A. areolatum基因组中,鉴定了14,513,406 bp(基因组序列的25.21%)的重复元件。串联重复序列占1.1%,转座因子(transposable elements, TEs)占24.11%。在TEs中,I类元素和II类元素(DNA) TEs分别占基因组的15.50%和1.36%。未知和其他重复元素占8.17%。长末端重复序列(LTRs)是I类TEs中最丰富的(占总基因组序列的14.79%),包括Copia、Gypsy和BEL/Pao逆转录转座子超家族。

    种系发生(Phylogeny)

    利用Orthofinder鉴定出56374个基因簇,其中913个为所有真菌共有的基因。从这些共享的基因簇中,选择41个单拷贝基因,分析A.areolatum与其他82个伞菌纲的参考基因组的进化关系。最大似然(ML)分析在高支持率(70%)的情况下,确定了15种主要真菌分支的进化关系。 系统发育分析表明,该菌与其它红菇属植物群聚在一起,与植物病原真菌松果体菌(Peniophora sp.CONT)关系密切。

    碳水化合物酶

    A. areolatum基因组中,鉴定出580种CAZymes,包括219种糖苷水解酶(GHs)、67种糖基转移酶(GTs)、16种多糖裂解酶(PL)、60种碳水化合物酯酶(CE)、58种碳水化合物结合模块(CBM)和160种具有辅助活性的酶(AAs)。与传统真菌相比,A. areolatum含有更多的CAZymes,与森林病原菌(forest pathogens)类似。

    A.areolatum基因组中,编码GHs和AAs的基因比其他蛋白类型多。45个GH基因家族中GH3(15拷贝)、GH5(18拷贝)和GH18(16拷贝)的数量尤其丰富。此外,还发现2个GH6和8个GH7成员与结晶纤维素的降解有关。AA家族的分类显示,多数AAs AA3家族的成员(62拷贝),包括亚科纤维二糖脱氢酶(EC 1.1.99.18),葡萄糖氧化酶1 (EC 1.1.3.4)、芳基醇氧化酶(EC 1.1.3.7)、酒精氧化酶(EC 1.1.3.13)和吡喃糖氧化酶(EC 1.1.3.10)。

    推测的毒性相关基因

    ​ 总共有661个与病原体-宿主相互作用(PHI)相关的预测A. areolatum基因。毒力降低所占比例最高(45.39%),其次是未受影响的致病性(23.45%)、失去致病性(10.14%)、致死(9.23%)、混合结果(8.47%)、化学目标(1.21%)、毒力增加(高毒力)(1.66%)和效应器(植物无毒性决定因素)(0.45%)。此外,我们还注释了47个已报道为致病菌毒力因子(VFs)的基因(致病菌毒力因子[毒力因子数据库VFDB])。根据这些基因在其他寄主物种的发病机制中所起的作用,这些基因可能是A. areolatum假定致病性因子。此外,还鉴定了A. areolatum中83个家族318种转运蛋白。在这些转运蛋白中,37个基因编码MFS蛋白,18个基因编码ATP结合盒蛋白;其他科中编码蛋白的基因较少。

    倍半萜烯合酶集群

    ​ AntiSMASH分析表明 A. areolatum次生代谢物基因的数量和类型与报道的其它红菇属植物相似,后者携带19个次生代谢基因簇,包括编码8个萜烯/植物烯合成酶的基因簇,2个非核糖体肽合成酶(NRPS),1个I型聚酮合酶(T1PKS)、一个铁载体合成酶和七个未知基因簇。值得一提的是,鉴定出的萜烯/植物烯合酶基因簇数量最多。这些酶可能参与了萜类化合物的生物合成,尽管还需要进一步的研究来确定这一点。

    为了阐明萜烯生物合成簇的保守性和多样性结构,从83个伞菌纲基因组中获得了两个包含5个倍半萜合成酶(STS)基因的同源群。A. areolatum基因组含有10个萜烯合成酶基因,与伞菌纲中这类酶的数量一致。系统发育树是利用三种合成酶(Cop3、Cop4和Cop5)的同源序列构建的,这三种合成酶是在A. areolatum基因组中鉴定出来的。萜合成酶基因与Cop-STS基因分为三大类,表明每个簇中的酶可能通过保守的环化途径产生相关的萜类化合物。

    在真菌中,次生代谢产物生物合成基因通常位于相邻的簇中。有趣的是,第二类萜烯合成酶基因簇在整个红菇中保存得很好。A.areolatumS. hirsutumH. irregulare 之间的共线性表明,参与萜类化合物合成的基因具有良好的共线性,这表明红菇可能共享与萜烯代谢相关的保守核心基因。保守的基因簇包括甲羟戊酸激酶(MK)、EGR12(COG1557)、非植物萜烯环化酶(cd00687)、烯醇辅酶A(enoyl-CoA)水合酶/异构酶和P激酶,其中一些基因已被证实与甲羟戊酸途径(合成萜类的途径之一)有关。除了参与倍半萜代谢的核心萜烯环化酶外,倍半萜簇中还存在ABC转运体ATP结合蛋白(CL0023)和P450(PF00067)。这些酶可能在氧化和羟基化等修饰以及倍半萜的运输中发挥作用。

    讨论

    一般基因组特征和系统发育

    A. areolatum基因组组装约为53mb,相当于红菇相关成员的组装体大小,从26mb到122mb不等。A. areolatum基因组包含15611个编码基因。系统进化树表明,在进化上,A. areolatum与植物病原真菌Peniophora sp.CONT的进化关系较近。

    与降解植物细胞壁和角质层相关的蛋白家族

    毒液和真菌共生体的存在会导致寄主的弱化和树脂压力的下降,为S.noctilio的卵孵化和幼虫发育提供了更为适宜的微环境。此外,S.noctilio的行为和形态适应表明,S.noctilio幼虫不摄取木质部,而是利用A.areolatum对难降解的木质纤维素化合物进行外部消化。A. areolatum能分泌大量的纤维素酶、半纤维素和木质素酶,能有效降解植物细胞壁成分,提供营养物质(如葡萄糖、甘露糖、半乳糖、醋酸、木糖等)因此,A. areolatum的成功定殖和生长对其发育起着至关重要的作用。真菌的解聚能力与其分泌一系列酶的能力成正比。在分析中,A. areolatum的胞浆酶数量与森林病原菌相当,并且显著高于传统腐生蘑菇,这表明A. areolatum能够突破植物细胞壁,以类似于其他森林病原菌的方式成功建立感染。它可以通过破坏植物细胞的结构来削弱松树,并为S.noctilio幼虫的生长提供营养。

    植物细胞壁含有丰富的纤维素。GHs是降解纤维素、半纤维素和淀粉的常见酶。它们参与碳水化合物分子之间或内部糖苷键的水解。共有219个GHs被分为45个家系。编码GH3和GH5类酶的基因数量超过了编码其他GH酶的基因。这与树木腐烂真菌(白色、棕色和软腐真菌)GHs的组成特征相似。此外,真菌基因组中发现了丰富的GH18基因编码,这些基因催化几丁质的分解。几丁质酶能降解真菌细胞壁,抑制孢子萌发、菌丝生长、芽管伸长等发育活动。因此,推测GH18可能对其它内生真菌如麦冬菌和球毛壳菌在蒙古松上的拮抗作用起了一定的作用。在CAZy数据库中,90%的木质纤维素降解真菌含有编码裂解多糖单加氧酶(LPMOs)的基因。这些酶主要参与非碳水化合物结构组分(木质素)的解聚,或作为植物的主要细胞壁成分被发现(34,39)。在本研究中,我们分别检测到62个和25个AA3和AA1拷贝。AA3家族(GMC氧化还原酶/脱氢酶)主要存在于森林病原菌中,如S. hirsutum(48个AA3基因)和Heterobasidion annosum(32个AA3基因)。AA3家族包含氧化还原酶的甘糖醇-胆碱(GMC)家族中的酶,该家族通过其反应产物协助其他AA家族酶的活性或支持糖苷水解酶在木质纤维素降解中的作用。它们通过产生过氧化氢和回收聚合物氧化攻击所需的电子给体和受体,促进木质纤维素的分解。

    ​ Laccase另一种重要的木质素降解酶,属于AA1家族。在真菌中Laccase有不同的角色,如介导真菌病原体和宿主植物之间的相互作用,大量的AA3和AA1基因导致松树的氧化降解,使A. areolatum具有强烈穿透植物细胞壁和降解木质素的能力。这不仅有利于真菌的定植和生长,也为S.noctilio幼虫提供了营养。

    毒力相关基因

    病原体-宿主相互作用数据库(PHI-base)收录了来自真菌、细菌和原生病原体的2800多个基因,并通过实验验证了致病性、毒性和效应基因。这些基因表达的失活或减少可以降低或消除致病能力。在对PHI-base数据库检索得到的所有预测基因中,与毒性降低、未受影响的致病性和致病性丧失相关的基因是最常见的。生理学实验表明,单独接种A. areolatum并不会显著降低树势,也不会影响树木的生长。本研究所描述的A.areolatum毒力相关基因的特征有助于解释这一现象。致死基因的缺失或低表达会导致真菌无法存活。基因组中只有9.23%的致死基因。这可能是因为A.areolatum是一种典型的共生真菌;在将其引入合适的宿主基质之前,S.noctilio会保护真菌。

    在真菌转运蛋白中,ATP结合盒(ABC)转运蛋白和主要促进因子超家族(MFS)是最大的两个超家族。ABC转运蛋白是多组分的,主要是活性转运蛋白,在ATP水解条件下,它既能运输小分子,也能运输大分子。它们能运输多种化合物,如多糖、药物、糖、重金属、寡肽、氨基酸和无机离子。研究表明,在所有测序真菌中,S.pombe只含有19个ABC蛋白,这可能接近自由生命有机体的最小值。A. areolatum中ABC蛋白的含量比S.pombe少,而且更显著的是,它缺乏ABC-D转运体,而ABC-D转运体在所有测序物种中都有发现,除了Encephalitozoon cuniculiS.pombe。从真菌中提取的ABC蛋白只有少数已被功能性鉴定,而ABC-D转运蛋白的缺乏还需要进一步的研究。

    A. areolatum含有大量的糖类酶基因,但毒力和转运基因较少。这与它们的共生关系是一致的;A. areolatum通过分泌胞外酶为S.noctilio幼虫的生长提供营养,而S.noctilio通过将真菌带到一个特殊的器官——贮菌器中,保护和转移真菌,然后将其引入一个新的合适的寄主基质。

    倍半萜烯合酶集群

    ​ 研究表明,与寄主植物相比,交配后的雌性S.noctilioA. areolatum挥发性成分更具吸引力;倍半萜类化合物可能在这一过程中发挥作用。对红菇属真菌的序列分析表明,倍半萜合成酶同源基因在这些真菌中广泛存在。然而,尽管倍半萜合成酶同系物在真菌中占优势,但对其活性和生物学功能知之甚少。在大肠杆菌表达载体上克隆和鉴定了灰曲霉的倍半萜合成酶,结果表明在Cop3培养基中产生了muurolene、elemene、muurolene、germacrene D和cadinene。在Cop4培养物中检测到了Cadinene、cubebene、sativene、copaene和cubebol。因此推测,同样的化合物也出现在A. areolatum的挥发性成分中。

    材料和方法

    基因组组装

    利用Illumina序列进行k-mer分析,并对PacBio组装进行校正。为了得到高质量的装配,使用GATK 对序列错误进行了修正。然后,使用SSPACE_Basic 工具将contigs合并成scaffolds,使用PBJELLY 封闭间隙。最后,基于成对序列相似度搜索,应用冗余管道来识别和去除杂合的contigs和scaffolds。利用BUSCO 和来自真菌谱系的数据集对候选assembly进行了评估。

    基因预测与注释

    ​ 结合从头预测和基于转录体的预测方法对编码蛋白的基因进行预测。初步预测采用SNAP、Augustus和GeneMark ES 进行编码基因预测。然后,使用Tophat 将转录组测序(RNA-Seq)数据(未发表)映射到assembly上,使用Cufflinks将转录组组装到基因模型上。最后,利用循证emodeler (EVM)将上述方法预测的所有基因模型组合成一个非冗余的基因结构集合。使用tRNAscan-SE 检测tRNA区域和二级结构。使用RNAmmer软件分析小rna,使用Infernal对Rfam数据库进行搜索,预测小rna (sRNAs)。预测的基因模型通过BLASTp搜索、Swiss-Prot、TrEMBL、Orthologous、GO和KEGG进行功能注释。

    转座因子和串联重复序列的鉴定

    本研究采用序列比对预测法和从头预测法来评估A. areolatum基因组中的TEs。对于序列比对预测方法,使用RepeatMasker,使用数据库Repbase搜索TEs。优化的默认参数与-lib选项一起使用以查找重复项,-species真菌选项用于单独的分析以查找真菌重复。RepeatProteinMasker和与RepeatMasker相关的转座子蛋白文库也被用来鉴定TEs。从头预测方法,利用buildXDFDatabase生成扩展数据库格式(XDF)。然后,使用RepeatModeler和XDF数据库建立TE模型,然后使用RepeatMasker对TE进行预测。串联重复序列用RepeatMasker进行评估。

    系统发育分析

    ​ 从NCBI数据库以FASTA格式下载79种蘑菇菌种的基因组序列(见补充材料表S4)。利用正交法获得了真菌基因组中的一组同源基因(系统进化保守)。我们选择41个单拷贝同源基因构建系统发育树。使用MAFFT进行序列比对,使用Gblocks提取并连接保守位点。我们运行ProtTest以选择最合适的模型,并使用RAxML构建ML基因树,其中-f a -x 12345 -p 12345 -m PROTGAMMAILGF -N 1000 选项。使用Wallemia sebi蛋白序列作为外组

    碳水化合物酶分析

    ​ 利用BLAST对A. areolatum和其他10种真菌中的CAZymes进行鉴定和注释,并使用dbCAN注释程序HMMER对CAZy数据库进行搜索。当E值小于1e05时,将结果进行汇总。II类过氧化物酶和DyPs通过BLAST在过氧基数据库中的搜索得到了进一步证实。

    毒力相关基因预测

    候选毒力相关基因在A. areolatum基因组中使用BLASTp来搜索PHI-base。对蛋白进行比对,以确定在A. areolatum中可能存在的毒力相关基因,其识别率超过40%,查询覆盖率超过70%。毒力因子(VFs)检索使用BLAST比对毒力因子数据库。运输分类数据库(TCDB)包含序列,分类,和结构,功能,和进化信息的运输系统从各种分类。基于转运体分类数据库的搜索,以E值阈值1e-05和识别值为40%确定了A. areolatum中的候选转运体。利用MAFFT对蘑菇真菌ABC转运蛋白进行序列比对,利用FastTree构建系统发育树

    次生代谢基因预测

    利用AntiSMASH对A.areolatumS.hirsutumPeniophora sp. CONT和H. irregulare的次级代谢生物合成基因和基因簇进行了预测。在两个同源类群中获得83个伞菌纲基因组的假定真菌萜烯合酶序列。还包括五个在C.cinereus中发现的倍半萜合酶同源物(分别命名为Cop1和Cop5)。在构建系统发育树时,要手动检查比对以排除注释错误的序列(例如,序列似乎太短或太长)。在MAFFT中对902个萜烯合成酶基因进行序列比对,利用FastTree构建系统发育树。


    转载请注明周小钊的博客>>菌虫共生真菌测序

    相关文章

      网友评论

          本文标题:菌虫共生真菌测序

          本文链接:https://www.haomeiwen.com/subject/ltmkrktx.html