文章名称:Impacts of allopolyploidization and structural variation on intraspecific diversification inBrassica rapa
发表时间:2021年5月
发表单位:中国农业科学院蔬菜花卉研究所等
发表期刊:Genome Biology
影响因子:10.8
一、研究背景
白菜(AA, 2n=20)是主要的经济作物,它是芸薹属重要的种,是“禹氏三角”的基础组成之一(A亚基因组)。
构建白菜泛基因组不仅能够获得白菜种丰富的基因信息,同时可以鉴定白菜基因组存在的广泛的遗传变异。
异源多倍化是物种形成和分化动力之一,异源多倍化会产生的亚基因组往往表现出亚基因组优势,而亚基因组优势反映了不同亚基因组的同源基因偏好性丢失和表达优势。白菜经历了多次基因组加倍,产生了3套亚基因,而亚基因组间同源基因非对称选择使种内产生分化,造就了白菜多样性的形态。
SV对植物的进化与性状变异有着重要影响,但目前针对白菜多样性形态与SV关系的研究尚未报道。
二、技术路线
三、材料方法
1、样本选择
16个不同生态类型的白菜用于泛基因组构建(BRO,CCA, CCB, CXA,CXB, MIZ, OIA, OIB, OIC, PCA, PCB, TCA, TUA, TUE, TBA和WTC);
144个白菜品系用于重测序(结合之前数据,共524个样品)。
2、测序
基因组组装:三代Pacbio Sequel平台(平均25x),二代illumine(90x),Hi-C文库;
群体重测序BGI平台。
3、分析内容
基因组组装,SV检测(基于基因组),群体SV检测(基于重测序),图形泛基因组,祖先基因组构建,选择性清楚分析,等等。
四、主要结果
1、16个代表性白菜基因组组装
16个品种分为6种形态,分别为大白菜、芜菁、油用白菜、苔菜、日本沙拉菜、小白菜;
16个品种单独de novo组装,基因组大小在337–466 Mb,contig N50 在0.25–1.41 Mb,其中12个品种使用hi-c测序挂载染色体,剩余4个利用reference-guided共线性分析挂载染色体;
16个基因组检测到44,207–47,602个基因,重复序列43.59–53.51%,重复序列和基因组大小成正相关(R =0.99, P = 3.8 e−16);
以Chiifu为ref,其他17个与Chiifu之间共线性的比例存在差异(表1);
以上结果说明,不同形态的白菜之间在基因含量、共线性、染色体结构上存在差异。
2、白菜泛基因组构建
白菜泛基因组包含47,107个基因,与单个基因组基因数相差不多,说明不同白菜品种基因组成比较接近;
基因家族分类(图b、c)
核心基因:18个基因组都包含;
次核心:80%以上基因组包含;
非必需:2-14个基因组包含;
特有:只在1个基因组包含;
基因表达显示,核心基因的表达水平高于非必需基因(图e);
核心基因的CDS长度和数量高于其他类型基因(图f、g);
LTR-RT更多出现在非必需基因中,说明TE促进白菜种内多样性的变异(图h)。
3、泛基因组分析揭示白菜种内的大量SV
使用全基因组7900个单拷贝直系同源基因构建了18个品种的进化树(图a),而后作者使用单条染色体分别构建进化树,结果显示与全基因组的并不完全相同,说明种内多样性的复杂进化历史;
基于524个样品的重测序数据构建的进化树,发现18个品种分布在不同形态的白菜分支中(图b);
以Chiifu为ref,其他17个基因组比对鉴定SV,得到33.24–56.7Mb的insertions和35.75–58.84Mb的deletions;
对SV分析显示,SV富集在基因组重复区域(图e),随着基因组个数的增加,SV的数量逐渐增加至呈现饱和趋势(图f);
利用hi-c数据鉴定到4个大片段的倒位(图g)。
4、共线性基因的灵活性与不同白菜基因组的分化有关
白菜基因组经历了多次染色体多倍化和基因丢失,使白菜基因组中包含3套亚基因组,因此作者试图分析白菜种内分化过程中由多倍化产生的基因的进化过程;
作者将在拟南芥和16-18个泛基因组样品中都存在同源基因,称为保守共线性基因(CSG),而在拟南芥和2-15个基因组存在同源基因,称为灵活共线性基因(FSG),FSG可能与白菜种内分化相关;
在18个不同的基因组中,FSG平均占基因总数的13.42%;
FSG中非同义/同义突变SNP的比例、含大效应突变位点的基因、积累的SV以及LTR-RT数量都显著高于CSG(图b、c)。
5、白菜种内分化过程中基因的灵活性扩大了LF亚基因组的优势
白菜基因组进化过程中多次基因组加倍事件和基因丢失,最终形成的基因组包含3个亚基因组LF、MF1、MF2,作者分析发现FSG的平均比例在LF中显著低于MF1和MF2(图e),而在18个基因组中FGS的频率要高于另外2个亚基因组(图d),说明白菜种内分化过程中偏好性基因灵活性的连续影响;
在18个基因组中FSG的比例在多拷贝基因集中显著高于单拷贝和两拷贝基因集,说明在种内分化过程中多拷贝基因更有灵活性;
种内分化过程中,多拷贝基因有着较高的灵活性(图g)。
6、推测的白菜祖先基因组为系统调查种内分化提供新的见解
作者将18个基因组的基因merge到一起,重构了白菜的祖先基因组,发现LF中的基因数和基因密度均高于MF1、MF2,说明LF亚基因组处于优势地位;
比较Chiifu和祖先基因组,发现单个基因组中LF、MF1、MF2中的基因密度显著低于祖先基因组(图a),说明在种内分化过程中大量基因丢失;
亚基因组比较显示,Chiifu中LF中丢失基因的密度低于MF1、MF2(图b),说明在种内分化过程中LF基因丢失较少;
作者重构了十字花科的祖先基因组和白菜、甘蓝祖先基因组,发现LF作为优势亚基因组保留了更多基因,而且LF亚基因组有较低比例的基因丢失。
7、SV变异与白菜种内分化
基于18个基因组比对获得的SV,构建白菜的图形泛基因组(以Chiifu为ref);
524个样品重测序数据与图形基因组比对call sv,获得57877个高质量SV;
根据形态将白菜分为不同的组,通过组间比较,鉴定到1064个SV与结球性状相关,19个SV与小白菜驯化相关,172个SV与芜菁驯化相关,说明SV与不同形态的驯化相关;
作者鉴定到在BrPIN3.3中279bp的缺失影响叶球性状的驯化,作者通过以下6种方法验证基因的真实性:
基因内变异标记在结球和不结球群体中的分布差异性(图bcd)
基因侧翼SNP在结球和不结球群体中呈现不同的单体型(图a)
基因处在结球与不结球群体选择清除区域(图f)
拟南芥同源基因分析
基因在结球和不结球个体中的表达量分析
在更大的结球和不结球群体中扩增基因内的deletion,查看有无此变异
参考文献:
Xu Cai,Lichun Chang,Tingting Zhang,et al.Impacts of allopolyploidization and structural variation on intraspecific diversification in Brassica rapa.Genome Biology.(2021)22:166
网友评论