用静息状态功能性磁共振成像测量的大脑静息状态网络(RSNs)的激活振幅是可遗传的,并且与基因相关,表明了多效性。最近的单变量全基因组关联研究(GWASs)探索了RSNs活性个体变异的遗传基础。然而,单变量基因组分析并不能描述RSNs的多变量特性。在这项研究中,研究者使用了一种新的多变量方法,称为基因组结构方程模型,来模拟捕RSNs共享基因组影响的潜在因素,并确定单核苷酸多态性(SNPs)和驱动这种多效性的基因。利用GWAS对英国生物银行报道的21个RSNs (N=31,688)的汇总统计,首先在一个发现样本(N=21,081)中进行基因组潜在因子分析,然后在同一个队列的独立样本(N=10,607)中进行测试。研究表明,RSNs的遗传组织可以由两个不同但相关的遗传因素最好地解释,它们划分了多模态关联网络和感觉网络。17个因素负荷中的11个在独立样本中重复。通过多元GWAS,研究者发现并复制了9个与RSNs联合结构相关的独立SNPs。此外,通过将发现的样本和复制的样本相结合,研究者发现了额外的SNP和与RSN幅值这两个因素相关的基因。研究认为,以多变量的方式模拟遗传对大脑功能的影响是了解更多涉及大脑功能的生物机制的有力途径。
1. 简介
在目前的研究中,研究者调查了大脑中多个RSNs的共同遗传病因。研究者使用GWAS汇总统计英国生物库提供的大脑中21个RSNs的振幅。研究者的方法是在报告的发现样本(N=21,081),对同一队列的独立样本进行了复制(复制样本:N=10,607)。然后在发现样本和复制样本中所有可用个体的GWASs上重复相同的方法,即BIG40样本(N=31,688)。首先,研究者评估了选定的RSNs的SNP 遗传性,并使用基因组SEM对可遗传的RSNs进行了共享遗传结构建模。接下来,研究者进行了多变量GWASs来表征与这些多因子相关的SNP。通过对BIG40样本顶部GWAS位点的功能注释和使用功能映射与注释(FUMA)工具和MAGMA的全基因和基因集分析。最后,研究者还测试了新发现的基因组因子是否与神经精神病学和身体特征存在遗传相关性。
2. 结果
2.1 RSNs的基于SNP的可遗传性
研究者获得了10个多模态关联和11个感觉RSNs(图1和S1,表S1和S2)在发现和BIG40样本中测量的BOLD振幅的GWAS汇总统计,分别为21081和31688个成年个体。对于BIG40样本,所有21个RSNs的振幅的h2SNP为假发现率(FDR)-corrected显著。因此,研究者保留了所有21个RSNs,用于后续BIG40样品的分析。遗传力估计在0.05 - 0.17之间,多模态关联网络显示的平均h2SNP高于感觉网络(平均h2SNP分别为0.11和0.07)。在发现的样本中,21个RSN振幅中有19个显示了显著的基于SNP的遗传力,而参与二次视觉加工的两个感官网络(SN2 3)具有非显著h2SNP估计。因此,这两个网络被排除在后续的发现和复制样本分析之外。
图1 多模态关联和感官网络的SNP遗传力结果
2.2 RSNs之间的基因相关性
为了检验遗传RSN振幅之间是否存在共有的遗传病因,研究者使用连锁不平衡回归分析计算遗传相关性。图2显示了BIG40样本中21个可遗传RSNs之间的210对遗传相关,其中57对bonferroni水平显著,在不考虑多重比较的情况下,有67人达到了名义显著性。Bonferroni和名义上显著的遗传相关主要是阳性的(124个中有121个,从0.19到0.90)。
图2 可遗传RSN振幅的遗传相关矩阵
2.3 基因组结构方程模型
为了描述可遗传RSNs之间的共同潜在遗传病因,研究者使用基因组SEM衍生出潜在的基因组因子。在发现样本的基础上,通过探索性因子分析(EFA)选择最优模型EFA结果总结在图3中,显示双因素模型解释了55%的方差,比单因素模型多16%的方差,而添加第三个因素并不能解释更多的方差。这些结果表明,最优的模型代表这些RSNs之间的多效性由两个因素组成。
在发现样本中采用验证性因子分析(CFA)检验模型的拟合性,在复制样本中再次检验相同的模型(N=10,607)。对于发现样本,结果被组织为两组:(a) EFA检索的模型报告的拟合估计;(b)在排除不显著因素负荷后拟合校正模型的估计.通过比较发现样本中,两组之间的卡方和赤池信息准则(AIC)统计量,研究者观察到,从模型中剔除不显著的因素会导致两组统计量的检索值都更低,从而改善了模型拟合。此外,通过在研究者的复制样本上测试这个模型,研究者观察到复制样本甚至比发现样本更好。通过发现和复制CFA检索到的因子加载结果显示,根据名义显著性报告了复制样本(其中5个在Bonferroni校正后也显著)。
在发现样品上进行基因组SEM方法,然后在BIG40样品上重复。与发现样本(SN2-3)相比,尽管包括了两个额外的RSN,但BIG40样本上的EFA导致了相同的最佳因子数量(见图3),其中双因素模型解释了53%的方差,比单因素模型的方差多14%。随后的CFA结果如表2所示,通过排除不显著因素负荷对模型进行了校正,从而改善了模型拟合估计。在图4中,研究者展示了修正的双因素模型的路径图,其中,模型中保留的18个RSN振幅中的多效性由两个不同但相关的因素表示,其中第一个因素(F1)包括所有10个多模态关联网络(MA1-10)和两个感觉网络(SN4和SN10);而第二个因素(F2)包括6个感觉网络(SN2,SN5-9)。这些结果与发现样本中17个RSN振幅获得的基因组SEM结果高度相似。其中不包括SN2,因为基SNP的遗传力不显著。在表S9-S11中,研究者包括导致图4中结果的因素负荷的标称和bonferroni校正的pvalues。为了完整性,研究者还报告了单因素模型的结果,它也有一个合理的拟合,在表S12-S18中的每一步。
图3 探索性因子分析总结
图4 BIG40样本的双因素模型示意图
2.4 多变量GWAS结果
研究者使用两个潜在遗传因子的多变量GWASs来估计SNP驱动RSN多效性的效应。在发现样本和BIG40中,F1和F2均表现出显著的SNP遗传力。
在发现的样本中,包括3个基因组位点的142个SNP显示了与F1的全基因组显著相关。表3显示了142个SNP关联的9个独立的全基因组显著SNP的结果。研究者发现,所有9个SNP关联均以其名义显著性被复制,在复制样本的多变量GWAS中。如果研究者采用更严格的bonferroni-ccorrection来计算独立基因组-广泛显著SNP的数量,那么所有9个SNP关联都将保持复制。对F2,发现样本没有SNP达到基因组水平显著性。
2.5 top GWAS位点的功能特征
研究者通过FUMA对基因组位点进行功能注释和基因定位来解释研究者的多变量GWAS结果。除了已报道的与BIG40样本F1相关的489个全基因组显著性SNPs外,FUMA分析还发现了159个与这些全基因组显著性SNPs存在连锁不平衡(LD)的其他SNPs,使648个候选SNPs分布在7个基因组位点上(见表4)。通过对这些候选SNPs的功能注释,研究者使用位置表达定量性状位点(eQTL),和染色质相互作用图谱,如表S19-S21所报道。对于F2, FUMA在LD中鉴定了另外3个具有21个全基因组显著SNP的SNP,共得到24个SNP,用于13个基因的定位(表S22和S23)。表S24和S25包含了来自GWAS目录的研究列表,报告了映射到这些基因组位点的全基因组重要SNP.
2.6 全基因和基因集结果
为了研究研究者的多变量SNP关联是否以生物学上有意义的方式聚集,研究者使用MAGMA对F1和F2进行了全基因和基因集关联分析。在BIG40样本中,研究者发现了与F1相关的14个基因组显著性基因(图5):FHL5、UFL1、PLCE1、NOC3L、IFITM3、ANO1、EPN2、B9D1、MAPK7、AC007952.5、GRAP、GRAPL、APOE和APOC1。没有基因组与F1显著相关(表S26)。对于F2,研究者发现ANO1有一个基因范围的关联,但没有显著的基因集(表S27)。此外,研究者通过MAGMA组织表达谱分析研究了与F1和F2相关的基因是否在30种普通人类组织类型和53种更特异的组织类型中富集。F1和F2基因未发现明显的富集(图S4和5).
图5 用BIG40样本对MAGMA潜在因子F1和F2进行了Manhattan图分析
2.7 神经精神病学和生理特征的遗传相关性
为了检验两个多变量RSN因子之间的共享遗传效应,研究者使用BIG40样本和10个预先选择的神经精神和生理特征,使用GWAS汇总统计进行遗传相关性分析。遗传相关结果见图6。
图6 一般脑功能与神经精神和身体健康特征的遗传相关矩阵比较。使用BIG40样本估计两个遗传因子(F1和F2)与10个神经精神和身体特征的遗传相关性:注意缺陷多动障碍(ADHD)、自闭症谱系障碍(ASD)、双相情感障碍(BIP)、重度抑郁障碍(MDD)、精神分裂症、阿尔茨海默病(AD)、身高、体重指数(BMI)、舒张压(DBP)和骨密度。
3. 讨论
研究者研究了横跨大脑的21个RSNs的脑功能多效性的基因组基础。研究者发现两个潜在的遗传因素最好地捕捉了基因组对整个大脑RSN振幅的影响,在一个独立的样本中复制了11个RSN振幅关联。第一个因子与多模态关联网络和两种感觉网络有关;第二个因素只代表感觉网络。进一步,研究者发现第一个因素与SNP和基因相关,这对研究者理解大脑功能的分子基础有影响。研究者的基因组因子分析指出了多模态关联和感觉功能的遗传分化。这一区别与之前使用功能连接度量和RSN振幅表型分析。参与感觉和多模态关联功能的大脑区域也被发现在细胞结构特性上存在差异。例如,感觉皮层区域比高级关联区域。此外,感觉和多模态关联区域表现出不同的基因表达模式。结合研究者的发现,这两个因素之间基因和大脑差异的大量证据可能潜在地反映了它们各自大脑区域之间成熟时期的已知差异。此外,与其他灵长类物种相比,在进化过程中,人类在多模态关联网络中表现出更明显的皮层扩张,而在感觉网络中表现出更明显的皮层扩张。因此,感觉和多模态大脑网络之间的差异已经在从神经发育到神经生理学到进化的各个生物学学科中得到了一致的证明。根据研究者的发现,研究者认为感觉和多模态关联系统之间的这种差异也可能由常见遗传变异在RSNs的BOLD振幅中的部分显著影响表现出来。随着基因组、大脑及其中间生物学(如表观基因组或转录组)的更多、更大、更深入的表型资源的出现,未来的研究可能会以更大的力量测试这种基因组差异是否延伸到其他生物学水平。
总之,研究者表明,遗传RSN的多效性是由一个双因素模型来表示的,主要区分遗传对多模态关联的影响和对感觉网络的影响。通过对这些遗传因子的GWAS分析,发现了相关的SNP和基因。利用研究者的方法,研究者证明了利用多变量全基因组方法来利用RSN的多效性为脑功能的遗传和分子根源提供了新的见解。
参考文献:Shared genetic influences on resting-state functional networks of the brain
网友评论