美文网首页肿瘤基因组
全外显子组测序在多重家族中识别与图雷特障碍相关的基因

全外显子组测序在多重家族中识别与图雷特障碍相关的基因

作者: 亦是旅人呐 | 来源:发表于2022-06-15 12:33 被阅读0次

MOLECULAR PSYCHIATRY IF:15.992 (2021年6月30日公布)


摘要

图雷特障碍 (Tourette’s Disorder,TD) 是一种神经发育障碍 (NDD),影响约 0.7% 的人口,是最易遗传的 NDD 之一。然而,由于其多基因性质和遗传异质性,TD的遗传病因尚不清楚。在本研究中,我们将 13 个 TD 多重家族的分离信息与高通量测序和基因分型相结合,以鉴定与 TD 相关的基因。使用全外显子组测序和基因分型阵列数据,我们确定了个体中的小型和大型遗传变异。然后,我们结合多种类型的证据对 TD 的候选基因进行优先排序,包括变异分离模式、变异功能预测、候选基因表达、蛋白质-蛋白质相互作用网络、先前研究的候选基因等。从13个家族中,鉴定了71个强候选基因,包括NDD和新型基因的已知基因,例如HTRA丝氨酸肽酶3(HTRA3),与钙粘蛋白相关的家族成员1(CDHR1)和锌指 DHHC 型棕榈酰转移酶17(ZDHHC17)。候选基因富含几种基因本体学类别,例如动力蛋白复合物和突触膜。这项研究中确定的候选基因和途径为TD病因和未来研究的潜在靶标提供了生物学见解。


介绍

图雷特障碍 (TD) 是一种神经发育障碍 (NDD),影响多达 1% 的全球人口 [ 1 , 2 ]。TD 的特点是慢性运动和发声抽搐,通常在儿童早期被诊断出来。一些患者没有表现出 TD 的全部综合征,并以 TD 相关的慢性抽动障碍为特征,例如慢性运动性抽动障碍或慢性发声性抽动障碍 [ 1 , 2 ]。TD 与多种精神疾病的共病率很高:约 60% 的患者还被诊断为注意力缺陷多动障碍 (ADHD) [ 3 , 4 , 5 , 6 ] 和 40-60% 的患者患有强迫症 (OCD) 7、8、9、10 []。_ _ _ _ _ 自闭症谱系障碍 (ASD) 在 TD 中的比例也很高,大约 20-40% 的自闭症患者会出现抽搐 [ 11 ]。据估计,TD 患者合并精神疾病的终生患病率高达 90% [ 9 ]。

TD 是一种高度可遗传的多基因神经精神疾病(基于人群的*h *2  = 0.77;SNP- *h *2  = 0.58)[ 12 , 13 ]。一级亲属中 TD 和其他慢性抽动障碍的经验性复发风险估计约为 30% [ 14 ]。由于 TD 的高遗传性,已经进行了许多研究来确定 TD 的遗传病因(综述于 [ 15 ])。早期的 TD 遗传学研究集中在单基因遗传模型假设下的单基因突变。尽管报告了一些候选基因,但这些基因的突变仅解释了少数 TD 病例(综述于 [ 15])。现在认为 TD 具有复杂的多基因等位基因结构,类似于其他 NDD [ 16 ]。最近,进行了几项大型研究来识别与 TD 相关的基因,包括针对从头突变的单纯性家族的全外显子组测序 (WES) 研究 [ 17 , 18 ] 和全基因组关联研究 (GWAS) 的荟萃分析) 约 5000 名 TD 患者 [ 13 ]。然而,在 WES 和 GWAS 研究中只发现了少数易感基因/位点。

由于其高遗传性,鉴定 TD 候选基因的一种有效方法是研究大型多重家族。TD 患者的孩子受到影响的可能性要高出 10 到 100 倍 [ 14 , 19 ],这表明家庭成员之间存在共同的遗传易感性。因此,与单一三重奏相比,多重家族中的变异分离模式可以帮助识别具有强烈影响的遗传罕见变异,并提供额外的信息。图雷特氏症国际合作遗传学研究 (TIC Genetics) 是一项合作,招募受 TD 影响的家庭来研究 TD 的遗传因素 [ 20]。在当前的研究中,我们为来自 13 个 TIC Genetics 多重家族的个体生成了 WES 和基因分型阵列数据。然后,我们优先考虑这些家族中具有罕见突变的风险基因,以确定 TD 的潜在风险基因。


主题和方法

人类受试者

在所有参与者的知情同意下,通过 TIC 遗传学研究 [ 20 ] 和新泽西图雷特综合症中心 [ 21 ]招募了多重家庭。该研究方案已在所有 TIC Genetics 站点获得当地批准。所有测序的个体都被归类为“白人”种族,除了 FAM4 中的精子供体(4001),其祖先未知(表 1)。TD 和慢性抽动障碍的临床评估和定义在先前 [ 20 ] 中有详细描述,并且基于精神障碍诊断和统计手册第四版文本修订版 (DSM-IV-TR) 或第五版 (DSM) -5) [ 22 , 23]。在这项研究中,受 TD 影响的个体被定义为被诊断患有 TD 或其他抽动障碍(即慢性运动或发声抽动障碍、混合亚型、短暂性抽动障碍或抽动障碍——未另行指定)的个体 [ 20 ] )。多重家庭被定义为具有至少三个受 TD 影响的个体的家庭。

全外显子组测序、变异调用和注释

SureSelect Human All Exon V4、Human All Exon V4 + UTR(Agilent Technologies,Santa Clara,CA,USA)或 NimbleGen SeqCap EZ Exome V2(Roche,Wilmington,MA,USA)试剂盒用于 WES 文库制备。测序在 Illumina HiSeq 平台上以 100 或 150 PE 格式(Illumina,San Diego,CA,USA)进行。变异调用是使用基因组分析工具包按照最佳实践管道 [ 24 ] 执行的,变异注释是使用 ANNOVAR [ 25 ] 执行的。为了控制批次效应,对所有样本进行联合变体调用,并且仅考虑多个外显子组捕获试剂盒中位于较小富集区域集中的变体(SeqCap EZ Exome V2)(参见 补充方法)详细步骤和命令)。测序数据可在研究登录 phs001423.v2.p2 下的 dbGaP 获得。

候选基因优先级、注释和过滤

谱系变异注释、分析和搜索工具 (pVAAST) 用于识别每个谱系中的候选基因 [ 26 , 27 ]。pVAAST 是一种基于可能性的工具,它使用每个基因中的几种类型的变异信息对候选基因进行优先排序,包括一般人群中的分离模式、预测的功能影响和等位基因频率 (AF)。对于所有家族,pVAAST 在显性遗传模式下运行,对于不能排除隐性遗传模式的家族,在隐性遗传模式下运行(表 1,详见 补充方法)。

对于基因功能预测,从 gnomAD 中提取每个基因的功能丧失不耐受 (pLI) 评分和错义*Z评分的概率 [ *28 ]。大脑发育基因表达数据来自基因组织表达项目 (GTEx) [ 29 , 30 ]、人类大脑发育项目的 BrainSpan 图集 [ 31 ] 和人类发育生物学资源 (HDBR) [ 32 ](见 补充详细方法)。[从疾病数据库 33 ] ( https://diseases.jensenlab.org ) 中提取和整理与 NDDs 相关的疾病)。基因敲除小鼠行为是从国际小鼠表型分析联盟 (IMPC) [ 34 ] ( ftp://ftp.ebi.ac.uk/pub/databases/impc/latest/ ) 下载的。

来自先前 NDD 研究的基因列表

从先前的研究中收集了几种 NDD 的风险基因,包括 TD、OCD、ADHD、ASD、智力障碍、癫痫性脑病和精神分裂症。基因组和基因组中的基因总结在表 S1中。

蛋白质-蛋白质相互作用 (PPI) 网络、基因本体 (GO)、通路和蛋白质复合物富集分析

三个数据库用于研究候选基因之间的 PPI 网络,包括 STRING [ 35 ]、ConsensusPathDB [ 36 ] 和 GIANT_v2 [ 37、38 ] 详见 补充方法)。在最近的基准论文 [ 39 ] 中,这些数据库被证明具有最佳性能。基准文件还表明,至少两个数据库中存在的交互提供了比一个数据库特定的交互更高的置信度。

对所有 NDD 基因进行富集分析,并使用 ConsensusPathDB [ 36 ] 提供的代表性分析。如果: (1) 属于该术语的基因总数≤200;(2) 该术语包括TD_multiplex基因列表中的一个以上基因和所有TD基因中的两个以上基因(TD_multiplex + TD_simplex + TD_CNV);(3) 该术语包括来自一个以上多重家族的基因。用Fisher精确检验计算每个基因列表的 富集p值(详见补充方法)。

拷贝数变异 (CNV) 分析

基因分型是在耶鲁大学医学院的凯克生物技术资源实验室和罗格斯大学的RUCDR Infinite Biologics ®使用 Illumina HumanOmni1-Quad 或 OmniExpressExome BeadChip(Illumina,San Diego,CA)进行的。每个谱系的样本在同一平台上进行基因分型。如前所述 [ 40 ] 进行基因型调用和 CNV 检测(详见 补充方法)。≤0.05 的 pCNV 阈值用于 CNV 的初始选择。CNV 注释由 CNVision、AnnotSV [ 41 ] 和用于继承模式分析的自定义程序执行。小于 1000 个碱基对或大于 200 万个碱基对的 CNV 被排除在外。


结果

家族和表型

1描述了项目的总体设计。本研究共纳入 13 个多重家族。家庭规模从 4 到 23 不等,共有 151 个人(表 1和图 S1)。男性和女性被诊断患有 TD 和其他慢性抽动障碍的百分比分别为 60% (51/85) 和 47% (31/66)。表 S2总结了各个表型的详细信息。

图1 总体研究设计。WES 全外显子组测序,SNP 单核苷酸多态性,AF 等位基因频率,CNV 拷贝数变异,GO 基因本体,PPI 蛋白-蛋白相互作用。

全外显子组测序和候选基因优先排序

在 13 个家庭中,我们从 110 个个体中获得了 WES 的 DNA 样本,其中 72 个 TD 个体和 38 个非 TD 家庭成员。每个家族中至少对三个患有 TD 的个体进行了测序(表 1)。总体而言,测序的 110 个人的平均覆盖深度为 42.5 倍,平均覆盖中位数为 34.9 倍(表 S2)。使用测序数据,我们确定了单核苷酸变异 (SNV) 和小的插入和缺失 (indel)。每个个体通过质量控制的变体总数为 (6.64 ± 0.72) × 10 4。删除常见变体后(参见“主题和方法”和补充方法),每个个体的变体数量从 3970 到 8673 不等,平均为 6710(表 S2)。

接下来,我们使用候选基因优先排序工具 pVAAST 来识别每个谱系中的候选基因。13个家族中报道的候选基因数量从1个到218个不等,共有1018个基因(表 1)。因为变异分离模式是多重家族中候选基因优先排序的主要因素,所以小家族(例如,FAM9)和所有个体都受到影响的家族(例如,FAM2)区分变异分离模式的能力较小,因此产生更高的数量候选基因比更大的家族。为了减少候选基因的数量,我们根据变异分离模式(真阳性事件 ≥ 2 和错误率 < 0.3)、大脑中的基因表达水平(最大 TPM > 5)和一般人群中的 AF(gnomAD 2.1)应用了额外的过滤器.1 AF < 0.05)(详见“主题和方法”和补充方法)。过滤后,13个家族中候选基因数量为1~125个,共有543个独特基因(表 1)。此后,我们将这些基因称为“TD_multiplex”基因(表 S3)。在 543 个独特基因中,有 25 个在多个家族中被鉴定,其中大部分在具有许多候选基因的家族中被鉴定(表 S2)。

14 个 TD_multiplex 基因在之前的 TD simplex trio 家族研究中被鉴定 [ 18 ](表 S4)。此外,在之前的 TD 研究中报道了两个基因:DnaJ 热休克蛋白家族 (Hsp40) 成员 C13 ( DNAJC13 ) [ 42 ] 和溶质载体家族 6 成员 4 ( SLC6A4 ) [ 43 ]。据报道,其中一些基因也与其他 NDD 相关(表 2S1B)。例如,除 TD 外,据报道锚蛋白 3 ( ANK3 ) 与 ADHD 和 ASD 相关。

表 2 每个家族中的顶级候选基因。

个体家族中的候选基因

为了了解 TD_multiplex 候选基因的功能影响,我们为每个基因收集了几种类型的证据,包括它们在大脑中的表达模式、已知的疾病关联、对突变的耐受性、敲除小鼠表型以及它们与其他基因的相互作用(图 2,见“主题和方法”和补充方法详情)。我们偏爱包含具有良好分离模式、世代群体中 AF 低的变体的候选基因,以及在先前的 TD 或其他 NDD 研究中鉴定的基因,具有神经系统相关功能,在大脑中具有更高或组织特异性表达,以及导致小鼠敲除模型中相关行为变化的基因。使用这些注释,我们进一步细化了 TD_multiplex 候选基因并选择了 71 个候选基因的最终列表(表 2)。下面我们简要描述几个家族中的高置信度顶级候选基因。

图 2 用于变异和基因优先排序的信息。“注释”字段的详细描述可以在 补充方法和表 2中找到。PPI 蛋白质-蛋白质相互作用、GO 基因本体论、pLI 功能丧失不耐受评分的概率、观察到的计数与预期错义突变数的偏差的mis_z Z评分、每百万 TPM 转录本。

FAM3

钙粘蛋白相关家族成员 1 ( CDHR1 ) 是谱系中唯一具有完美分离变体的候选基因 (ENST00000372117.3:p.Asn623Ser)。该突变位于钙粘蛋白结构域中,SIFT [ 44 ]预测它是有害的。CDHR1在包括尾状核、下丘脑和伏隔核在内的大脑区域中表现出特定的高表达 [ 29 , 30 ]。CDHR1 是一种钙依赖性细胞-细胞粘附膜蛋白,与视觉相关疾病有关,例如视杆细胞营养不良 [ 45 ]。

FAM5

转录接头3(TADA3)是由PVAAST排名的top候选基因。候选突变是一种非同义突变 (ENST00000301964.2:pArg171Cys),预计 SIFT 有害,Polyphen-2 有害[46 ]。该变体存在于三代谱系中的所有七个受影响的个体中,但也存在于未受影响的祖父中作为杂合变体。该基因是组蛋白乙酰转移酶共激活复合物的一个组成部分,也是 p53 的调节剂,它对染色质调节和细胞周期进程很重要 [ 47 ]。TADA3在大脑区域普遍高度表达(GTEx 数据中>70 TPM)[ 30]。作为一种多方面的蛋白质,TADA3 在染色质重塑、细胞增殖、细胞衰老、DNA 损伤反应和胚胎发育中发挥重要作用[47 ]。

FAM11

HtrA 丝氨酸肽酶 3 ( HTRA3 ) 在蛋白酶结构域中具有非同义突变 (ENST00000307358.2:p.Val269Met),预计 SIFT 和 Polyphen-2 是有害的。该突变存在于所有八个受影响的个体和一个未受影响的孙子中。HTRA3在一些早期大脑发育阶段高度表达 (TPM > 10) [ 31 , 32 ]。HTRA3 是一种具有四个结构域的分泌蛋白,在脊椎动物中高度保守[ 48 ]。几种具有 Htra3 缺失的 Wolf-Hirschhorn 综合征小鼠模型会导致显着的表型变化,包括癫痫发作,这是一种类似于抽搐的行为 [ 49 ]。

FAM12

核仁素 ( NCL ) 表现出完美分离的框内缺失 (ENST00000322723.4:p.Asp261del)。NCL参与核糖体的合成和成熟,并且不耐受 LoF (pLI = 1) [ 50 ]。该基因在脑中高度表达(表 S3)。在一项 GWAS 研究中,NCL与 ADHD 相关 [ 51 ]。破坏NCL的功能会导致核仁应激,这被认为是包括聚谷氨酰胺 (polyQ) 疾病和帕金森病在内的神经退行性疾病的致病机制之一 [ 52 , 53 ]。在亨廷顿病中,HTT中的 polyQ 突变基因在功能上破坏了与NCL的正常核糖体相互作用[ 54 ]。

FAM4

谱系FAM4包括一名精子供体、六名母亲和九名后代,其中八名是TD病例。由于其中四位母亲未受影响,因此极有可能存在来自精子供体的一个或几个显性突变,这些突变被传递给受影响的孩子。在 pVAAST 显性运行中,过滤后剩余 10 个基因。在这些基因中,DCAF1(DDB1 和 CUL4 相关因子 1,也称为VPRBP)包含一个完全分离的变体。DCAF1 是一种丝氨酸/苏氨酸蛋白激酶,它也是 E3 泛素蛋白连接酶复合物的组成部分,在包括细胞周期、端粒酶调节和组蛋白修饰在内的各种生物过程中起关键作用 [ 55 ]。

除了DCAF1之外,其他几个基因也包含具有一种基因型/表型差异的变体(表 2)。锌指 DHHC 型棕榈酰转移酶 17 ( ZDHHC17 ) 包含一种罕见的非同义变体 (ENST00000426126.2:p.Ile582Thr),Polyphen-2预测它可能有害。该变异存在于精子供体、五名受影响的儿童中,而在一名受影响的儿童和所有未受影响的个体中不存在。ZDHHC17以前被命名为亨廷顿相互作用蛋白 14,基于其与亨廷顿病基因HTT的相互作用。它是一种具有棕榈酰转移酶活性的膜蛋白,对包括 HTT 在内的几种关键神经元蛋白具有特异性 [ 56] 和谷氨酸离子型受体 NMDA 型亚基 2B (GRIN2B) [ 57 ]。亨廷顿病小鼠模型 Zdhhc17 Gt(RRJ233)Byg /Zdhhc17 Gt(RRJ233)Byg显示了神经系统中的一系列表型和行为/神经学变化,包括神经元凋亡增加、脑重量降低、纹状体形态异常和多动。ZDHHC17与 TD_simplex、ADHD 和 ASD_high 列表(表 S3)中的基因显示出显着的相互作用,表明它在多个 NDD 中起重要作用。

其他小家庭

因为较小的家族在变异分离中包含的信息较少,这些家族通常比较大的家族呈现更多的候选基因,并且更难以对基因进行排序。然而,已知几个候选基因与其他 NDD 相关或在之前的 TD 基因研究中被鉴定(表 2)。例如,FAM11 中的 Contactin 相关蛋白家族成员 5 ( CNTNAP5 ) 是已知的 NDD 基因,据报道CNTNAP5中的变体与 ASD 和其他 NDD 相关 ( https://gene.sfari.org/database/human-gene /CNTNAP5 )。FAM8中的 ANK3 是一种高度可信的 ASD 候选基因,在 TD_simplex 家族研究中也有报道 [ 18]。我们的顶级 TD_multiplex 家族基因与 NDD 候选基因之间的重叠表明 TD 和其他 NDD 的共同遗传病因。

个体家族 CNV 分析

对于九个家族,我们还使用基因分型阵列获得了 CNV(表 1)。共鉴定出 1799 个高质量的 CNV,每个家族平均有 200 个 CNV(范围从 116 到 289)。大多数 CNV 对一个人来说是独一无二的。在对分离模式、基因重叠和 CNV 大小进行过滤后(有关过滤细节,请参阅“主题和方法”),我们获得了 22 个基因 CNV,包括 16 个外显子 CNV(表 S5)。CNV 预测的风险基因与 SNV 分析的候选基因不重叠(表 3)。我们进一步根据 22 个 CNV 的人群患病率(AF < 1%)、候选基因脑表达水平和候选基因功能对它们进行优先排序。在确定优先级后,剩下三个候选 CNV。第一个 CNV 是 FAM1 (g.chr5:73980065-73992881) 中的杂合缺失,与己糖胺酶亚基 Beta ( HEXB ) 的前几个外显子重叠。这种缺失与表型完全分离,并且基因组区域仅包含 gnomAD 结构变异数据库 ( https://gnomad.broadinstitute.org/region/5-73980065-73992881?dataset=gnomad_sv_r2_1 )中人群中的两个罕见 CNV 。HEXB编码溶酶体酶 β-己糖胺酶的一个亚基,以及HEXB中的突变与神经退行性 Sandhoff 病有关 [ 58 ]。第二个 CNV 是 FAM9 中的杂合缺失 (g.chr20:5281253-5289644)。这种缺失在种群中很少见,并且与基因 Prokineticin Receptor 2 ( PROKR2 ) 的最后一个外显子重叠。PROKR2增加了大脑的表达,并与卡尔曼综合征有关 [ 59 ]。第三个 CNV 来自 FAM5,位于锌指蛋白 385D ( ZNF385D ) 的内含子中。这种杂合缺失在家庭中八分之五的受影响个体中分离,并且在一般人群中很少见。ZNF385D与其他神经精神疾病有关,例如精神分裂症 [ 60] 和阅读障碍 [ 61 ],支持ZNF385D作为 TD 的候选基因。

涉及多个家庭的途径

由于 TD 明显的高遗传异质性,每个多重家族可能具有不同的潜在遗传风险因素。尽管 543 个 TD_multiplex 基因中只有 25 个存在于一个以上的家族中,但这些家族可以共享单个基因水平之外的潜在 TD 遗传病因,例如途径和基因组。为支持后者,多基因风险评分与 TD [ 12 ] 相关。因此,我们检查了前 71 个候选基因的相互作用(表 2),以及它们与其他 NDD 基因的相互作用。我们的结果显示了我们的顶级候选基因之间的强相互作用:71 个基因中有 35 个显示相互作用并形成一个单一的 PPI 网络(图 3A)。许多剩余基因显示出与其他 NDD 基因的广泛相互作用(图 3B),表明 NDD 之间存在共同的遗传病因。有趣的是,从 PPI 网络中出现的子模块包括钾电压门控通道基因和轴索动力蛋白基因(图 3B)。

图3 蛋白质-蛋白质相互作用 (PPI) 网络。71 个 TD 顶级候选基因的PPI 网络。仅显示可以连接的基因。不在 ( A )中的 71 个 TD 顶级候选基因的B PPI 网络。如果其他 NDD_all 基因与多个 TD 顶级候选基因相互作用,则将它们添加为中间节点。对于中间节点,仅包括与顶级候选基因的相互作用。由轴丝中鉴定的 NDD_all 基因形成的C PPI 网络 (GO:0005930)。D由突触膜中的 NDD_all 基因形成的 PPI 网络 (GO:0097060)。为了简化网络,去除了非候选基因之间的相互作用。PPI 网络由三个数据库定义,ConsensusPathDB、STRING 和 GIANT_v2。基因由基因列表着色(详见“主题和方法”)。

为了进一步探索 TD 候选基因之间的关系并确定 TD 和不同 NDD 之间的潜在共享机制,我们使用 ConsensusPathDB 对所有 2345 个 NDD 基因(NDD_all,表 S1)进行了富集分析,并使用 Fisher 计算了每个基因列表的富集意义精确检验(表 S6)。NDD_all、TD_multiplex 以及其他几个基因列表在 GO 术语和与大脑功能和发育过程相关的途径中高度富集,突出表明该组中的许多基因都参与了大脑发育(表 S6)。在富含 TS_multiplex 基因列表的 GO 术语中,“动力蛋白轻中间链”(GO:0051959, 29 个基因)是顶级分子功能术语,“轴突部分”(GO:0044447, 37 个基因)是顶级细胞成分术语。来自五个多重家族的七个基因在动力蛋白轻中间链术语下定义,包括DNAH3、DNAH5、DNAH7、DNAH11、RAB11FIP3、DYNC2H1CCDC88B。有趣的是,TD_simplex 基因集中的四个基因(DNAH5、DNAH6、DNAH10RAB11FIP3)和 ASD 基因集中的四个基因(DNAH3、DNAH10、DNAH17CCDC88C) 也存在于“动力蛋白轻中间链”基因组中,并且 NDD_all 基因也显示出该术语的显着富集(q  = 5.1 × 10 -4,表 S6)。这些基因编码的动力蛋白是细胞骨架的一部分,并在 PPI 网络中显示出广泛的相互作用(图 3C)。TD 和其他 NDD 中动力蛋白复合物中的重叠候选基因表明微管功能可能是 NDD 尤其是 TD 的重要因素。在所有 NDD 基因的富集分析中,最富集的 GO 术语包括突触小泡周期和突触前膜(超几何检验,q  = 9.2 × 10 -23和 2.7 × 10 -20,分别见表 S6)。这些基因中的大多数也在 GO 术语“突触膜”下,并在 PPI 网络中显示出广泛的相互作用(图 3D)。除了在整体基因列表中的富集外,“突触小泡循环”和“突触前膜”GO术语中的基因也在大多数单个基因列表(不包括TD_CNV和OCD)中富集,表明这两个类别中基因的重要性多个NDD。


讨论

TD 是一种高度可遗传且经常发生的 NDD,可能会给患者和家庭造成重大负担 [ 14 ]。作为一种病因异质的复杂疾病,经典的候选基因方法难以研究其发病机制,单基因研究仅报道了少数基因(综述见[ 15 ])。与单一三重研究相比,多重家族提供了额外的信息:由于在一个家族中识别出多个受影响的个体,家族内的变异分离模式可以帮助识别具有强烈影响的遗传罕见变异。在这项研究中,我们检查了 13 个多重家族以确定潜在的 TD 候选基因。

在我们的多重家庭中,OCD 和 ADHD 的共同发生与之前的研究一致 [ 3 , 4 , 5 , 7 , 8 , 9 ]:总共 37.8% (31/82) 的个体患有 TD 和其他抽动障碍也被诊断出患有强迫症,20.7% (17/82) 的人同时患有多动症(表 S2)。另一方面,男性和女性之间的性别比为 1.3,低于人口研究中男孩受累频率是女孩的 3 到 5 倍的比例 [ 1]。有人提出,女孩较低的做作率可以用“女性保护作用”来解释,它保护女性免受许多影响很小的变异的影响。多重家庭中受影响女性的比例增加可能与影响这些家庭中女性所需的大效应变体的分离一致。

我们对 13 个家族的初步分析确定了整个基因组中的数百个候选基因。大量候选基因可能是由于TD的复杂遗传病因和小家庭缺乏分离信息所致。因此,为了促进候选基因的优先排序,我们考虑了变异和基因的多种类型的信息,包括突变功能影响预测、分离模式、基因功能、基因已知疾病关联和大脑中的基因表达模式(图 2)。通过结合证据,我们对候选风险基因进行了优先排序,并生成了包含 71 个基因的顶级候选基因列表。我们还发现了三个分离的基因 CNV,它们也可能导致三个家族的 TD 病因。一些顶级候选基因是众所周知的 NDD 基因,例如GRIN2BCNTNAP5GABRB3ANK3。对于四名被诊断为 ADHD 的患者,他们的外显子组包含与 ADHD 相关的已报道基因(SLC6A2、ANK3)的变异。我们相信这些基因也是这些家族中的 TD 风险基因,因为这些变体与 TD 患者表现出强烈的分离模式。在先前的 TD 单纯三重奏研究中,14 个基因包含可能具有破坏性的从头突变(表 S4),例如BCAN、DNAH5RAB11FIP3,为他们参与 TD 病因学提供额外支持。更重要的是,我们在多重家族中发现了几个新的候选基因,这些基因以前没有与 TD 或 NDD 相关联。例如,TADA3是 FAM5 中的单一候选基因。这项研究的证据值得在未来的 TD 研究中仔细检查这些基因。

候选基因还使我们能够识别对 TD 病因很重要的潜在途径和生物学过程。我们数据集中最强的信号之一与动力蛋白途径的成分有关,动力蛋白途径是细胞骨架的运动蛋白(图 3C)。动力蛋白对于神经元内的蛋白质转运很重要,特别是对于在远离细胞体的轴突中起作用的信号蛋白[ 62]。这一结果表明细胞骨架可能在 TD 发展中起重要作用。一个有趣的观察是,尽管许多 NDD 基因列表的 GO 术语和通路富集与神经元和大脑功能有关,但 TD_multiplex 和 TD_simplex 基因列表中的许多富集与其他 NDD 列表中的富集不同(表 S6)。这表明与其他 NDD 相比,TD 可能具有不同的遗传风险因素。我们还观察到所有 NDD 基因在分子功能和生物学途径方面的共同富集。对于所有 NDD 基因,最丰富的 GO 术语和通路与脑功能有密切关系,例如突触前膜、突触小泡周期、神经递质分泌、多巴胺代谢过程、谷氨酸受体信号通路和 GABA 能突触(表 S6)。因此,来自其他 NDD 的研究也可能有助于了解 TD 的遗传基础。

作为一种具有遗传异质性的复杂疾病 [ 18 ],TD 中的风险基因很可能在网络中协同工作。我们的 PPI 网络分析支持这一假设:三个 PPI 数据库在顶级 TD 候选基因和来自其他 NDD 列表的基因中预测了许多 PPI(图 3)。对于这些疾病,一些最丰富的术语与神经元的正常功能有关,例如突触膜、突触小泡循环和电压门控离子通道活性。

总之,通过利用多重家族中的分离信息、WES 的力量和全基因组 CNV 分析,我们确定了可能有助于 TD 发展的新候选基因以及生物学过程和途径。未来需要更大样本量的 TD 研究来为候选基因提供进一步的支持。此外,在细胞培养系统或动物模型中对这些候选基因进行功能研究,将更好地了解它们在 TD 中的作用,最终改善诊断和治疗。


相关文章

网友评论

    本文标题:全外显子组测序在多重家族中识别与图雷特障碍相关的基因

    本文链接:https://www.haomeiwen.com/subject/cecxvrtx.html