题目
A novel atlas of gene expression in human skeletal muscle reveals molecular changes associated with aging
ABSTRACT
背景
尽管基因表达的高通量研究已经产生了大量的数据,其中大部分可在公共档案馆中免费获得,这一宝贵资源的使用受到以下方面的限制计算复杂性和非均质注释。为了解决这些问题,我们已经执行了对人类骨骼肌活检组织的公共芯片数据进行完整的重新注释,并构建了一个肌肉表达纲要由近3000个样本组成。创建的肌肉纲要是公开资源,包括所有策划的注释。使用此数据集,我们旨在阐明肌肉衰老的分子机制,并描述体育锻炼如何减轻负面影响生理作用。
结果
我们发现957个基因与衰老显着相关(p <0.05,FDR = 5%,n = 361)。老化与许多中央代谢途径如线粒体功能的扰动有关,包括降低了ATP合酶,NADH脱氢酶,细胞色素C还原酶和氧化酶复合物,以及葡萄糖和丙酮酸的加工。在最强的基因中与衰老相关的是H3组蛋白,3B家族(H3F3B,p = 3.4×10-13),AHNAK核蛋白,桥粒芯蛋白(AHNAK,p = 6.9×10−12)和组蛋白脱乙酰基酶4(HDAC4,p = 4.0×10−9)。我们也发现基因以前与肌肉衰老和新陈代谢无关,例如絮凝和伸长蛋白zeta 2(FEZ2,p = 2.8×10−8)。在与衰老相关的957个基因中,有21个(p <0.001,错误发现率= 5%,n = 116)也与最大耗氧量(VO2MAX)有关。令人惊讶的是,这21个基因中有20个是在比较年龄增长和摄氧量最大时,调节方向相反。
结论
这些结果支持线粒体功能障碍是一个主要的年龄相关因素,也突出了线粒体功能障碍。保持较高的身体能力以预防与年龄有关的肌肉减少症的有益效果。
关键词
Skeletal muscle, Expression, Microarray, Aging, Mitochondrial dysfunction, Exercise
背景
衰老深刻影响骨骼肌,包括骨骼肌丢失肌肉质量和力量,并增加脂肪和结缔组织[1]。 这种情况经常所谓的与年龄有关的肌肉减少症,会导致多种生理状况的恶化,从而降低生活质量和整体健康在老龄化个体中。 随着年龄的增长,我们每年损失大约1%的腿瘦体重,大约损失腿部力量的2.5–4%,高于男性妇女。 这表明肌肉减少症不仅是肌肉量减少的问题,但随之而来肌肉质量下降和肌肉质量下降。 在为了有效延迟肌结节病的发作和严重程度,至关重要的是更详细地描述引起这种生理恶化的分子机制肌肉功能。
以前有关基因表达的最大研究之一衰老的肌肉,有81个人的肌肉活检被调查了。 Zahn等。描述了250个基因的肌肉衰老信号,并将其与年龄相关在其他组织中进行基因调节,发现调节细胞生长的途径表达增加,补体激活,核糖体和细胞外基质基因和降低氯化物转运基因的表达和线粒体的氧化磷酸化(OXPHOS)。De Magalhaes及其同事对小鼠,大鼠,和人类跨越各种组织。在这种跨物种,跨平台分析中,基因直向同源物是荟萃分析约400个样本,其中42个来自人体骨骼肌,比较老年轻人。他们发现73个基因的表达发生改变,其中涉及的基因表达增加在炎症和免疫反应方面,并且始终如一与Zahn等人。降低了与能量代谢相关的基因的表达,尤其是线粒体drial基因可通过GenAge数据库访问。它也有有证据表明,衰老的人正在增加线粒体DNA损伤的水平导致OXPHOS途径中基因的表达减少。综上所述,总的发现是,线粒体软骨功能障碍是造成减少的原因之一。肌肉功能随着年龄的增长。减少表达OXPHOS途径中的基因,包括调节子还发现过氧化物酶体增殖物激活受体γcoactiator v(PGC1α)2型糖尿病患者的骨骼肌,与年龄密切相关的代谢紊乱。另一个中央以前与肌肉衰老相关的途径是雷帕霉素(mTOR)的哺乳动物靶标,包括mTOR复合体I(mTORC1)在骨骼肌翻译的调节。一个mTOR和糖酵解之间的代谢联系也已经描述了低糖酵解通量导致结合3-磷酸甘油醛脱氢酶(GAPDH)mTORC1调节剂Rheb从而抑制mTORC1蛋白质合成的信号传导和抑制。
了解更多的分子机制详细地进行老化,需要使用更大的样本集提供更多功能来检测基因水平。 我们和其他人以前已经合并研究全球转录组模式的数据数以千计的样本[13–16],但在这项研究中,我们针对骨骼肌研究了与表型相关的特定问题肌肉,收集了2852个样本。但是,公共数据的重用由于使用不同的实验平台和样品注释结合这样的分析并不简单数据。
基于此肌肉表达纲要,我们迄今为止,迄今为止最大的基因表达研究人体骨骼肌与衰老有关。我们解决有关数据异质性的广泛手册重新注释所有样本,并在下面描述各种计算方法。在我们的荟萃分析中我们发现957个基因与衰老明显相关。数据提供了更多有关转录组基因特异性效应的细节,并显示了更多信息。与之相关的基因表达的广泛调控比以前报道的老化。我们进一步研究与957相关的基因的多效性关联并显示21个老化中的20个基因也与体能相关,但与体力增加方向相反
与年龄增长相比。骨骼肌表达纲要公开可在ArrayExpres上找到,登录号为E-MTAB-1788。
方法
数据收集和注释
实验存储在ArrayExpress存档中通过关键字搜索进行识别,目的是识别包含在芯片上完成的微阵列的实验活着的人的骨骼肌组织和干预措施仅限于培训和葡萄糖/胰岛素调节,但不包括药物治疗。使用类别和因子对样本进行注释表1中的值。
预处理和质量控制
数据归一化是在原始.cel文件上完成的HG-U133A和HG-U133 + 2使用可靠的概率平均(RPA)[19,20]。自定义数组定义文件是使用customCDF R / Bioconductor创建的软件包(v16),删除映射到已知的探针SNP,并总结每个基因的探针ENSG标识符。质量控制使用R /生物导体包装阵列QualityMetrics删除检测到的异常数组。
统计分析
对年龄和物理能力的影响进行线性回归分析,并去除研究影响使用limma R / Bioconductor套件和eBayes功能。线性模型符合RPA归一化,基因总结两个平台上所有基因的数据。 的“研究”参数由原始ArrayExpress的登录号。 模型系数和使用eBayes函数估算p值limma。 对于两个阵列上都存在的基因,最小计算年龄参数回归斜率的p值和β值的最大值。p
(FDR)<0.05的值校正为使用Benjamini-Hochberg方法(使用N =31,523(为两个数组)。
结果
建立骨骼肌数据纲要
从ArrayExpress [18]中,根据原始出版物选择了人类骨骼肌活检组织的微阵列数据集并进行了手动管理,包括可用的补充数据(请参阅“方法”部分)。所选实验包含以下数据来自20个不同阵列平台的2852个微阵列(附加文件1中的图S1)。 Affymetrix制造数组占主导地位,由11种不同的数组类型表示总共2475个阵列。使用受控词汇,定义了用于重新标注的样品和实验参数。我们检索了原始论文连同补充材料来重新注释每个使用我们新定义的参数和它们的值范围(表1)。定义通用控件代表正常,健康人群的一组选择了1188个“超级控件”。在该组中,如果个体有任何不适,肥胖(BMI> 30)或遭受任何严重疾病,则排除样本介入。
为了避免差异带来的强烈偏见合并来自不同的阵列平台,我们将这项研究限于每个平台的数据独立。我们根据最常见的两种方式使用了简编的子集平台:Affymetrix HG-U133A的568个阵列,以及来自HG-U133 + 2平台的1174阵列。的通过使用RPA标准化每个数据集来解决探针效应,该模型对每个数据集的亲和力进行建模单个探针,假设它是随机变量具有正态分布,且具有特定于探针集的平均值和方差,而不是像其他许多常量一样归一化方法包括RMA和MAS5。至为了避免研究个体的遗传多样性引入偏见,我们删除了所有与等位基因频率较低的已知人类SNP高于西欧人口的5%。出HG-U133 2阵列上的604,258个探头的数量,4840探针被移除;在HG-133A阵列上2157去除了247,965个探针。寡核苷酸探针总结为基因水平探针组而不是特定于转录本的转录本,也可最大程度地减少探针序列及其在序列上的代表不同的数组。经过质量控制[21],有1236个阵列来自两个平台的信息:来自HG-U133的758 +HG-U133A的2和485。这两个结果数据矩阵中包含19597个基因的数据,HG-U133 + 2阵列,其中11,926个子集位于HG-U133A阵列。 得到的两个交叉研究数据矩阵也可以从ArrayExpress获得,登录号为编号E-MTAB-1788。
这些综合数据集代表了可比性大量人体骨骼肌表达数据不同的实验条件 为了识别组成型表达的基因,我们分析了方差表达的消除仅消除了研究效果。 基因表S1中显示了最稳定的表达),并且不会受到影响由实验条件决定。 最稳定的基因发现是肌红蛋白(MB),GAPDH和alpha 1肌动蛋白(ACTA1)并可以实时定量地“内养”内源性控制基因
957个基因的表达水平与年龄有关
我们从摘要中选择了361个阵列的子集研究衰老对基因表达的影响,即HG-133A阵列的211 ar射线和HG U133 + 2阵列的150 ar,它们具有特定的年龄标记。性别,范围从<1岁到83岁的个人(附加文件1中的图S2)。使用线性模型性别和研究ID为协变量,与年龄显着相关的957个基因(p <0.05,Benjamini-Hochberg多项测试的校正)(显示了前50个基因在表2中)。其中,随着年龄的增长,有484项上调而有473项下调。我们验证删除了在进行研究调整之前和之后,均应通过主成分分析(PCA)获得研究效果。而样本来自相同的研究主要集中在未经调整的数据集,此效果已在调整了一个(图1)。同样,我们使用PCA来验证调整研究效果后,数据集中没有性别偏见(附加文件1中的图S3)。一个显着重叠(N = 13,p = 1.0×10−5)并完成所有13个表达方向的一致性在我们的数据集中发现的73个基因中的基因在de Magalhaes的多物种研究中,观察到了[6]。GenAge报告了957个基因中的25个与衰老有关的288个基因的数据库,使用超几何检验,两个列表在p = 0.0020时有意义。 GenAge数据库也已收集并整理了在长寿的全基因组关联研究中检测到的基因座中的基因列表。他们报告886基因,其中353个与原始研究。在此列表中,我们发现有25个重叠957个基因中(p = 0.024)。 957年的十七岁
以前有250个基因被报道过由Zahn研究(重叠p = 0.065)。公开使用可从GTEx获得的RNA测序数据(n = 157)项目,其中有91个基因位于线粒体内膜上(图S4在附加文件1中)。 NADH脱氢酶的亚基
NDUFAF5,p = 1.0×10−4; NDUFS3,p = 8.8×10−5),细胞色素C还原酶(UQCR10,p = 2.6×10−4; UQCR11,p = 7.7×10−4)和氧化酶(COX10,p = 4.3×10−5;COX4I1,p = 1.7×10−4; COX7B,p = 3.1×10−4; COX7C,p = 6.1×10−4; COX5B,p = 1.1×10−3)和ATP合酶(ATP5G3,p = 1.1×10−6; ATPAF1,p = 3.6×10−5; ATP5G1,p = 8.0×10−5; ATP5C1,p = 2.0×10−4; COX10,p = 4.3×10−5)都随着年龄的增长而下调。我们也发现含有2个C-x(9)-C基序的表达(CMC2)随着老化而降低(p = 1.0×10−7)。 CMC2是呼吸生长所需的,以及带有CMC2的突变体缺失无法装配细胞色素C氧化酶复杂的[26]。在丙酮酸脱氢酶复合物中(PDC),蛋白质A1,B和X(p = 4.1×10-6; 4.2×10−5;1.3×10−3)显示随着年龄的增长表达减少。在与碳水化合物代谢有关,6-磷酸果糖-2-激酶/果糖-2,6-二磷酸酶1(PFKFB1)随着老化而增加(p = 9.4×10−5)。毛皮热,骨骼中GLUT4吸收葡萄糖已知肌肉依赖于TBC1域家庭成员1(TBC1D1)[27,28],表达式其中随着老化而降低(p = 3.6×10−4)。
高体能抵消了与年龄相关的变化
肌肉表达随着年龄的增长肌肉质量和性能下降可以通过运动来预防。 因此,我们探索了是否有任何相关基因的表达衰老也受身体能力的影响评估为VO2MAX。在116个样本的子集中,其中包含有关VO2MAX,我们发现了39个与实际能力相关的基因(FDR <0.05,Benjamini-Hochberg,表4),但给定样本中包含的样本数量相对较少VO2MAX分析,我们的分析仅限于957与年龄有关的基因。 其中21人与VO2MAX相关(表5)。 令人震惊,但并非如此出乎意料的是,衰老和增加的身体能力会影响20个21个基因。 其中的两个,细胞因子信号传导抑制因子2(SOCS2)和纤溶和伸长蛋白zeta 2(FEZ2)也与BMI(FEZ2:pBMI = 5.9×10−4,SOCS2:pBMI = 7.3×10−4); 增加BMI影响基因表达的方向与年龄增长方向相同(FEZ2:page = 2.8×10-8,SOCS2:页面= 5.5×10−7)并以相反的方向增加身体容量(FEZ2:pVO2max = 3.5×10−5,SOCS2:pVO2max =6.3×10−8)(图2)。
体重指数和2型糖尿病对糖尿病的影响
年龄相关基因的表达我们发现与年龄相关的三个基因与T2D相关的CD163(页面= 2.2×10−4,pT2D =2.0×10−4),ZNF415(页面= 8.9×10−5,pT2D = 8.5×10−5),和GADD45A(页面= 5.4×10−4,pT2D = 1.1×10−4)(表6)。 其中,GADD45A和CD163具有先前显示与T2D相关GWAS 。 有趣的是,GADD45A也已经可以减少能量产生并刺激骨骼肌的萎缩机制[31]。 ZNF415是已知会抑制AP1和p53的转录活性,而血清sCD163的浓度升高是患T2D的危险因素。 957个年龄相关基因中有两个也与BMI相关,即EIF4EBP1(pBMI = 1.8×10−6)和AKR1C3(pBMI =4.7×10−5)。
讨论
由于注释标准不同,公共基因表达数据分析通常会无法合并大型阵列以进行新研究。而这里提供的数据集的主要好处是已使用统一的手动注释,从而实现了更全面,更详细的信息进行分析。 我们通过强大的人工策划工作,我们可以增加公共数据的可组合性和实用性,迄今为止,有关人体骨骼衰老的最大研究肌肉,并在同一纲要中添加有关身体能力,BMI和T2D。 这个骨骼肌数据集已经公开可用于进一步研究基因表达骨骼肌。
在当前的分析中,我们详细描述了人类骨骼肌中基因表达的年龄相关差异,并鉴定了957个基因与年龄有关。与Zahn等人一致,我们发现补体系统中的基因表达增加,线粒体基因表达减少随着年龄的增长。基因在ETC中所有主要复合物中的表达以及PDH中的几个基因随着年龄的增长,复合物减少(图3)。这些结果与其他人一起支持认为老年受试者的体重降低了近50%肌肉每单位体积的氧化能力比年轻主题。在蜂窝级别,这种减少归因于线粒体含量的减少并降低线粒体的氧化能力,即线粒体成分的减少可能反映线粒体缺陷或数量减少线粒体或两者兼有。几个潜在的监管者确定线粒体的质量和功能本研究中的957个年龄相关基因。例如,ENDOG是受PGC1A调节的蛋白质,如图所示与线粒体基因组相互作用以调节线粒体肿块。 TOMM40是负责导入核编码的后行李箱线粒体前体蛋白,它以前与衰老和运动引起的线粒体生物发生有关。 MRPL4和MRPL48是线粒体核糖体的成分,负责生产必需的氧化磷酸化蛋白的蛋白质,线粒体细胞色素c氧化酶组装需要CMC2。 HCCS和TFRC是与衰老相关的其他蛋白质,ETC的正常运作还需要它们。其中与衰老相关的其他潜在监管者有两个前叉转录因子,即FOXO1和FOXO3。这两个以前都已经暗示过在衰老,长寿和肌肉萎缩中的作用。在总结,骨骼肌线粒体的恶化功能已经被公认是导致与年龄有关的肌肉变性的主要因素,并且我们的发现在广泛的分子水平上支持了这一主张,确定大量潜在的监管者。
我们发现,在衰老过程中强烈影响具有葡萄糖摄取和能量感应功能的基因。例如,随着年龄的增长,我们发现AMPK的γ1调节单位表达降低。 AMPK是一个骨骼肌中的主要能量传感器,通过控制糖和脂质代谢的关键步骤感知AMP水平的能力。已知AMPK表达降低会导致肌肉能力下降通过GLUT4转运蛋白利用葡萄糖降低运动作为通过糖酵解促进葡萄糖吸收和ATP生成的刺激剂的有效性,对血糖控制和再生的负面影响肌肉质量。年龄增加诱导NT5C2表达可能是与年龄有关的一种解释AMPK活性降低,这可能是减少线粒体的重要因素与衰老有关的功能。 NT5C2的沉默在培养的人肌管中的表达增加了AMP / ATP比和AMPK活性以及促进棕榈酸氧化和葡萄糖转运,以及内源性NT5C2的表达已知可抑制基础脂质氧化和葡萄糖在骨骼肌中的运输。AMPK似乎通过以下方式调节GLUT4的表达HDAC4 / 5-MEF2轴,在这项研究中,我们检测到HDAC4的表达随年龄。调节GLUT4水平的重要性这项研究支持骨骼肌中的AMPK,表明NT5C2的水平随着年龄的增长而调节,这可以通过体力来逆转。在一起,互动与年龄相关的基因表达变化之间这些关键途径可能解释了既可以在锻炼过程中为肌肉收缩产生能量,又可以在衰老的肌肉中利用循环葡萄糖。
肌肉衰老和身体能力
令人惊讶的是,我们发现与这两个基因相关的基因老化和物理容量在很大程度上抵消了。的呈现的数据从而支持保持较高水平的努力人口老龄化的身体适应能力,以抵消对线粒体功能的负面影响。特别是,我们假设SOCS2和FEZ2与年龄BMI和身体机能显着相关,并且在BMI和年龄方面朝着相同的方向发展,但在相反的方向,以增加体力,有链接这三个过程的关键监管功能因素。 SOCS2与激活的IGF1R强烈相互作用并可能在IGF1受体信号传导中起调节作用。年龄相关差异的mRNA水平以前曾在肌肉中证明过SOCS2建议在其中反映出对图3人体骨骼肌衰老的主要新陈代谢作用示意图。主观选择的一组效应子和调节子显示了与957个年龄相关的基因的基因,并显示了其随着年龄增长的调控方向Su等。 Skeletal Muscle(2015)生长激素的作用。同样,抵抗运动的急性发作能够使人骨骼肌中的SOCS2上调。就我们所知,FEZ2是新的与年龄相关的基因,其表达在相反方向上具有物理能力。
结论
我们表明,通过人工策划,可以提高测序数据的可组合性,得出了迄今为止最大的人类骨骼肌衰老研究。 这个骨骼肌综合数据集可公开获得,并有进一步研究的申请对骨骼肌转录调控的影响生理和生物学问题的数量。 总体而言,我们的结果描绘出了许多复杂的情况与年龄有关的途径会影响广泛的基础细胞过程。 这些结果支持线粒体功能障碍是一个主要的年龄相关因素并强调保持预防与年龄有关的高身体能力肌肉减少症。
网友评论