文献链接:Single-nucleus chromatin accessibility and transcriptomic characterization of Alzheimer’s disease
发表期刊:Nature Genetics
影响因子:41.33
发表时间:2021年7月
文章亮点:作者整合晚期阿尔茨海默病 snRNA-seq 和 snATAC-seq 数据,搭建了一个完善的分析框架用于揭示 “与疾病相关的细胞特异性” 1. 顺式调节元件-靶基因对、2. 转录因子及调控靶点、3. AD风险SNPs位点的顺式调节关系、4. 单细胞共表达网络,为单细胞多组学数据发现复杂性状提供了蓝图。
1. 研究背景 与 方案设计
阿尔茨海默症(AD)等神经退行性疾病以 大量神经元丢失 为特征并伴有 胶质增生,但特定神经元和胶质细胞群在阿尔茨海默症病理生理学中的作用尚不清楚。对AD等复杂疾病的GWAS表明,很大一部分遗传风险来源于常见远端调控元件,这些调控元件通常是疾病相关组织中的细胞类型特异性区域。
样本类型:人前额叶皮层(年龄:74-90+)
实验类型:
- snATAC-seq(晚期AD 12人;健康同龄对照 8人;10x Genomics)
- snRNA-seq(晚期AD 11人;健康同龄对照 7人;10x Genomics v3)
snATAC-seq and snRNA-seq in the same samples only (not in the same nucleus)
2. 基础分析
可以说是snATAC-seq & snRNA-seq 联合分析的套路模板
2.1 细胞大类分群
snATAC-seq细胞分群:主要细胞类型数量 EX-24,076; INH-9644; ASC- 15399; MG-12232; ODC- 62253; OPC-4869(图1b),基于已知染色质可及性的启动子区域marker基因注释(图1d),作者通过chrom VAR鉴别到星形胶质细胞、兴奋性神经元和小胶质细胞存在几个TF基序在疾病组中显著富集;通过TF footprint 分析进一步发现SOX9 转录因子显著作用在少突胶质细胞
snRNA-seq细胞分群:主要细胞类型数量 EX-6,369; INH-5,962; ASC- 4,756; MG-4,126; ODC- 37,052; OPC-2,740(图1c),基于细胞类型marker gene注释(图1e)
多组学数据整合分群:由于表观基因组图谱与下游基因表达特征紧密交织在一起,作者使用Seurat的integration platform整合了snATAC-seq和snRNA-seq数据集(图1f),转录组数据和染色质开放数据都能够分别聚类到整合的UMAP图中(图1g)

2.2 细胞亚群组成差异分析
亚群细分与细胞注释:作者在snATAC-seq和snRNA-seq中发现了多个神经元和胶质细胞亚群,基于之前确定的marker基因进行了亚群注释,少突胶质细胞亚群细分依据如图2a-c
snATAC-seq细胞亚群比例差异分析:snATAC-seq疾病组MG.a和MG.b的细胞比例显著增加(图2f),两者均定位于snRNA-seq 图2g MG1(SPP1高/CD163+)
snRNA-seq细胞亚群比例差异分析:如图2g,疾病组ASC3 (GFAP high/CHI3L+)的细胞比例显著增加,ASC4(GFAP low/WIF1 +/ADAMTS17 +)显著降低,免疫少突胶质细胞ODC13比例显著增加
作者鉴定了每个cluster中晚期AD的差异可达染色质区域(DARs)和差异表达基因(DEGs),并发现远端和近端DARs的GO富集以及DEGs具有较高的cluster特异性,这可能是神经退行性变中不同细胞亚群中不同生物通路失调的基础

2.3 候选顺式调节元件分析(cCREs)
顺式调节元件(cis-regulatory element, CRE):是一类主要调节临近基因表达的非编码DNA区域,常常分布在紧邻基因的上下游或是基因的内含子区,有时也会远离基因区甚至跨越不同染色体。顺式作用元件包括启动子、增强子、沉默子等,它们的作用是参与基因表达的调控。
反式作用因子:一些蛋白质因子可通过结合顺式作用元件而调节基因转录活性,这些蛋白质因子称为反式作用因子。反式作用因子是相对于顺式作用元件而给定的概念,反映的是蛋白与核酸序列结合的特殊对应关系;转录因子是在基因表达层面,作用于转录过程而言,两者说的东西基本上是一样的。
基于同一例样本同时进行 snATAC-seq 和 snRNA-seq 的实验设计,作者期望识别出细胞类型特异性的cCREs的靶基因。然后,试图通过分别构建不同细胞类型中疾病组和对照组的顺式共可及网络(CCANs)来阐明AD晚期PFC的顺式调控结构。
2.3.1 筛选与验证:候选顺式调节元件(cCREs)
(1)寻找gl-cCREs:为了识别靶基因的cCREs,作者重点研究存在共可及性的 peak 子集(尤其那些落于启动子元件区域的peak),由此找到一系列的cCREs和候选靶基因
(2)验证gl-cCREs:将候选靶基因的表达与cCRE的染色质可及性进行关联分析,进一步验证其潜在的调控关系
(3)聚类gl-cCREs:通过NMF算法(类似PCA)来聚类gl-cCREs数据集成为一个个功能模块,用于疾病组和对照组的比较
2.3.2 晚期AD细胞类型特异性分析:候选顺式调节元件(cCREs)
作者鉴定了56,552个基因连接的候选顺式调节元件(gl-cCREs)和11,440个候选顺式调节元件(cCRE)连接的基因,绝大多数靶基因受到多于4个顺式调节元件的调控(图3a)
gl-cCREs的细胞类型特异性分析:除细胞类型特异性的gl-cCREs,大量的gl-cCRE在多种细胞类型中共享(图3b)
gl-cCREs与 snRNA-seq DEGs的重叠性分析:对于几种细胞类型,gl-cCREs与该细胞类型的marker基因集、AD疾病特异性基因集显著重叠,突出了cCREs在疾病相关基因表达变化中的关键作用(图3c)
gl-cCREs的NMF功能模块分析:可以看到不同的NMF功能模块特异性得定位于不同细胞类型(图3d),58.35%的gl-cCREs定位于内含子区域(图3e),通过检查NMF系数矩阵识别出AD疾病组与对照组存在显著差异的NMF功能模块(图3f-g)

2.4 转录因子分析
转录因子在神经发育中紧密控制着细胞的命运,与神经退行性过程有关
转录因子染色质可及性与靶基因RNA表达共分析:SPI1基序多样性仅在 MG.a 和 MG.b 显著上调,但是SPI1的靶基因却在MG1中显著下调,说明SPI1在AD晚期作为一种转录抑制因子为SPI1如何参与AD的病理生理提供了新的见解(图4a-c);NRF1 先前被认为与线粒体功能相关,而由NRF1介导的线粒体功能受损可能通过髓鞘形成的破坏导致晚期AD的神经元功能障碍,NRFI在选定的少突胶质细胞cluster中发生了失调(图4d-f)。
构建细胞类型特异性转录因子调控网络:为了进一步了解TF介导的AD晚期的基因调控,作者构建了细胞类型特异性的TF调控网络。在小胶质细胞特异性和少突胶质细胞特异性TF调节网络中,除了位于已知AD GWAS位点的基因外,发现了多个AD DEGs,由小胶质细胞中的SPI1和少突胶质细胞中的NRF1调节。

3. 疾病相关细胞亚群分析
为了进一步揭示驱动AD疾病组胶质细胞异质性的分子机制,作者进一步分析3种胶质细胞(少突胶质细胞,小胶质细胞,星形胶质细胞),将其snATAC-seq 和 snRNA-seq 数据整合,通过monocle3进行拟时序分析(便于在整个细胞过渡状态中观察基因表达、染色质可及性和TF基序多样性的动态变化)。
3.1 少突胶质细胞
构建拟时序轨迹:snATAC-seq 和 snRNA-seq 数据整合(图5a)
AD样本比例分析(沿轨迹):来自晚期AD样本的细胞核比例沿轨迹增加(图5b)
亚群基因表达特征分析(沿轨迹):少突胶质细胞沿轨迹表现出成熟特征。成熟的少突胶质细胞(Mature ODC)基因表达特征在轨迹末端增加; 髓鞘形成的少突胶质细胞(MF-ODC)在轨迹末端降低(图5c);新形成的少突胶质细胞(NF-ODC)沿轨迹一直降低
RVAE重建的gl-cCREs染色质可及性和t-DEGs基因表达分析(沿轨迹):轨迹末端显示出大量的染色质重塑和转录重编程特征,这可能是少突胶质细胞成熟的基础(图5d)
强调2个AD相关的转录因子:少突胶质细胞中仅表现于拟时序轨迹尾端的feature(t-DEG 或 gl-cCRE)使用黄色(trajectory end)标记;仅表现于AD样本组的feature(t-DEG 或 gl-cCRE)用粉色点标记(图5e)。作者展示少突胶质细胞的2个关键转录因子, NRF1和固醇调节元件结合转录因子1(SREBF1)。晚期AD组的少突胶质细胞中NRF1基序的多样性上调,而SREBF1基序多样性随着疾病的变化下调。靶基因激活或抑制如图5f,作者发现 NRF1在拟时序轨迹的末端与靶基因呈负相关,而SREBF1在轨迹的开始和结束都与靶基因呈正相关,说明SREBF1在整个轨迹中作为转录激活因子

3.2 小胶质细胞
构建拟时序轨迹:snATAC-seq 和 snRNA-seq 小胶质细胞数据整合(图6a)
AD样本比例分析(沿轨迹):来自晚期AD样本的细胞核比例沿轨迹增加(图6b)
亚群基因表达特征分析(沿轨迹):细胞轨迹显示稳态信号的减少,TREM2非依赖性阶段疾病相关小胶质细胞(DAM)信号的增加和TREM2依赖性阶段DAM信号明显整体耗竭,表明这种小胶质细胞轨迹描述了从稳态向疾病相关细胞状态转变过程中的转录和表观遗传变化(图6c)
RVAE重建的gl-cCREs染色质可及性和t-DEGs基因表达分析(沿轨迹):使用RVAE分别对9163个小胶质细胞gl-cCREs和2138个小胶质细胞t-DEGs的染色质可及性和基因表达动态进行了建模(图6d-e)
强调2个AD相关的转录因子:SPI1 和 ETV5,它们在AD晚期中均显示基序多样性上调(图6f)。但是SPI1基序轨迹与轨迹末端的基因表达呈负相关,说明SPI1在晚期AD中作为抑制因子存在

3.3 星形胶质细胞
构建拟时序轨迹:snATAC-seq 和 snRNA-seq 星形胶质细胞数据整合(图6g)
AD样本比例分析(沿轨迹):来自晚期AD样本的细胞核比例沿轨迹增加(图6h)
亚群基因表达特征分析(沿轨迹):轨迹遵循从低GFAP 状态到高GFAP 状态和类疾病相关星形胶质细胞(DAA)的趋势(图6i)
RVAE重建的gl-cCREs染色质可及性和t-DEGs基因表达分析(沿轨迹):对12487个星形胶质细胞gl-cCREs和1797个星形胶质细胞t-DEGs进行RVAE建模,发现整个轨迹具有丰富的基因调控动态(图6j-k)
强调2个AD相关的转录因子:CCCTC结合因子(CTCF)和FOSL2,它们在AD晚期中分别显示基序多样性下调和上调(图6f)。CTCF Motif多样性变化轨迹与DAA和高GFAP 信号(轨迹终点)以及轨迹的GFAP 低相位中的t-DEGs正相关(图6l)。或者,FOSL2的基序变异轨迹与GFAP-high和DAA基因呈正相关,与轨迹末端的基因呈正相关(图6l)。这些结果表明FOSL2可能是DAA信号的激活剂,而CTCF可能促进更稳定或无疾病的星形胶质细胞状态。
4. 其他分析
如果想要再深入挖掘,snATAC-seq可以 联合已经发表的GWAS数据 ;snRNA-seq可以做 scWGNCA的单细胞共表达网络
4.1 AD遗传风险位点的细胞类型特异性顺式调控
细胞类型特异性连锁不平衡评分回归(LDSC)分析:为了进一步了解AD遗传风险信号,作者对AD和其他相关性状进行了GWAS汇总统计,对snATAC-seq聚类进行了细胞类型特异性连锁不平衡评分回归(LDSC)分析显示,5个小胶质细胞cluster对多个已发表研究中AD相关GWAS SNPs显著富集(图7a)
AD相关SNPs风险信号分析(沿轨迹):沿小胶质细胞拟时间轨迹,观察到整个小胶质细胞轨迹的远端峰显著增加,而基因近端峰分析显著下降,突出了AD相关SNPs显著作用于疾病相关小胶质细胞的远端增强子(图7b-c)
染色质可及性图与染色质可及性信号和GWAS统计数据叠加: 作者揭示了GWAS基因中疾病变异破坏的顺式调节关系,如BIN1、ADAM10、APOE和SCL24A4(图7d-i)。作者认为APOE是主要的AD遗传决定因素,其在疾病组的小胶质细胞和星形胶质细胞中产生顺式调节染色质网络的改变,强调cCREs可以作为候选基因通过基因编辑技术做进一步研究

4.2 scWGNCA的单细胞共表达网络
scWGCNA定义:加权基因相关网络分析(WGCNA)可用于查找在表达特性上高度相关基因的聚类(模块),使用模块特征基因(egingene)或hub基因将模块彼此关联并与样本性状相关联,可以用来鉴定候补生物标记基因或治疗靶点。由于单细胞数据具有细胞、亚群、细胞类型、样本等维度的分类,所以scWGCNA分析仅需要在WGCNA基础上对单细胞数据预处理,根据细胞相似性进行分群和细胞注释,然后针对性的对目标亚群或者与研究目的相关的细胞类型进行WGCNA分析。
scWGCNA分析:通过对少突胶质细胞的scWGCNA分析;作者发现了四个与AD诊断显著相关的共表达模块——OM1、OM2、OM4和OM5(图8a-b)。其中三个少突胶质细胞模块显著富集了SREBF1的靶点,这表明SREBF1在调控这些模块的基因表达中的重要性(图8c)
结果验证:作者发现在早期和晚期AD病例中,SREBF1模块特征基因表达在蛋白和RNA水平下调(图8d),同时snATAC-seq数据中SREBF1基序多样性的下调也对此再次验证。通过RNA原位杂交和免疫组化验证了SREBF1在晚期AD中的下调,发现在晚期AD中ACSL4表达下降,这是编码ChIP-seq数据中SCSF4的靶点之一(图8e-g)。

总的来说,共表达网络分析方法有助于识别细胞类型特异性疾病生物学,作者强调了少突胶质细胞中的TF SREBF1,这在AD的背景下尚未被研究,以证明其方法用于挖掘的疾病新见解的能力。
5. 内容总结
作者共计获得晚期阿尔茨海默病191,890个单核scRNA-seq 和 scATAC-seq 数据:
- 揭示了潜在的与疾病相关的细胞特异性顺式调节元件与其潜在靶基因,如APOE、CLU与少突细胞的调节模块有关
- 神经胶质群体的轨迹分析确定了与疾病相关的转录因子,如SREBF1及其调控靶点
- 通过全基因组关联研究(GWAS)描述了不同细胞类型在阿尔茨海默病风险位点的顺式调节关系
总之,该研究阐明了阿尔茨海默症的基因调控前景,强调了胶质细胞在阿尔茨海默症病理生理学中的作用,并确定了少突胶质细胞中SREBF1 等基因的调控机制,为利用单细胞多组学数据发现复杂性状提供了蓝图。
网友评论