Journal club--中国人群DNA甲基化和吸烟的全基因组

作者: 机器人会画画 | 来源:发表于2019-08-06 14:13 被阅读0次

Journal club--中国人群DNA甲基化和吸烟的全基因组
背景：全基因组分析造血细胞中的DNA甲基化：WGBS的DNA甲基
BS-seq 分析常用图表之局部甲基化的分布
易基因 | DNA甲基化测序新技术发布：扩展重亚硫酸盐测序（XR
表观技术 | 靶基因DNA甲基化和羟甲基化测序定制精准检测
易基因｜全基因组DNA甲基化测序分析全流程
简化基因组甲基化测序
DNA甲基化标准品
易基因项目文章 | DNA(羟)甲基化研究揭示铁离子依赖表观调控
Dynamics and function of DNA met

背景：
吸烟是许多人类疾病的危险因素。DNA甲基化与吸烟有关，但中国人群吸烟的全基因组甲基化数据有限。

目标：
我们的目的是研究中国人群中与吸烟有关的表观基因组范围的甲基化。

方法：
我们使用甲基化阵列测量了来自白细胞的DNA中> 485,000个CpG位点（CpGs）的甲基化水平，并在总共596名中国参与者中进行了DNA甲基化和吸烟的全基因组荟萃分析。我们进一步评估了吸烟相关CpG与内部多环芳烃（PAH）生物标志物的关联及其与相应基因表达的相关性。

结果：
我们鉴定了318个CpGs，其甲基化水平与吸烟在全基因组水平有显着关联（错误发现率<0.05），其中注释到123个基因的161个CpGs在欧洲人和非裔美国人的近期研究中与吸烟无关。在这些与吸烟有关的CpGs中，80 CpGs的甲基化水平与相应基因（包括RUNX3，IL6R，PTAFR，ANKRD11，CEP135和CDH23）的表达显着相关，并且15 CpGs的甲基化与尿2-羟基萘显着相关，最具代表性的吸烟生物标志物是内部单羟基-PAH。

结论：
我们在中国人群中发现了与吸烟相关的DNA甲基化标记，包括一些与基因表达相关的标记。暴露于萘是烟草烟雾的副产物，可能与吸烟相关的甲基化有关。

介绍

由于直接吸烟或间接吸烟，每年有近600万人死于烟草[ 世界卫生组织（世卫组织，2014年）]。吸烟是烟草消费的主要方法，是可预防疾病（包括心血管疾病，呼吸道疾病和癌症）的主要原因（Cunningham等人2014 ; Rea等人2002 ; Sosnowski和Przewoźniak2015）和死亡率（Ezzati）和Lopez 2003 ; Mathers和Loncar 2006）。已经在香烟烟雾中发现了各种人类致癌物，包括多环芳烃（PAHs）[ 国际癌症研究机构（IARC）2004 ;疾病控制和预防中心（CDC）2010 ; 罗德曼等人。2000年 ]。虽然吸烟对健康的不良影响已得到公认，但对其潜在的毒性机制知之甚少，特别是在分子水平上。

DNA甲基化是基因组的表观遗传修饰，参与调节基因表达和基因组稳定性（Lee和Pausova 2013）。甲基化状态可以通过遗传和环境因素进行修改，并且可以将基因和环境的影响整合到表型或疾病上（Feil和Fraga 2012 ; Schadt 2009）。先前使用靶向方法（全球甲基化和候选基因甲基化）的研究已经确定了吸烟与DNA甲基化之间的潜在联系（Furniss等人2008 ; Philibert等人2010 ; Smith等人2007）但是直到广泛使用全基因组甲基化技术才发现了数百种与吸烟有关的甲基化标记，并评估了它们与吸烟相关疾病的关系（Besingi和Johansson，2014; Breitling等，2011 ; Elliott等）人2014。 ; Harlid等人2014。 ; 茹贝尔等人2012。 ; Markunas等人2014。 ; 申科等人2013。 ; Sun等人2013。 ; 。塞林格等人2013）。以前全球范围内的吸烟甲基化分析已在欧洲人中进行过（Guida等人2015 ; Shenker等人2013 ;Zeilinger等人。2013）和非裔美国人（Dogan等人2014 ; Philibert等人2013 ; Sun等人2013）; 然而，中国这个世界上最大的卷烟生产国和客户的中等收入国家的人口尚未得到评估。
为了研究中国人群中与吸烟有关的表观基因组范围的甲基化改变，我们测量了外周血白细胞中> 485,000 CpG位点（CpGs）的DNA甲基化水平，并对DNA甲基化和吸烟进行了全基因组荟萃分析。共有596名中国参与者。此外，我们调查了吸烟相关CpGs与注释基因表达的相关性以及它们与尿液单羟基-PAH（OH-PAH）代谢物的相关性。

方法

研究参与者

在本研究中,从中国武汉和广东的焦氏联合、急性冠状动脉(ACS)患者和武汉-珠海(WHZH)队列中,对596名中国参与者进行了DNA甲基化和吸烟全基因组荟萃分析。联合(参见图 S1,了解研究的流程图)。

图1

The Coke Oven Cohort。2010年，中国武汉的焦炉厂共招募了1,628名炼焦炉工人（ Li et al.2012）。根据以下标准，我们在本研究中纳入了144名工人：* a）捐献的血液和尿液样本; b）在高三分位数中具有基线总尿OH-PAH（ΣOH-PAH）水平; c）在工厂工作超过5年; d）没有自我报告的疾病或不适; e）在基线检查后2周内没有发烧或传染病; f）过去一个月没有服用处方药; 和 g*）体重指数（BMI）为18.0-30.5。在进行甲基化和基因分型数据的质量控制后，137个个体（缩写为COW-1）保留在本研究中。

急性冠脉综合征患者。本研究还包括来自中国武汉的103名临床证实的急性冠状动脉综合征（ACS）患者（在协和医院和武汉市中心医院招募），以及来自中国广东的103名ACS患者（在宝安医院和人民医院招募）珠海）。患者* a）由专业临床医生诊断为急性心肌梗塞或不稳定型心绞痛; b）没有并发症，包括先天性心脏病，心肌病，自身免疫性疾病，急性感染，肺结核，慢性阻塞性肺病，糖尿病，严重的肾脏或肝脏疾病，甲状腺功能亢进或恶性肿瘤; 和 c*）在入院第一天的最早方便时间捐献血液样本。我们纳入了来自武汉的101名患者（缩写为ACS-1）和来自广东的97名患者（缩写为ACS-2），他们在本分析中通过了甲基化数据和基因分型数据的质量控制。

武汉 - 珠海（WHZH）队列。WHZH队列是一个以社区为基础的队列，于2011年成立，共有4,812人（武汉3,053人，珠海1,759人）在基线时被招募（ Song et al.2014）。来自* a）没有急性或慢性疾病或任何不适的所有参与者; b）临床表现出异常没有迹象; c）在基线检查后2周内没有发烧或传染病; d）过去一个月没有服用处方药; 和 ë）捐赠血液和尿液样品，共计180个武汉居民选择为ACS患者在武汉健康对照（年龄，性别和BMI匹配n* = 103）和/或健康和低PAH暴露的武汉COW控制（年龄，性别和BMI匹配，低三分位尿ΣOH-PAH，n = 144; ACS患者和COW共享64控制）。共有103名广东居民被选为广东ACS患者的健康对照（年龄，性别和BMI相匹配）。我们纳入了162名武汉居民和99名广东居民（缩写为WHZH），他们在本分析中通过了甲基化和基因分型数据的质量控制。

研究甲基化表达相关性的受试者。为了研究DNA甲基化与基因表达之间的相关性，我们在2015年4月和5月在中国十堰东风中心医院（东风汽车公司和湖北医学院）健康检查中心招募了144名参加定期健康检查的人员。所选参与者符合以下标准：* a）年龄为20至70岁; b）没有自我报告的疾病或不适; c）在基线检查后2周内没有发烧或传染病; d）过去一个月没有服用处方药; 和 e*）捐献血液和尿液样本。所有144名受试者（缩写为SY）的甲基化和表达数据通过质量控制并包括在本分析中。

我们的研究得到了同济医学院伦理委员会的批准，并获得了每位参与者的书面知情同意书。我们要求所有参与者都要消耗平淡的饮食，并在捐献血液样本前禁食至少12小时。根据相同的方案收集来自所有研究小组的生物样品，并在类似条件下储存。

实验室分析

Illumina HumanMethylation450 BeadChip。使用BioTeke Whole Blood DNA Extraction Kit（BioTeke）从全血中提取基因组DNA，然后储存在-80℃。根据制造商的说明，使用Zymo EZ DNA甲基化试剂盒（Zymo Research）将1微克的每种样品转化为亚硫酸氢盐，然后稀释至60ng /μL的浓度。使用具有4-μL亚硫酸氢盐转化的样品的HumanMethylation450 BeadChip（Illumina）在> 485,000CpG下测定DNA甲基化。

HumanHT-12 v4表达BeadChip。在采血后立即从全血中分离白细胞，并使用TRIzol®LS溶液（Invitrogen）根据制造商的说明分离血液白细胞的总RNA。根据Illumina的标准方案，使用HumanHT-12 v4 Expression BeadChip阵列，由商业公司（ETMD，Beijing，China）分析基因表达。我们使用GenomeStudio（Illumina）获得原始表达值，并使用分子量 - 分位数归一化和R 3.1.2（ R Core Team 2014）中的“beadarray”包（ Dunning等人，2007）对表达数据进行归一化。在分析之前，将所有未表达的信号指定为0。

***尿肌酐和OH-PAH测量。WHZH(宋等人,2014年)和COW(Deng等人,2014年;Li 等人 2012 年队列以前曾报告过。将所有尿液样品收集在无菌锥形管中并储存在-20℃直至进行实验室测定。PAH代谢物的鉴定和定量基于保留时间，质荷比和峰面积，使用从单独的内标溶液获得的线性回归曲线。在12种尿中OH-PAH代谢物中，有10种非致癌代谢物，包括1-羟基萘，2-羟基萘，2-羟基芴，9-羟基芴，1-羟基菲，2-羟基菲，3-羟基菲，4-羟基菲，9-羟基菲，和1-羟基芘高于定量限（LOQ），因此包括在本分析中，而2种致癌代谢物，6-羟基chrysene和3-羟基苯并[a]芘，低于LOQ（Deng et al.2014 ; Li et al.2012），因此，在本分析中未使用。将OH-PAH水平校准至尿肌酐，并以每毫摩尔肌酐的微摩尔数表示。

全基因组数据的质量控制

我们将不同平板和珠片的样本对（病株或暴露组）和匹配对照随机分组，以最大限度地减少批次效应。我们使用minfi包（Aryee等人，2014）来预处理IDAT文件。通过多维尺度（MDS）分析识别信号异常值。我们通过匹配Methylation450k Beadchips上的65个单核苷酸多态性（SNP）的基因型与从全基因组关联研究（GWAS）数据获得的相同SNP的基因型来检查潜在的样品混淆。如果它们是：a）是65-SNP探针，则排除甲基化探针; b）样品间缺失率> 20％（缺失定义如下：某样品的探针：检测p值> 0.01或珠子数<3）; 或者c）对于ASN群体的1000 Genomes Project 20110521版本中MAF> 0.05的SNP可能包含或延伸，或者与其他基因组位置交叉杂交（41,296个探针）。如果a）是MDS异常值，则排除样品; b）混合样品; c）探针间缺失率> 0.05; 或d）GWAS质量控制失败，包括意外重复或亲属（IBD分析，PI_HAT> 0.185），性别差异，杂合性异常值或个人呼叫率<0.98。过滤后，使用wateRmelon包中的dasen方法将431,369 CpGs的甲基化值标准化（Pidsley et al.2013）。在进一步分析之前，将检测p值> 0.01或珠子数<3的甲基化值指定为NA。

统计分析

DNA甲基化和吸烟的全基因组分析。在过去6个月内平均吸烟量超过1支烟的参与者被定义为当前吸烟者; 戒烟超过6个月的参与者被定义为前吸烟者; 并且从未在其一生中吸烟的参与者被归类为从不吸烟者。在过去6个月内每周饮酒1次的个人被定义为当前饮酒者; 停止饮酒超过6个月的人被定义为前饮酒者; 从未喝过酒的人被定义为从不喝酒的人。使用SVA软件包在每个小组中单独进行替代变量分析（SVA）（ Leek等人，2012）。SVA中使用的变量包括吸烟状况（分别为0,1和2，分别为从不，前者和当前吸烟者），年龄（年份，作为连续变量），性别（男性和女性编码为1和2）（分别），饮酒状态（分别为0,1和2分别表示从不，前和现在的饮酒者）和BMI（每平方米千克，作为连续变量）。替代变量（SV）可以捕获全基因组数据的主要未知变异，这些变异无法通过包含的变量来解释。使用线性回归模型在每个组中分别进行关联分析，其中包括作为因变量的反正态转换（INT）甲基化β值和作为独立变量包括的吸烟状态，年龄，性别，饮酒状态，BMI和SV。在对COW和WHZH队列的分析中，ΣOH-PAHs也作为协变量包含在模型中，因为在这两个小组中样本选择中考虑了ΣOH-PAHs。使用固定效应荟萃分析和样本大小加权法将所有四个小组的结果组合以获得p值和逆方差加权方法来获得效应大小的估计。全基因组荟萃分析的显着性阈值是错误发现率（FDR）<0.05。分析在R 3.1.2（R核心小组2014）中进行。

CpGs与基因表达的相关性。基于Illumina提供的注释文件配对CpG和表达探针，其提供关于表达探针和CpG探针的基因组位置和基因注释的信息。线性回归，其中因变量是反正态转换的表达值和独立变量是甲基化值，年龄和性别，用于估计甲基化和表达之间的关联。对于每个CpG，显着性阈值定义为相应基因的表达探针的0.05 /数目。

尿PAH代谢物和吸烟相关的甲基化改变。我们通过计算吸烟对每种OH-PAH代谢物的贡献来评估哪些尿OH-PAHs可用作吸烟暴露的代表性生物标志物[定义为* R *²的差异有和没有吸烟状态的模特之间; 其他协变量是年龄，饮酒状况，BMI，职业，地理区域和珠子片操作日期（地理区域分别为武汉和广东分别为1和2）]使用WHZH队列男性的线性回归模型。在来自WHZH队列和焦炉组的男性中分别分析吸烟相关CpG的甲基化值与尿2-羟基萘水平之间的关联。进行调解分析以评估2-羟基萘是否显示吸烟对WHZH队列男性甲基化改变的调节作用，并调整年龄，饮酒状态，BMI，职业，差异白细胞比例，地理区域和珠子片操作日期（Valeri和Vanderweele 2013）。关联分析在R 3.1.2（R Core Team 2014）中进行，并且中介分析在SAS 9.2（SAS Institute Inc.）中进行。

Results

参与者的基本特征

全基因组荟萃分析共纳入596名来自中国的参与者，其中包括137名焦炉工人（107名男性;平均年龄= 46.51岁），198名ACS患者（其中101名来自武汉，男性81名，平均年龄为广东省58.96岁，广东省97人，男性78人，平均年龄59.37岁），WHZH队列261名社区居民（男性206人，平均年龄53.84岁）。研究人群的特征总结在表1中。
表格1
研究参与者的特征（n或平均值±SD）。

特点 DNA甲基化和吸烟的全基因组荟萃分析用于甲基化 - 表达关联分析的数据集

表格1

缩写：ACS-1，来自武汉的ACS患者; ACS-2，来自广东的ACS患者; COW-1，来自可口可乐烤箱队列的参与者; SY，在十堰定期参加健康检查的人; WHZH，居民选自武汉 - 珠海队列。a中间细胞定义为单核细胞，嗜酸性粒细胞和嗜碱性粒细胞的总和。

DNA甲基化和吸烟的全基因组分析

在我们的全基因组甲基化荟萃分析中，我们鉴定了318个CpG，其甲基化水平与全基因组显着性水平的吸烟相关（FDR <0.05，图1）。其中，在欧洲人的甲基化和吸烟的先前全基因组研究中，没有报告注释到123个基因的161个CpG与吸烟显着相关（Guida等人2015 ; Shenker等人2013 ; Zeilinger等人2013）或在非裔美国人中（Dogan等人，2014 ; Philibert等人，2013 ; Sun等人，2013）（见表S1）。

TABLE S1
缩写:Chr,染色体;UTR,未翻译区域;身体,基因体;第1次,第一个外向;TSS200,距离转录起始站点200个基点以内;TSS1500,距离转录起始站点1500bps以内。
a 固定效果元分析,用样本大小加权方法获取 p 值,采用逆方差加权方法获取效果大小的估计值。b 以DNA甲基化水平为因变量,以吸烟状态为因变量,调整微阵列、样品在微阵列和血细胞组合上的位置的线性模型(Guida等人,2015年)。c 线性混合模型以甲基化β值为因变量,当前吸烟者和包装年为主要独立变量,根据年龄和性别进行调整(Sun等人,2013年)。d 在以前关于欧洲人甲基化和吸烟的全基因组研究中未报告与吸烟有显著关联的CpGs(Guida等人,2015年;Shenker等人,2013年;Zeilinger等人,2013年)或非洲裔美国人(多根等人2014年;菲利伯特等人2013年;Sun等人,2013年)。
• 邦费罗尼 p = 0.05。• 邦费罗尼 p = 0.05 或 FDR ±0.05

表2列出了前40名吸烟相关CpGs（FDR <0.01）的关联结果表S2中列出了每个小组中318个吸烟相关CpG的关联结果。

对于318 CpG中的大部分，我们观察到甲基化水平从无到现在的吸烟者到当前吸烟者的渐变改变趋势; 从现在的吸烟者到不吸烟者的甲基化改变大于从前吸烟者到不吸烟者的改变（参见表S3）。

TABLE S3

a通过调整年龄，饮酒状况，BMI，疾病状态，地理区域的线性回归模型计算估计值，
差异白细胞比例和珠芯片操作日期。

图1

在全基因组荟萃分析中，曼哈顿情节和QQ图表中甲基化和吸烟之间关联的p值。在曼哈顿图中，X轴表示的CpG的基因组位置，所述ÿ轴表示-log10（p关联的-值），红色线表示-log（p在假发现率-值）（ FDR）= 0.05。在QQ图中，x轴表示预期的-log10（p值），而y轴表示观察到的-log10（p值）。
表2
在全基因组荟萃分析中，40个CpGs与吸烟有关（FDR <0.01）。

表2

缩写：身体，基因体; Chr，染色体; FDR，错误发现率; TSS200，转录起始位点200 bps以内; TSS1500，距离转录起始位点1,500 bps; UTR，非翻译区域。a基于反正态转换的甲基化值计算估计值。固定效应荟萃分析与样本大小加权方法一起使用以获得p值并且使用逆方差加权方法来获得效应大小的估计。

与注释基因表达的相关性

我们进一步研究了吸烟相关CpG的甲基化值是否与144个健康个体的独立组中相应基因的表达相关，其中甲基化组和基因表达谱均被测量（表1）。318个吸烟相关的CpG中有77个被排除在分析之外，因为没有为基因设计表达探针或因为血液白细胞中的低表达率。在剩余的241个CpG（总共414个CpG表达探针对）中，对于注释基因具有合格的表达数据，我们观察到80 CpGs的甲基化水平与其相应基因的表达相关（p <0.05 /相应基因的表达探针;例如，在体内RUNX3，对于cg10951873和ILMN_1787461 ，p = 1.57×10 ^-7 ; 在IL6R的主体上，对于cg09257526和ILMN_1696394，p = 1.98×10 ^-9，对于cg09257526和ILMN_1754753，p = 5.61×10 ^-6 ; 在距离CEP135的转录起始位点1,500 bps内，对于cg26542660和ILMN_1693766 ，p = 1.82×10 ^-2 ; 在所述主体的CDH23，p = 9.45×10 ^-3用于cg10750182和ILMN_1779934; 在距离PTAFR的转录起始位点1,500 bps内，p = 2.07×10^-16 for cg20460771和ILMN_1746836; 在ANKRD11的5'非翻译区中，对于cg01107178和ILMN_2108709 ，p = 1.03×10 ^-8（参见表S4）。

TABLE S4

缩写：Chr，染色体; 身体，基因体; TSS200，转录起始位点200 bps以内; 来自转录起始网站; UTR，非翻译区域。
TSS1500，1500 bps以内
对于每个CpG，显着性阈值定义为相应基因的表达探针的0.05 /数目。

吸烟相关CpGs与尿2-羟基萘的关系

由于我们研究中的大多数吸烟者是男性（98.52％）并且为了避免因职业暴露而产生的影响，因此该分析主要在来自WHZH队列的男性中进行。我们首先测试了哪种OH-PAH代谢物是最具代表性的吸烟生物标志物。我们观察到吸烟可能占尿2-羟基萘变异的18.0％，大于吸烟对其他9种OH-PAH代谢物所解释的变化（见表S5）。

表S5

OH-PAHs水平由尿肌酐校准，并表示为每OH-PAHs的微摩尔数（×10-2）为中位数（第25,75）。
模型1：线性回归模型，尿液代谢物作为因变量，年龄，饮酒，BMI，职业，地理区域珠芯片和操作日期作为自变量。尿液中多环芳烃代谢物的浓度被转化。 b模型2：在模型1c中另外包括吸烟。吸烟解释每种尿OH-PAH代谢物的方差，计算为模型2解释的方差减去模型1解释的方差。
然后我们评估了318吸烟相关CpG的甲基化水平与尿2-羟基萘水平之间的关联（见表S6），并且在进行Bonferroni校正后发现了15个显着相关性（p <1.57×10 ^-4）（图2）。当仅将分析限制于非吸烟者时，这些关联大大减弱（图2; 另见表S6），表明DNA甲基化与尿2-羟基萘之间的相关性主要归因于吸烟。我们进一步研究了2-羟基萘是否可能是这些吸烟诱导的甲基化改变的介质，并发现在与2-羟基萘相关的15个CpG中，12个CpGs的吸烟相关甲基化变异（包括cg05575921，cg23916896，cg24090911和cg26703534）在AHRR上）可能部分地由它们与尿2-羟基萘水平的关联介导（p <0.05）（表3）。

图2

来自武汉 - 珠海（WHZH）队列和焦炉组的男性中15种与吸烟有关的CpG和尿2-羟基萘水平的关联。

表3
对来自武汉 - 珠海（WHZH）队列的男性甲基化水平与尿2-羟基萘相关的15种重要CpGs进行了中介分析。

表3
在SAS 9.2（SAS Institute Inc.）的调解宏中调整年龄，饮酒状态，体重指数，职业，差异白细胞比例，地理区域和珠子片操作日期：％宏调解（数据=，yvar =，avar） =，mvar =，cvar =，a0 =，a1 =，m =，nc =，yreg =，mreg =，Interaction =，casecontrol = false，output = reduced，c =，boot =）（Valeri和Vanderweele 2013）。甲基化值进行反向 - 正常转化，并且尿2-羟基萘的浓度是自然对数转化的。
尽管来自Coke Oven队列的受试者患有PAHs的职业暴露，但在调整1-羟基芘（一种职业暴露标记物）后，在来自Coke Oven队列的男性受试者中观察到吸烟，2-羟基萘和这些CpG的甲基化之间的类似关联模式。焦炉工人（图2 ;另见表S6）。

表S6
a通过线性回归模型计算估计值。甲基化值是反正常的
将尿2-羟基萘和1-羟基芘进行转化。 b调整年龄，饮酒状况，BMI，职业，珠子片操作日期，差异白细胞比例和地理区域。 c调整1-羟基芘，年龄，饮酒状态，BMI，珠子片操作日期，差异白细胞比例。

讨论

在本研究中，我们通过对几个中国人群中DNA甲基化的全基因组荟萃分析，确定了318个与吸烟相关的CpGs。在已确定的CpGs中，注释到123个基因的161个与最近的欧洲人研究（Guida等人2015 ; Shenker等人2013 ; Zeilinger等人2013）或非洲裔美国人（Dogan等人2014 ; Philibert）中的吸烟无关等人，2013 ; Sun等，2013）。我们还观察到一些与吸烟有关的CpGs的甲基化水平可能会影响相应基因的表达，而一些吸烟相关的甲基化改变可能部分是由于接触萘而引起的。

虽然中国是世界上最大的烟草消费国和生产国（Gu et al.2009），中国人群尚未进行DNA甲基化和吸烟的全基因组甲基化研究。本研究在中国人群中发现了318例吸烟相关的CpGs，其中157例已通过之前的甲基化研究报告，表明吸烟相关的甲基化改变在中国和西方人群中主要是一致的。之前在欧洲人或非洲裔美国人中报道的161个CpGs表明新的吸烟相关部位或中国人特有的部位，这需要通过其他中国人群的进一步研究进行复制。大多数鉴定的基因座都注释了参与吸烟释放化学物质代谢的基因[例如，AHRR是参与异生物质代谢的芳烃的核受体抑制剂（Shenker等人2013）]或可能与吸烟相关的健康影响[例如，F2RL3的甲基化调节吸烟的有害影响并且是相关的冠心病引起的死亡率（Breitling等，2012 ; Zhang等，2014）]。

DNA甲基化可能是吸烟与人类疾病之间的潜在联系。在本研究中，与吸烟有关的甲基化改变对RUNX3，IL6R，PTAFR，和ANKRD11（心血管相关基因）和CEP135和CDH23（癌症相关基因）对应于增加的基因表达。RUNX3编码包含runt结构域的转录因子家族的成员，其可能在先天和适应性免疫细胞类型中具有重要功能，并且可能与几种炎症相关疾病相关（Lotem等人2015））。白细胞介素6是一种细胞因子，在炎症反应中具有重要作用，其调节异常与许多健康问题有关（Ferreira等，2013）。PTAFR编码血小板活化因子（PAF）受体，其在促炎过程中起重要作用（Ninio等，2004）。除了它们在止血和血栓形成中的关键作用外，血小板还参与调节炎症和免疫反应（von Hundelshausen和Weber，2007）。ANKRD11可能参与凋亡途径（例如，p53信号传导）（Lim等人，2012 ; Neilsen等人，2008）据报道，它们在心血管疾病的发病机制中起着关键作用（Lee和Gustafsson 2009）。据推测，吸烟引起的异常生理过程可能是心血管疾病发展的重要机制（Frostegård2013）。我们的研究结果表明，吸烟与心血管相关基因的甲基化相关，这些基因与相应的表达相关，这表明DNA甲基化可能通过吸烟诱导的免疫反应，炎症反应和细胞凋亡促进疾病进展。

CEP135编码中心体蛋白，其在早期中心粒生物发生过程中充当支架蛋白（Kim等人，2008）。中心体在许多过程中起着至关重要的作用（包括组织有丝分裂纺锤体极），中心体畸变（Nigg 2002）包含在许多人类肿瘤中（Rusan和Peifer，2007）。值得注意的是，已经在烟草 - 烟雾冷凝物中鉴定出抗有丝分裂化合物，并且吸烟可以诱导有丝分裂异常（Qiao等人，2003 ; Vogt Isaksen，2004）。CDH23编码钙粘蛋白23，其作为细胞间连接和细胞分化和细胞迁移的介质（Agarwal 2014））。以前的研究表明，CDH23在乳腺癌组织中上调，并参与转移性过程（Binai等人2013）。最近的证据表明，主动吸烟在乳腺癌中起着潜在的因果作用（Reynolds等，2009）。吸烟也是许多癌症（例如，肺癌，结肠癌和胃癌）的明确原因（Gandini等人，2008）。因此，甲基化改变可能是吸烟引起的不良反应和癌症的潜在机制。

吸烟是PAH暴露的主要来源，特别是萘暴露（Ding等人2005 ; Jacob等人2013）。我们估计吸烟占WHZH队列中男性尿2-羟基萘变异的18.0％，这有助于进一步研究尿2-羟基萘作为内源暴露于吸烟源PAHs的可能生物标志物。吸烟相关的AHRR甲基化改变可能是由PAHs暴露引起的（Shenker等，2013）。AHRR编码芳烃受体（AhR）的阻遏物（Harlid等，2014）。以前的研究表明，AhR途径在各种异生素（包括PAHs）的代谢中很重要（Zeilinger等人，2013），并且因接触吸烟而被修改（Besingi和Johansson，2014）。我们目前的数据表明，吸烟释放的萘可能通过改变AhR途径中重要基因的甲基化水平来改变AhR途径。

不同的细胞和组织具有不同的DNA甲基化特征（Ohgane等人，2008）。在本研究中使用外周血DNA是合理的，原因有两个。首先，外周血是许多吸收到人体内的异生素的重要载体（Barr等，2007）; 外周血细胞与内部形式的异生素直接接触并对它们起反应（Bonassi等，2007）。其次，血液样本在大规模研究中最方便收集，使用血细胞可以将我们的结果与其他研究的结果进行比较。使用血液白细胞作为甲基化分析的DNA来源的局限性在于白细胞亚型之间的甲基化不同，并且白细胞亚型的分布可能随暴露而变化，从而导致暴露与甲基化之间的关联可能混淆（Reinius等.2012）。正如之前的一项研究所表明的那样，基于因子的“批量”校正方法（如替代变量分析）不仅可以控制批次效应，还可以根据经验估计和控制细胞类型的成分（Jaffe和Irizarry 2014）），我们在全基因组甲基化分析中采用了替代变量来同时限制批次和细胞组合物的影响。在研究与吸烟有关的CpG与尿2-羟基萘之间的关联时，我们在分析模型中调整了差异性白细胞比例。然而，我们不能排除与白细胞亚型变异或其他因素相关的残留混杂的可能性。此外，鉴于横断面研究设计，我们无法建立吸烟与DNA甲基化之间的时间关系。

结论

在中国人群中吸烟和DNA甲基化的全基因组分析的基础上，我们确定了318个与吸烟有关的CpGs，其中161个CpGs注释到123个基因，此前在欧洲人或非洲裔美国人中尚未报道过。一些与吸烟有关的CpG可能在基因调控中发挥作用。我们还发现萘可能是吸烟释放的化学物质之一，诱导我们在吸烟者中观察到的甲基化改变。需要进一步的研究来复制我们的研究结果，确定它们与健康结果的潜在相关性，并阐明将吸烟与DNA甲基化联系起来的潜在机制。
单击此处获取其他数据文件。^{（2.7M，pdf）}

Journal club--中国人群DNA甲基化和吸烟的全基因组
背景：吸烟是许多人类疾病的危险因素。DNA甲基化与吸烟有关，但中国人群吸烟的全基因组甲基化数据有限。目标：我们的...
背景：全基因组分析造血细胞中的DNA甲基化：WGBS的DNA甲基
全基因组分析造血细胞中的DNA甲基化：WGBS的DNA甲基化分析 First Online: 23 July 20...
BS-seq 分析常用图表之局部甲基化的分布
前面我们讲过了，DNA甲基化数据分析全基因组可视化的几种常见图形 BS-seq 分析常用图表之全基因组甲基化的分布...
易基因 | DNA甲基化测序新技术发布：扩展重亚硫酸盐测序（XR
DNA甲基化是最早被发现、也是研究最深入的表观遗传调控机制之一。目前研究中常用的DNA甲基化测序方法包括全基因组（...
表观技术 | 靶基因DNA甲基化和羟甲基化测序定制精准检测
DNA甲基化是最早被发现、也是研究最深入的表观遗传调控机制之一。目前研究中常用的DNA甲基化测序方法包括全基因组（...
易基因｜全基因组DNA甲基化测序分析全流程
全基因组DNA甲基化实验怎么做？从技术原理、建库测序流程、信息分析流程和研究套路等四方面详细介绍。一、全基因组甲...
简化基因组甲基化测序
什么是DNA甲基化？DNA methylation：指在DNA甲基化转移酶的作用下，在基因组CpG二核苷酸的胞嘧啶...
DNA甲基化标准品
DNA甲基化水平和模式的改变是肿瘤发生的一个重要因素,这些变化包括CpG岛局部的高甲基化和基因组DNA低甲基化状态...
易基因项目文章 | DNA(羟)甲基化研究揭示铁离子依赖表观调控
（羟）甲基化DNA免疫共沉淀测序（h）MeDIP-seq研究成果见刊《Journal of Clinical In...
Dynamics and function of DNA met
Abstract DNA甲基化是非常保守的表观修饰，对于基因调控及基因组稳定性十分重要异常的DNA甲基化模式会导致...