DNA的甲基化往往与基因的转录活性成反比,所以DNA的甲基化程度势必会影响基因的表达水平,进而影响基因的功能。今天我们就来看看如何将甲基化数据和基因表达水平数据进行整合分析。
在次之前呢,需要先给大家说一下甲基化驱动基因(methylation-driven genes)的概念,如一个基因在癌症样本中相比正常样本低表达,而该基因在癌症样本中被高度甲基化,那么该基因就是一个methylation-driven gene。以下为完整的分析流程:
该流程中在数据预处理的时候需要注意的一点是,如果甲基化数据中有正常也有癌症样本,那么就需要先计算出差异的甲基化基因,因为甲基化差异程度一般没有基因表达水平差异那么大,所以建议条件设置为:|logFC|>0, P<0.05。若甲基化数据中只有癌症样本,则可以按照以上流程进行。对筛选出的差异表达基因和甲基化基因经过相关性分析后,保留cor<-0.3,p<0.05的DNA甲基化驱动基因对。
上述筛选出的DNA甲基化驱动基因需要先经过LASSO回归初步筛选出与生存预后相关的基因,然后通过多因素Cox回归最终确定最佳的预后风险评估模型。后续可对模型中涉及的基因进行KM,ROC,相关性拟合图,甲基化程度密度度图,聚类热图,风险得分散点图等......,除此之外呢,还可以进行比如mRNA-ceRNA互作网络构建,PPI网络构建,mRNA-TF网络构建......可以根据具体的研究方向适当增加相关分析。
以上就是甲基化驱动基因的相关分析,赶快点赞,关注,转发三连。
你以为到这就完了么,当然没有。在写这边推文的时候,顺便用爬虫爬取了2020年-2021年期间有关的甲基化相关文章信息,以及文章所属的期刊信息的详情,各位老板可以了解下甲基化相关的文章发表的整体水平。留言'甲基化paper'获取数据。
爬取了共2500+篇甲基化相关文章的信息以及所属期刊的的详情,你可以在线查看,可根据关键词搜索,比如你关注某个大类学科,在Search栏中输入该学科即可查找,若想查看全文信息,可以拷贝原文链接到网页中即可打开,如果你不想在想看,也可以导出到本地慢慢看,好了,下次再见
网友评论