GWAS分析教程 | 一篇教程可以发3区SCI

作者: 小杜的生信筆記 | 来源:发表于2023-03-01 21:16 被阅读0次

GWAS - plink介绍与安装（Mac）
全基因组关联分析（GWAS）的计算原理
Meta分析选题教程新鲜出炉
FigDraw 12. SCI 文章绘图之相关性矩阵图（Corr
第1课 Python学习资料收集整理
一组有点忧郁的人像摄影
PS小教程:合成像香烟一样燃烧的手指禁烟海报（吸烟有害健康）
常用GWAS统计方法和模型简介
【GWAS】GAPIT使用教程
MOVICS系列教程(四) 示例文章解读

今天分享的是Genome-Wide Association Studies(GWAS)教程，只是发表在中科院分区3区的Int J Methods Psychiatr Res期刊中，2021年的IF为4.182。

没错，人家就是写了篇GWAS的教程，来发表3区的文章。虽然，这是在2018年发表（4年前）。可以看一下2018年该期刊的IF是2.2，2021年IF涨到了4.1。

「本论文网址：」https://onlinelibrary.wiley.com/doi/10.1002/mpr.1608

「我自己正在学GWAS的教程，那么我们就一起学习一下这篇文章的内容，我自己在这方面也是真小白。」

摘要

全基因组关联研究(GWAS)越来越受欢迎，以确定之间的关联单核苷酸多态性(SNP)和表型性状。GWAS 方法通常应用于社会科学领域。然而，统计分析将需要认真进行，并将需要使用专门的遗传学软件。本教程旨在提供进行遗传分析的指南。我们将讨论和解释关键概念，并演示如何使用通过 GitHubhttps://onlinelibrary.wiley.com/doi/10.1002/mpr.1608提供的示例脚本进行GWAS。除了说明标准GWAS之外，我们还将展示如何应用多基因风险评分(PRS)分析。PRS的目的不是识别单个SNPs，而是聚合基因组中SNPs 的信息，以提供个体水平的遗传风险评分。

GWAS的目的

全基因组关联研究的目的是鉴定单核苷酸多态性(SNP)。

需要的软件

Plink 「下载网址：」

http://zzz.bwh.harvard.edu/plink/

除了 PLINK 之外，还有许多其他用于分析SNP数据的好选择，如Genabel和SNPTEST。关于 shell 和命令行的基本介绍可以在 http://www.ee.surrey.ac.uk/teaching/unix/中找到

数据格式

PLINK 可以读取文本格式文件或二进制文件。文本PLINK数据由两个文件组成: 一个文件包含个体及其基因型的信息(* .ped)；另一个包含遗传标记的信息(* .map)

相比之下，二进制PLINK数据由三个文件组成，一个二进制文件包含单独的标识符(ID)和基因型(* .bed) ，以及两份载有个人资料的文本档案(* .fam)和遗传标记(* .bim)「见图1」

Plink命令

这里的话作者解释的使用plink的流程，详细的内容可以看文中和代码（PS：我自己也看不太懂）

分析部分，代码展示

在GitHub中作者提供GWAS的分析代码流程。主要有3个步骤，每个步骤里面都是比较详细的，具体如下。

QC OF GENETIC DATA （数据质控）

任何GWAS都应该包含的一个关键步骤是使用适当的QC。没有广泛的QC，GWAS不会产生可靠的结果，因为原始基因型数据本质上是不完善的。数据中的错误可能由于许多原因而产生，例如，由于DNA样品质量差、与阵列的DNA杂交差、基因型探针表现差以及样品混淆或污染。

我大体看一下文章给的脚本，相对还是比较详细的。但是，仍是需要有一定基础，如果是类似我这样的小白，还是操作有点困难。但是，我们先大体的了解主要的操作流程即可。

QQ-Plot

install.packages("qqman",repos="http://cran.cnr.berkeley.edu/",lib="~" ) # location of installation can be changed but has to correspond with the library location library("qqman",lib.loc="~") results_log <- read.table("logistic_results.assoc_2.logistic", head=TRUE)jpeg("QQ-Plot_logistic.jpeg")qq(results_log$P, main = "Q-Q plot of GWAS p-values : log")dev.off()results_as <- read.table("assoc_results.assoc", head=TRUE)jpeg("QQ-Plot_assoc.jpeg")qq(results_as$P, main = "Q-Q plot of GWAS p-values : log")dev.off()

「什么是QQ-plot呢？？」 即分数-分位数图（quantile-quantile plot），QQ图的主要作用是判断样本是否近似于某种型的分布，或者验证两组数据是否来自同一分布。这里的“QQ”是两个Quantiles的大写字母，即两个分位数。 [图片上传失败...(image-ddedd1-1677762793723)]

参考：https://www.jianshu.com/p/753f50e8ed4f

Manhattan_plot（曼哈顿图）

install.packages("qqman",repos="http://cran.cnr.berkeley.edu/",lib="~" ) # location of installation can be changed but has to correspond with the library location library("qqman",lib.loc="~")  results_log <- read.table("logistic_results.assoc_2.logistic", head=TRUE)jpeg("Logistic_manhattan.jpeg")manhattan(results_log,chr="CHR",bp="BP",p="P",snp="SNP", main = "Manhattan plot: logistic")dev.off()results_as <- read.table("assoc_results.assoc", head=TRUE)jpeg("assoc_manhattan.jpeg")manhattan(results_as,chr="CHR",bp="BP",p="P",snp="SNP", main = "Manhattan plot: assoc")dev.off()

关于曼哈顿图的绘制教程，可以看到这个教程https://www.jianshu.com/p/1edc44fe922f,讲述的相对比较详细，但是美化的还是得靠其他教程。

「小杜的生信筆記」，主要发表或收录生物信息学的教程，以及基于R的分析和可视化（包括数据分析，图形绘制等）；分享感兴趣的文献和学习资料!!

网友评论

本文标题：GWAS分析教程 | 一篇教程可以发3区SCI

本文链接：https://www.haomeiwen.com/subject/bwedldtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

GWAS分析教程 | 一篇教程可以发3区SCI

摘要

GWAS的目的

需要的软件

数据格式

Plink命令

分析部分，代码展示

QC OF GENETIC DATA （数据质控）

QQ-Plot

Manhattan_plot（曼哈顿图）

相关文章

GWAS - plink介绍与安装（Mac）

全基因组关联分析（GWAS）的计算原理

Meta分析选题教程新鲜出炉

FigDraw 12. SCI 文章绘图之相关性矩阵图（Corr

第1课 Python学习资料收集整理

一组有点忧郁的人像摄影

PS小教程:合成像香烟一样燃烧的手指禁烟海报（吸烟有害健康）

常用GWAS统计方法和模型简介

【GWAS】GAPIT使用教程

MOVICS系列教程(四) 示例文章解读

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读