DEPICT实现基因优化（gene prioritization

作者: 橙子牛奶糖 | 来源:发表于2019-10-22 19:15 被阅读0次

DEPICT实现基因优化（gene prioritization
GEPIA数据库
基因ID类型
Hub 基因分析
2021-06-03 RNA剪接新模型——随机剪接位点选择模型
MaizeGDB一些有意思的功能
GO功能注释及富集分析
2021-11-26 如何下载一个基因的外显子序列
R 创建循坏变量名
RNA-seq分析（四）pathway analysis

全基因组关联分析除了找到显著的关联位点，我们还可以做基因优化、geneset富集分析、组织富集分析，下面具体讲一讲怎么利用GWAS的summary数据做这个分析。

summary数据就是关联分析的结果文件

1 软件安装前请确保需要满足的系统环境

1.1 支持Mac OS X 或者 UNIX，不支持windows系统

1.2 Java SE 6（或者更高），没有安装Java请自行安装

1.3 需要PIP

怎么确定系统有没有安装PIP呢，输入命令which pip,如果没有路径弹出，说明没有PIP，需要安装

1.4 需要Python依赖包

pip install intervaltree

或者

conda install -c conda-forge intervaltree

1.5 需要Pandas包（0.15.2或者以上版本）

pip install pandas

1.6 PLINK(1.9 版本)

1.7 python(2.7 版本)

2 下载、安装

wget http://www.broadinstitute.org/mpg/depict/depict_download/bundles/DEPICT_v1_rel194.tar.gz

tar -zxvf DEPICT_v1_rel194.tar.gz

3 测试depict能否运行

cd DEPICT

./src/python/depict.py ./example/ldl_teslovich_nature2010.cfg

如果这一步没有报错，说明环境配置没有问题，可以开始分析自己的数据啦

4 准备一份新的cfg文件

拷贝yourtrait.cfg文件

cp ldl_teslovich_nature2010.cfg yourtrait.cfg

编辑yourtrait.cfg文件

vi yourtrait.cfg

vi进去后，yourtrait.cfg文件有几处需要修改

4.1 修改summary文件，这个summary文件即为你想分析的表型关联分析文件，在这里，假定叫做yourtrait.glm.linear，注意前面要加上绝对路径

gwas_summary_statistics_file: /your/path/to/summary/file/yourtrait.glm.linear

4.2 修改输出文件名，文件名按你喜欢修改，这里依旧假定命名为yourtrait

label_for_output_files: yourtrait

4.3 修改P值名称，如果yourtrait.glm.linear的P值用P表示的话

pvalue_col_name: P

4.4 修改染色体名称，如果yourtrait.glm.linear的染色体用Chr表示的话

chr_col_name: Chr

4.4 修改位置名称，如果yourtrait.glm.linear的位置用Pos表示的话

pos_col_name: Pos

4.5 添加PLINK的绝对路径，PLINK在你系统的哪个位置就写上哪里

plink_executable: /your/path/to/plink/plink

4.6 添加plink格式的genotype数据

genotype_data_plink_prefix: /your/path/to/genotype/yourtrait_genotype

修改好以上数据后，保存退出文件:wq

5 跑数据

./src/python/depict.py yourtrait.cfg

6 生成文件

生成的文件分别为loci.txt，geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt,其中，geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt即为我们感兴趣的基因优化，geneset富集分析，组织富集分析

7 画图

Rscript ./DEPICT/src/python/tissue_plot.R ./DEPICT/example/ldl_teslovich_nature2010_tissueenrichment.txt ldl_teslovich

image

网友评论

本文标题：DEPICT实现基因优化（gene prioritization

本文链接：https://www.haomeiwen.com/subject/qpxructx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！