PLINK+TASSEL做GWAS+Post-GWAS分析

作者: Hello育种 | 来源:发表于2021-10-13 01:35 被阅读0次

    此视频来自B站,是非常好和全的的一个GWAS操作的视频,从开始准备软件下载,数据过滤,到最后的候选基因注释。
    GWAS的实战视频
    https://www.bilibili.com/video/BV1f44y1t7Jk?from=search&seid=12908459299918140554&spm_id_from=333.337.0.0

    LD


    image.png

    流程:


    image.png image.png

    怎么安装软件:


    image.png image.png

    VCF格式1:不需要填充:


    image.png

    VCF格式2(原始):需要处理:


    image.png
    首先基因型填充
    image.png

    填充后(PLNIK):


    image.png image.png image.png

    admixture: k = 1-13


    image.png

    根据VC,选取使用P文件


    image.png

    TASSEL:亲缘关系:


    image.png

    hapmap格式文件:


    image.png

    以下都为:TASSEL
    VCF转为hapmap:

    image.png

    GLM使用时,要去除群体结构文件中的最后一列,需要保证三列和小于1.表型文件并且admiture的文件,在表型最前面加如covriances。


    image.png

    MLM加入亲缘关系:


    image.png

    表型数据中为单个表型:两列

    安装R包


    image.png

    普通曼哈顿图:


    image.png image.png

    CMplot:


    image.png

    RColorBrewer包调控颜色:


    image.png

    筛选显著值:第二:峰中的其他位点是受最大的影响,所以进行clump清理,根据LD值处理。


    image.png

    染色体注释
    上下100kb进行注释。
    准备基因位置文件:


    image.png

    基因功能注释文件:


    image.png

    输入文件:


    image.png

    使用perl进行注释:
    先基因定位:


    image.png
    image.png

    再对基因进行功能注释:


    image.png

    有重复的需要删除。

    对结果再行筛选
    Camoco预测候选基因。安装软件


    image.png

    构建数据库


    image.png
    Camoco的文章:
    image.png

    建立参考基因组:


    image.png image.png

    GFF文件格式:


    image.png image.png

    需要将csv格式,使用最后代码将数据分开。
    根系文件:


    image.png

    GO


    image.png

    计算:


    image.png

    test.txt


    image.png

    再进行GO富集分析,网站直接进行。

    区段关联分析

    image.png

    PLINK(文件格式转换)和TASSEL(关联分析)进行(windows版本)。


    image.png

    VCF(基因文件)改为ped,map


    image.png image.png

    首先确定基因的目标区段:annotation文件:


    image.png

    从基因里查出内部及上下游50k的所得SNP


    image.png

    导入基因型:


    image.png

    关联分析:数据筛选


    image.png

    数据整合:


    image.png

    关联分析:


    image.png

    LD 分析:


    image.png

    根据TASSEL根据选出的SNP再次进行MLM分析,得到结果后,再次进行LD分析,

    将基因型和关联分析结果导出。再使用R进行画图:
    关联结果只需要marker,POS,P值,三列。
    需要报: LDheatmap, genetics包,读数据:记得加as.is=T


    image.png

    p值转为-log10()

    image.png
    image.png

    候选基因还是很多(GWAS步骤),可以构架一个WGCNA调控网络

    基本概念:


    image.png

    主要数据:


    image.png image.png

    基本流程:输入数据
    基因表达矩阵:


    image.png

    性状矩阵(必须为数值型数据)


    image.png

    相关文章

      网友评论

        本文标题:PLINK+TASSEL做GWAS+Post-GWAS分析

        本文链接:https://www.haomeiwen.com/subject/dxacoltx.html