美文网首页GWAS分析群体遗传学
使用tassel和haploview进行GWAS

使用tassel和haploview进行GWAS

作者: 灵动的小猪 | 来源:发表于2018-09-19 19:49 被阅读366次

    在植物的QTL定位最后阶段,会把QTL定位到一个很小的区间,这里面可能有几个候选基因,如何进行下一步的分析是个很头疼的问题,这其中一个办法就是使用自然群体进行关联分析(GWAS),得到群体中这些基因的DNA序列和promter序列,然后根据表型进行GWAS,下面简单的介绍一下相关的步骤:

    1、提取材料的DNA

    根据自己的研究使用适当的方法提取DNA,常用的方法有SDS,SLS,CTAB法。

    2、设计引物

    根据基因的长度将基因分为若干份,推荐一段为1500bp左右,因为下一步测序时使用的是一代测序技术,他的一个反应可以测800bp左右,这样正反两个方向就是1600bp,你还得保证两段有50--100bp的overlap,便于下一步的拼接。而设计引物直接在NCBI上使用primer-blast就可以了,一段序列一次最好设计两对引物,提高效率。

    3、基因的扩增

    通常情况下使用PCR产物进行测序得到的序列就可以进行下一步的分析,因为你要扩增的是大量的材料,一两次的突变在之后的分析中可以过滤掉。

    4、序列的拼接

    将多端的序列进行拼接,在拼接时可以提供一个参考序列一起进行拼接,保证拼接的准确性。

    5、数据的预处理

    在去GWAS分析之前,需要对数据进行预处理,保证软件能够识别

    • 基因型数据
      将拼接好的数据保存为fasta格式的文件,序列的名称修改好,使得以后能够知道这段序列来自哪个材料。然后使用MEGA-X对序列进行比对,将比对结果保存为fasta格式的文件。
    #类似的结果
    >file1
    ATCGATCGATCG----ACGT
    >file2
    ATCGATCG--CG----ACGT
    >file3
    ATCGATCGATCGATCGACGT
    
    • 表型数据
      表型数据中,每个性状为一列,每个材料为一行,缺失的以NaN表示
      表型数据

    6、使用tassel进行GWAS

    打开tassel软件,点击file来打开表型数据和基因型数据,然后对基因型进行过滤filter-sites,设置一定的阈值,得到过滤后的数据进行PCA分析和kinship分析,将基因型数据、表型数据和PCA结果整合为一个结果,然后和kinship结果一起使用MLM模型进行分析,最后对结果画manhattan图,也可以使用R进行绘图。保存结果数据时,保存为plink格式的结果。

    7、使用[haploview]进行单倍型分析

    首先是就是对plink格式文件进行修改,将map文件的第一列和第三列删除,并把文件后缀map给为info,然后将ped文件的第二列复制到第一列,第3、4、5、6的数据改为0、0、0、1,将碱基缺失的(即文件中的 - 改为 N )。
    打开haploview软件,以linkage format格式输入。

    对结果的解读根据自己的实际情况进行分析。

    参考:

    命令行中tassel的使用
    批量修改文件后缀名
    LD衰减距离--haploview

    相关文章

      网友评论

        本文标题:使用tassel和haploview进行GWAS

        本文链接:https://www.haomeiwen.com/subject/psoinftx.html