美文网首页群体遗传学
遗传多样性软件 Powermarker 使用说明

遗传多样性软件 Powermarker 使用说明

作者: EZ | 来源:发表于2020-09-04 21:04 被阅读0次

powermarker
Liu, K. and S.V. Muse, PowerMarker: an integrated analysis environment for genetic marker analysis. Bioinformatics, 2005. 21(9): p. 2128-2129.
下载地址

软件已许久没有更新,使用时需要更改电脑时间,才可以使用

案例
跟着案例操作,顺利得到个体聚类结果,看来还是得学一下ggtree

本次使用主要 是用来计算PIC 及建树
以下内容记录自手册

Chapter 2: Tutorial

2.1 Creating a project

分析前需要先建立project

2.2: Importing a dataset

(1)导入数据,从文件或剪切板,需要选择表头中名称的类型,即样本名 种群名与loci 是属于不同类型标签,样本和种群名属于 categorical type, loci属于
Marker type, 接着指定数据文件中缺失数据,比如确实等位基因为0 , 就在填写Missing allele 后填写0, 软件会将0识别为缺失数据。

导入powermarker的文本格式的格式如下,第一列,第二列为样本id及种群名称,需要在软件内选择第一列第二列属于什么内容。 image.png
(2)对导入的数据进行一定的编辑
需要选择数据中的表头类型,选择数据中sample. pop 为categorical类型,点击column下的表头然后点击下方的蓝色类型(Marker等)即可修改数据中表头类型。
txt数据导入后

(3) 其他参数

DataType默认选择第三个, unknown。Missing Values 填写数据中缺失数据的表示 ,这里我的数据中,0代表确实数据,数据读入后,会以?/?表示缺失数据 读入的结果
参数

数据导入成功后就可以进行分析

2.3: Choosing a subset from the dataset

可计算Missing proportion,并根据值筛选子集

2.4: Producing a table of summary statistics

,CERVUS软件也可以计算PIC, Powermarker 也可计算 如下其他参数

image.png
点击Analysis-Summary Statistics-General中选择需要计算的原始数据,即可得到包括PIC等参数的表格。
发现 Genalex与Powermarker的相同参数结果相同,Genalex中的Ho是 Powermarker 中的Heterozygosity, Genalex中的He 是Powermarker 中的GeneDiversity

2.4 做聚类

首先是对数据计算频率,然后计算距离,然后建树,如下图

image.png
(1)计算频率,可选择Lever,就是之后对群体或样本进行聚类。并选择数据,点击summit 计算frequency
(2) 计算距离,需选择Methods, 并选择数据,点击summit! DIstance
(3)选择建树方法,并选择数据,点击summit 建树
(4) Bootstrap
结果是一个tree list, 用 Phylip,可得到consensus tree
“”The output is a list of trees that can be summarized to obtain a consensus
tree by the program “consensus” in Phylip package (Felsenstein 1993).“”

相关文章

网友评论

    本文标题:遗传多样性软件 Powermarker 使用说明

    本文链接:https://www.haomeiwen.com/subject/bhftektx.html