运行structure时同一个k,会有多个run,使用clumpp软件可分析多个run,得到一个结果。配置输入文件后,在win下或命令行运行即可得到输出文件。
4 Input files
需要读取参数文件,及qmatrices(structure harvest可直接获得每个k值的对应文件)
4.1 paranfile
参数文件,参数文件参数可被命令行命令参数代替。
软件一次运行只能对个体或种群进行计算,选定DATETYTE

4.2 indfile
CLUMPP的个体和群体输入文件不同,
在 paranfile 表明输入文件 及输入文件类型(Datatype,设置DATATYPE = 0,)具体含义,从注释中可以看明白。每个k的run中的个体顺序应一致。Clumpp indfile与distruct indfile_indivq一样。

4.3 popfile
参数文件中需设置DATATYPE=1。文件内容含义,与idstruct中Popfile一致。

4.4 permutation file
不同run的不同排列也会造成结果的差异。使用Greedy or the LargeKGreedy 时,需指定permutation file。
5 Usage options
大写参数 后一个多个空格,后参数值。miscfile为此次运行后的output的使用参数
5.1 Main parameters
DATATYPE(int)
: 0 为 individual q-matrices, 1为population q-matrices
INDFILE(string)
:individual q-matrices 文件名字,需要 DATATYPE=0
POPFILE(string)
:population q-matrices文件名字,需要 DATATYPE=1
OUTFILE (string)
:输出文件。所有runs的平均 q-matrices
MISCFILE(string)
: 输出此次运行CLUMPP的参数
M(int)
: 需要使用的比对算法,
W(boolean)
: 针对POPFILE的参数,
K (int)
:Number of clusters, DATATYPE为0时,填写个体数量,DATATYPE为1时填写种群数量(K值)。
5.2 Additional parameters for the Greedy and LargeKGreedy algorithms
GREEDY OPTION (int)
:需要M = 2 or M = 3。为1-测试所有可能的order, 为2-测试随机次数的order, 为3-使用自己预设的order。
REPEATS (int)
: GREEDY OPTION 为2
时, REPEATS为随机次数GREEDY OPTION 为3
时,REPEATS为自己预设的order次数。GREEDY OPTION 为1
时,REPEATS 无意义
PERMUTATIONFILE (string)
:4.4 permutationfle 文件,需要 M = 2 or M = 3 together with GREEDY OPTION = 3。
5.3 Optional outputs
PRINT PERMUTED DATA (int)
:0 不打印输入的矩阵,1 打印输入文件的矩阵到一个文件,2 打印输入文件中不同矩阵到不同文件。
PERMUTED DATAFILE (string)
: 没看懂
PRINT EVERY PERM (boolean)
:为1时,打印每次测试的run order。为0时,不打印这些信息
EVERY PERMFILE (string)
:打印每次测试的run order到某个文件
,需要PRINT EVERY PERM = 1。
PRINT RANDOM INPUTORDER (boolean)
:为1时,打印所有随机run order。为0时,不打印。 需要 GREEDY ORDER = 2
RANDOM INPUTORDERFILE (string)
:随机order打印到某个文件,需要GREEDY ORDER = 2 and PRINT RANDOM INPUTORDER = 1。
5.4 Advanced options
OVERRIDE WARNINGS (boolean)
: 为0时,打印warnings 到屏幕。为1时,不打印warnings。
ORDER BY RUN (integer)
:没看懂。
6 Output files
out file and misc file是每次运行都会生成的结果文件。0
6.1 outfile
软件输出的文件,也是distruct的输入文件
6.2 miscfile
运行软件使用的参数,输出到文件
6.3 permuted data file
使用K=5 测试,需要很久很久,完全不知道是停止运行还是正在运行,可能需要更改M参数,选择其他方法。需要更改M
,GREEDY_OPTION
,及 REPEATS
参数。选择FullSearch
方法会产生很大的REPEATS 执行。
网友评论