1.准备文件
即要是1,2是一对串联重复,就将其放在一个文件内。
在上一步获得的文件,一对重复基因是一行,所以我们就将两列一行转为一列两行,并以两行为准分割文件,最后利用生成的文件将序列提取出来。
$for i in repeat_gene_id; do awk '{print $0}' $i |xargs -n1 >$i.bed; done
split -l2 $I.bed
$seqkit grep -f 分割出来的文件 cds_hits > 分割出来的文件.fa
2.计算Kaks值
计算kaks值之前需要将序列比对。kaks自带了将aln文件改为axt文件。
## 转换格式
$~biosoft/KAKS_Calculator/KaKs_Calculator2.0/src/AXTConvertor xaa.aln xaa.axt
报错
打开这个axt文件,文件末尾会发现gap和别的比对上了。把多余的A及gap删掉。
修改之后
再次运行
结果文件
网友评论