美文网首页基因家族分析生信分析流程genome
基因家族分析八(计算串联重复基因KAKS值)

基因家族分析八(计算串联重复基因KAKS值)

作者: 多啦A梦的时光机_648d | 来源:发表于2020-03-02 16:44 被阅读0次

1.准备文件

即要是1,2是一对串联重复,就将其放在一个文件内。
在上一步获得的文件,一对重复基因是一行,所以我们就将两列一行转为一列两行,并以两行为准分割文件,最后利用生成的文件将序列提取出来。

$for i in repeat_gene_id; do awk '{print $0}' $i |xargs -n1 >$i.bed; done
split -l2 $I.bed
$seqkit grep -f 分割出来的文件  cds_hits > 分割出来的文件.fa

2.计算Kaks值

计算kaks值之前需要将序列比对。kaks自带了将aln文件改为axt文件。

## 转换格式
$~biosoft/KAKS_Calculator/KaKs_Calculator2.0/src/AXTConvertor xaa.aln xaa.axt

报错

打开这个axt文件,文件末尾会发现gap和别的比对上了。把多余的A及gap删掉。


修改之后



再次运行



结果文件

相关文章

网友评论

    本文标题:基因家族分析八(计算串联重复基因KAKS值)

    本文链接:https://www.haomeiwen.com/subject/gcklchtx.html