在进行单拷贝直系同源基因构建系统发育树之前,我们会将一些出现频率比较低的单拷贝直系同源基因过滤掉,这就需要先统计频率了,这个脚本使用find函数进行统计。
#!/bin/bash
for i in $(cat $1); do
find ./*/single_copy_busco_sequences -type f -name "${i}.faa" -exec echo -n . \; | wc -c | awk -v gene="$i" '{print gene, $1}' >> genespe.txt;
done
网友评论