美文网首页生信工具
基因家族鉴定---合并候选集

基因家族鉴定---合并候选集

作者: MLD_TRNA | 来源:发表于2021-03-25 15:51 被阅读0次

    无论是bitacora、hmmer还是blastp得到的候选集可能都有所不同,所以鉴定完整后取并集较好。

    我的做法是导出每一个候选集的ID名

    代码为seqkit的

    seqkit fx2table xxx.fasta -n -i  >out.fa

    把每个候选集的id黏贴到Excel中,筛选重复值删除即是并集

    然后借助Tbtools根据id在目标物种的蛋白文件中搜索蛋白序列

    人工矫正结构注释

    对于结构域不完整的(partial),或者length明显过长的(可能是2-3个基因合到一起了),需要手动进行基因结构注释的矫正。

    根据GFF文件,找到该基因所在基因组上的位置

    根据位置提取基因组上下游序列(看序列长度,如+-3000bp)

    将序列blastx NR数据库,根据比对结果,比着序列翻译的3种读码框,寻找GT...AG内含子

    同时可以用基因结构预测网站辅助

    作者:山竹山竹px

    链接:https://www.jianshu.com/p/7ff2cc1ba5ad

    来源:简书

    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    相关文章

      网友评论

        本文标题:基因家族鉴定---合并候选集

        本文链接:https://www.haomeiwen.com/subject/yxjhhltx.html