美文网首页
以果蝇蛋白序列注释转录组数据

以果蝇蛋白序列注释转录组数据

作者: 伽罗CG4825 | 来源:发表于2019-06-23 15:06 被阅读0次

    本篇的主要内容是:以果蝇蛋白序列数据为参考序列,注释转录组CDS序列。

    1. 下载果蝇蛋白序列

    打开Flybase下载果蝇序列(ftp://ftp.flybase.net/genomes/Drosophila_melanogaster/dmel_r6.28_FB2019_03/fasta/)

    捕获.PNG

    2.创建工作目录,将参考序列放到工作目录

    解压缩文件
    可以查看文件


    捕获2.PNG
    1. 构建本地数据库

    参考https://www.jianshu.com/p/775b463a0ec9

    1. 比对数据

    命令如下

    捕获4.PNG

    这一步消耗大量时间。建议长时间等待。

    1. 利用Excel简单注释

    将比对结果粘贴到Excel上

    捕获5.PNG

    将比对的Flybase上的蛋白ID利用flybase重新注释蛋白名称


    捕获6.PNG 捕获7.PNG 捕获8.PNG

    最右侧就是Flybase中基因名及蛋白编号。可方便查询。

    相关文章

      网友评论

          本文标题:以果蝇蛋白序列注释转录组数据

          本文链接:https://www.haomeiwen.com/subject/kfsiqctx.html