本篇的主要内容是:以果蝇蛋白序列数据为参考序列,注释转录组CDS序列。
- 下载果蝇蛋白序列
打开Flybase下载果蝇序列(ftp://ftp.flybase.net/genomes/Drosophila_melanogaster/dmel_r6.28_FB2019_03/fasta/)
捕获.PNG2.创建工作目录,将参考序列放到工作目录
解压缩文件
可以查看文件
捕获2.PNG
- 构建本地数据库
参考https://www.jianshu.com/p/775b463a0ec9
- 比对数据
命令如下
捕获4.PNG这一步消耗大量时间。建议长时间等待。
- 利用Excel简单注释
将比对结果粘贴到Excel上
捕获5.PNG将比对的Flybase上的蛋白ID利用flybase重新注释蛋白名称
捕获6.PNG 捕获7.PNG 捕获8.PNG
最右侧就是Flybase中基因名及蛋白编号。可方便查询。
网友评论