2024-07-24 CD-hit，seqkit 按照ID提取序

2024-07-24 CD-hit，seqkit 按照ID提取序

作者: dashan1928 | 来源:发表于2024-07-23 14:36 被阅读0次

fasta文件根据ID提取序列
本地blast
Seqkit小工具处理序列、提取序列ID
Django models结果排序 2020-05-09
使用seqkit批量替换序列ID
使用cd-hit对蛋白质或核酸序列进行聚类
Tools:seqkit快速多线程全平台fastq处理工具
CD-HIT学习
seqkit 从基因组根据ID提取序列2021-01-27
MySQL 你以为你以为的就是你以为的？

宏基因组二代测序结果binning之后的序列可能存在重复，首先使用prokka将binning后的序列转化为蛋白序列，

再使用CD-hit 命令默认参数将序列进行去重复

然后使用seqkit seq -i 获取序列的id

再使用seqkit grep -f 获取原先每个bin中的fasta序列

注：转成氨基酸序列后，保证了序列相似度识别的准确性，再进行去冗余后可以尽可能保证剩余序列的唯一性

相关文章

fasta文件根据ID提取序列
把要提取的序列 ID 写入 id.txt ，一行一个ID 1.seqkit 2.seqtk
本地blast
建库蛋白比对提取ID seqkit fx2tab swiss-prot.tab -n -i >id.fa bl...
Seqkit小工具处理序列、提取序列ID
Seqkit是一款专门处理fsata/q序列文件的软件，由go语言编写，功能比较完善，软件使用也很稳定。优点1....
Django models结果排序 2020-05-09
用order_by('-id')表示按照id倒序 https://www.cnblogs.com/wangying...
使用seqkit批量替换序列ID
在进行组装和比对过程中，要将测序ID替换成物种学名，一个一个替换太慢了，发现seqkit有这个功能。 seqkit...
使用cd-hit对蛋白质或核酸序列进行聚类
2018.9.7 星期四多云 biolearn cd-hit 是用于蛋白质序列或核酸序列聚类的工具，根据序...
Tools:seqkit快速多线程全平台fastq处理工具
seqkit的使用方法[https://bioinf.shenwei.me/seqkit/]seqkit gith...
CD-HIT学习
CD-hit 参数解读 -i 设置输入文件 -o 设置输出文件，可以将每次分析的ID阈值放到名称中，方便以后使用，...
seqkit 从基因组根据ID提取序列2021-01-27
参考：https://blog.csdn.net/weixin_29148445/article/details/...
MySQL 你以为你以为的就是你以为的？
一、InnoDB在任何情况下都是按主键正序排列的么？很早之前，我无知，以为InnoDB中的数据都是按照id正序排...

网友评论

本文标题：2024-07-24 CD-hit，seqkit 按照ID提取序

本文链接：https://www.haomeiwen.com/subject/clzyhjtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2024-07-24 CD-hit，seqkit 按照ID提取序|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！