最近想自己整理出一套离线的,方便序列处理的脚本,后来网上查了查,biopython 可以实现,刚好我python 有点基础,就直接学习一下,方便我后续学习。
安装使用 pip 安装
然后主要是看说明,根据自己的需要使用,我看英文还是有点吃力啊,算了,赶时间,先看中文的说明文档吧
home https://biopython.org
英文版 http://biopython.org/DIST/docs/tutorial/Tutorial.html
中文版 https://biopython-cn.readthedocs.io/zh_CN/latest/cn/chr06.html
中文版看起来还是很友好的
help.png好了,真正需要的时候,就是看你要的功能是哪块,根据需要整理再看。
我这里就是需要能够读入fasta文件,然后翻译为氨基酸
用法如下
from Bio.SeqRecord import SeqRecord
from Bio import SeqIO
def make_protein_record(nuc_record):
"""Returns a new SeqRecord with the translated sequence (default table)."""
return SeqRecord(seq = nuc_record.seq.translate(cds=True), \
id = "trans_" + nuc_record.id, \
description = "translation of CDS, using default table")
from Bio import SeqIO
proteins = (make_protein_record(nuc_rec) for nuc_rec in \
SeqIO.parse("myfile.fasta", "fasta"))
SeqIO.write(proteins, "translations.fasta", "fasta")
这样就生成了一个translation的文件了
网友评论