美文网首页
基本的序列分析

基本的序列分析

作者: 兰宇轩 | 来源:发表于2019-07-13 09:21 被阅读0次

在上一章中我们已经学习了如何在 NCBI 中获取数据并解析,这一章节中我们将进一步了解如何对获取的序列信息进行进一步的分析。
这一章节中我们使用到的是人乳糖酶基因,获取方法与上一章节相同。

from Bio import Entrez, SeqIO
Entrez.email = "your@email.here"
hdl = Entrez.efetch(db='nucleotide', id=['NM_002299'], rettype='fasta') # Lactase gene
seq = SeqIO.read(hdl, 'fasta')

我们现在将获取到的序列保存在FASTA文件中。

from Bio import SeqIO
w_hdl = open('example.fasta', 'w')
w_seq = seq[11:5795]
SeqIO.write([w_seq], w_hdl, 'fasta')
w_hdl.close()

在很多情况下,你会直接从硬盘中读取数据,在这里我们用刚保存的数据模拟一下这一过程。

recs = SeqIO.parse('example.fasta', 'fasta')
for rec in recs:
    seq = rec.seq
    print(rec.description)
    print(seq[:10])
    print(seq.alphabet)

你应该会得到如下结果。

gi|32481205|ref|NM_002299.2| Homo sapiens lactase (LCT),
mRNA
GTTCCTAGAA
SingleLetterAlphabet()

我们修改一下序列的alphabet。

from Bio import Seq
from Bio.Alphabet import IUPAC
seq = Seq.Seq(str(seq), IUPAC.unambiguous_dna)

现在我们已经有了 unambiguous DNA,我们可以将其进行转录。

rna = Seq.Seq(str(seq), IUPAC.unambiguous_dna)
rna = seq.transcribe()
print(rna)

最后我们可以翻译得到蛋白质序列。

prot = seq.translate()
print(prot)
小结

在这一章中我们学习了:

  • 读写 FASTA 格式文件
  • 转录和翻译序列

相关文章

  • 基本的序列分析

    在上一章中我们已经学习了如何在 NCBI 中获取数据并解析,这一章节中我们将进一步了解如何对获取的序列信息进行进一...

  • 基因家族分析(一)

    基本分析内容 • 基因家族概念• 数据库检索与成员鉴定• 蛋白成员基本特性和基因结构分析• 多序列...

  • 学习笔记

    基于核酸和蛋白质序列如何研究生物进化?主要步骤是什么?蛋白质序列分析主要内容:(1)蛋白质序列的基本性质分析理化性...

  • <第十三章>时间序列分析和预测

    本周的学习内容是【时间序列分析】 ,分为四个模块,主要是 1、基本概念(必修) 2、平稳序列的预测 3、趋势型序列...

  • 《成神之路-基础篇》Java基础知识——序列化(已完结)

    Java对象的序列化与反序列化 介绍了序列化与反序列化的基本用法 深入分析Java的序列化与反序列化 介绍了wri...

  • [算法详解][插入排序]Insertion Sort

    基本思想 步骤 实例分析 伪代码 代码实现JAVA 性能分析 应用:常见面试题目 【基本思想】 通过构建有序序列,...

  • 2020 时序分析随笔

    多元时间序列分析 通过分析序列自身的变化规律,构建时间序列模型 一元时间序列分析方法 多元时间序列分析 在 198...

  • 时间序列基本分析步骤

    时间序列基本分析步骤 reference: https://www.bilibili.com/video/BV14...

  • 财务分析技术

    本篇文章介绍三种基本方法:1、静态分析;2、动态分析(时间序列分析);3、比率分析 一、静态分析:包括企业内部结构...

  • 5️⃣ 蛋白质的特征信息1:跨膜结构分析

    序列比对和序列特征分析总目录 除了前述对蛋白质的基本性质进行分析预测外,还可以对其结构比如跨膜区,信号肽,螺旋卷曲...

网友评论

      本文标题:基本的序列分析

      本文链接:https://www.haomeiwen.com/subject/wchpkctx.html