美文网首页
2021-03-16

2021-03-16

作者: rong酱 | 来源:发表于2021-03-16 13:13 被阅读0次
#!/usr/bin/env python
# -*- coding: utf-8 -*-

import re

start_code = 'AUG'
end_code = ['UAA', 'UAG', 'UGA']
protein_table = {'UUU': 'F', 'CUU': 'L', 'AUU': 'I', 'GUU': 'V', 'UUC': 'F', 'CUC': 'L', 'AUC': 'I', 'GUC': 'V', 'UUA': 'L', 'CUA': 'L', 'AUA': 'I', 'GUA': 'V', 'UUG': 'L', 'CUG': 'L', 'AUG': 'M', 'GUG': 'V', 'UCU': 'S', 'CCU': 'P', 'ACU': 'T', 'GCU': 'A', 'UCC': 'S', 'CCC': 'P', 'ACC': 'T', 'GCC': 'A', 'UCA': 'S', 'CCA': 'P', 'ACA': 'T', 'GCA': 'A', 'UCG': 'S', 'CCG': 'P', 'ACG': 'T', 'GCG': 'A', 'UAU': 'Y', 'CAU': 'H', 'AAU': 'N', 'GAU': 'D', 'UAC': 'Y', 'CAC': 'H', 'AAC': 'N', 'GAC': 'D', 'CAA': 'Q', 'AAA': 'K', 'GAA': 'E', 'CAG': 'Q', 'AAG': 'K', 'GAG': 'E', 'UGU': 'C', 'CGU': 'R', 'AGU': 'S', 'GGU': 'G', 'UGC': 'C', 'CGC': 'R', 'AGC': 'S', 'GGC': 'G', 'CGA': 'R', 'AGA': 'R', 'GGA': 'G', 'UGG': 'W', 'CGG': 'R', 'AGG': 'R', 'GGG': 'G', 'UAA':'STOP', 'UAG':'STOP', 'UGA':'STOP'}


with open("Q4_input.txt","r") as seqliness:
    protein = ''
    for seqlines in seqliness:
        RNAstring = str(seqlines).strip().split("\n")[0]
        if RNAstring == '':
            continue
        else:
            codons = []
            startsit = re.search(start_code, RNAstring)
            lenseqline = len(str(seqlines))
            for sit in range(startsit.end(),lenseqline,3):
                if str(RNAstring[sit:sit+3]) in end_code:
                    break
                elif str(RNAstring[sit:sit+3]) in protein_table.keys():
                    codons.append(str(RNAstring[sit:sit+3]))
            for codoni in codons:
                transpro = protein_table[codoni]
                protein = protein + transpro
        print("protein: "+str(protein))

相关文章

网友评论

      本文标题:2021-03-16

      本文链接:https://www.haomeiwen.com/subject/ceqdcltx.html