美文网首页
6. 利用python计算蛋白序列中氨基酸出现的频率

6. 利用python计算蛋白序列中氨基酸出现的频率

作者: 秦城听雪 | 来源:发表于2020-03-02 13:00 被阅读0次

问题:假设存在一个蛋白序列seq 'MPKRKKMRLFEEDDEIRESLLGADNKDKDEDEDLQSDTENRTFLEDTDTV',计算各个氨基酸出现的频率。
方法1:

seq = 'MPKRKKMRLFEEDDEIRESLLGADNKDKDEDEDLQSDTENRTFLEDTDTV'
ani_result = {}
for ani in range(len(seq)):
    if seq[ani] in ani_result:
        ani_result[seq[ani]] += 1
    else:
        ani_result[seq[ani]] = 1
for each in sorted(ani_result.keys()):
    print(each + " " + str(ani_result[each]))
#或者是列表格式
print(sorted(ani_result.items(), key=lambda x: x[1]))
运行结果

方法2:利用count函数,统计20种氨基酸在蛋白序列中出现的次数

seq = 'MPKRKKMRLFEEDDEIRESLLGADNKDKDEDEDLQSDTENRTFLEDTDTV'
for ani in 'ARNDCQEGHIKMFPSTWYV':
    num_result = seq.count(ani)
    print(ani, num_result)

相关文章

网友评论

      本文标题:6. 利用python计算蛋白序列中氨基酸出现的频率

      本文链接:https://www.haomeiwen.com/subject/uhlmkhtx.html