问题:已知一个核酸序列为seq = "AATTGC" 利用python程序计算各个碱基出现的频率。
# 如何计算核酸序列中碱基出现的频率
seq = "AATTTGC"
base = {}
for nucl in range(len(seq)):
if seq[nucl] in base:
base[seq[nucl]] += 1
else:
base[seq[nucl]] = 1
for each in sorted(base.keys()):
print(each + " " + str(base[each]))
# 输出列表格式
print(sorted(base.items(), key=lambda x: x[1]))
输出结果
方法2: 利用count函数,统计ATCG四种碱基的出现次数。
seq = "AATTTGC"
for nucl in 'ATCG':
num = seq.count(nucl)
print(nucl, num)
网友评论