番外.2

作者: 半夜一更 | 来源:发表于2021-03-11 14:21 被阅读0次

老早以前写的:
师弟有一批测序返回序列,需要从起始密码子开始翻译成蛋白质序列后逐条输出。
分析:
(1)将多个序列.txt文件整合成一个.fasta文件;
(2)保留每条序列的“ATG"后的序列;
(3)将每条序列翻译成对应的氨基酸系列;
(4)将翻译后的氨基酸序列切割成多个文件保存。
代码实现:

#(1)将多个序列.txt文件整合成一个.fasta文件
#_*_coding:UTF-8_*_
import os
filedir = os.getcwd()+'\yuliao'      #获取目标文件夹的路径
filenames=os.listdir(filedir)      #获取当前文件夹中的文件名称列表  
f=open('fasta合并.fasta','w')      #打开当前目录下的fasta合并.fasta文件,如果没有则创建
for filename in filenames:       #先遍历文件名
    filepath = filedir+'/'+filename
    for line in open(filepath):      #遍历单个文件,读取行数
        line = line.strip()
        f.writelines(line+"\n")
f.close()
#(2)保留每条序列的“ATG"后的序列
import re
output_file = open(r"fasta对齐.fasta","w")
with open(r"fasta合并.fasta","r") as input_file:
    seq = ""
    header = input_file.readline().strip()[0:]
    pattern=r"ATG"
    for line in input_file:
        line = line.strip()
        if line[0] != ">":
            seq = ""
            seq = seq + line
            new_seq = seq[re.search(pattern, seq).span()[0]:]      #获取”ATG"索引并截取随后的序列
        else:
            header = line
            continue
        output_file.write(header + "\n" + new_seq + "\n")
output_file.close()
#(4)将翻译后的氨基酸序列切割成多个文件保存
with open(r"C:\Users\admin\Desktop\all_proteins.fasta","r") as input_file:
    seq = ""
    header = input_file.readline().strip()[1:]
    for line in input_file:
        line = line.strip()
        if line[0] != ">":
            seq = seq + line
        else:
            with open(header + ".txt", 'w') as file:
                file.write(">"+header + "\n" + seq + "\n")
            header = line[1:]
            seq = ""
with open( header +  ".txt",'w') as file:
    file.write( ">"+header+"\n"+seq+"\n")

相关文章

  • 番外 2

    恐龍哥:你們好,我是醜恐龍的大哥帥恐龍,今天我們的…… 奶牛弟:嘖!還帥恐龍呢! 牛仔:今天不能吵架了,要不然觀眾...

  • 番外2

  • 番外(2)

    在乒乓球兴趣小组,就李文婷一个女生。平常,在班级里,我们男生很少跟女生说话,女生也很少跟男生说话,但是参加乒乓组活...

  • 番外2

    穿上红袍的孟白 好啦好啦作者马上滚嘿嘿当我什么也没有发

  • 番外2

    「拜託,我們基金會一向誠實,不誠實的預算已經被用光了。」 「被誰?」 「你看到那隻猩猩了嗎?Bennet .」 「...

  • 番外 2

    (额。。。。上一个番外好像立了个falg。。。这次补上!!!) 一天,null正在花园里散步~~~ 303:nul...

  • 番外2

    大婚在经过紧密筹排后开始,不过我们的重点不在于第一天,而在第二天 大婚第二天 第二天一大早,众宾客就纷纷拿着请柬进...

  • 番外.2

    老早以前写的:师弟有一批测序返回序列,需要从起始密码子开始翻译成蛋白质序列后逐条输出。分析:(1)将多个序列.tx...

  • MC小番外—HC番外2

    emmmm,我觉得这个就接着更,毕竟正文一个字都鼓捣不出来,苍天啊,大地啊,让我有灵感吧! 不废话了,...

  • 《红尘·外番2》

    孤独的人有影陪伴,其实只是暗注目着光却又不敢上前。 夏蝉同青蛙合奏,寒蜩与学鸠同行,错过了繁花似锦,却迎来...

网友评论

      本文标题:番外.2

      本文链接:https://www.haomeiwen.com/subject/cxonqltx.html