从基因组注释中提取转录因子
字符串find使用+异常值处理
今天又写了一个小脚本,从基因组的注释文件中筛选所有可能的转录因子,方法是以DNA binding的GO号及关键词'Transcription factor'和'transcription factor'为筛选条件。
昨晚其实想复杂了,主要使用一个判断语句 str.find() != -1 就好了
import os
os.chdir('C:/Users/zm/Desktop')
Inputfile='gene_annot.txt'
TFs=[]
title=0
for line in open(Inputfile).readlines():
if title != 0:
if line.find('GO:0003677') != -1 or line.find('Transcription factor') != -1 or line.find('transcription factor') != -1:
TFs.append(line)
if line.startswith('ID'):
TFs.append(line)
title=1
昨晚写了一点点,还想着把每一行的输入转换成列表,然后再判断,那可真真的是很麻烦了,但是在想这个的时候,倒是学了一个新的知识点:异常值处理
可惜了,那几行脚本被我删除了,就是
try:
GOs.append(line[18])
except IndexError:
GOs.append('NULL')
网友评论