对比两种用python3读取fasta文件的方法

作者: 野生拟南芥 | 来源:发表于2019-06-14 09:24 被阅读0次

对比两种用python3读取fasta文件的方法
R语言技巧：对stata软件文档来读取
R语言技巧：读取sas软件的sas格式文件
sed命令
python3 读文件时出现UnicodeDecodeError
关于python读取文件的index问题
解析数据记录
利用Bio.SeqIO读取序列文件
#分子模拟# 用python将PDB转化成FASTA
python——fasta序列的读取和提取处理

Spenn.fasta文件总共约14M行，读取该文件，并将染色体号和对应的序列做成字典。两种方法，测试运行速度差别很大。

1、每读一行给字典赋一个值

fl = open('Spenn.fasta')
dic1= {}
for i in fl:
  if '>' in i:
    chro = i.strip().split('-')[1]
    dic1[chro] = ''
  else:
    dic1[chro] = dic1[chro] + i.strip()
print('DONE')

这个方法用时超长。

2、读完一整条fasta再赋值

fl = open('Spenn.fasta')
dic1= {}
chro = fl.readline().strip().split('-')[1]
seq = ''
for i in fl:
  if '>' in i:
    dic1[chro] = seq
    chro = i.strip().split('-')[1]
    seq = ''
  else:
    seq += i.strip()
dic1[chro] = seq   #记得最后还要再赋一次值

用时大概几秒。

对比两种用python3读取fasta文件的方法
Spenn.fasta文件总共约14M行，读取该文件，并将染色体号和对应的序列做成字典。两种方法，测试运行速度差别...
R语言技巧：对stata软件文档来读取
前面几期介绍了如下内容：读取excel文件对比方法读取csv格式文件对比方法read.csv 读取sav格式文...
R语言技巧：读取sas软件的sas格式文件
前面几期介绍了如下内容：读取excel文件对比方法读取csv格式文件对比方法read.csv 读取sav格式文...
sed命令
sed命令对比用paste和tr命令将fastq文件转换为fasta文件 paste sed命令 sed用法
python3 读文件时出现UnicodeDecodeError
今天用python3的文件操作读取python源代码文件，在运行时出现UnicodeDecodeError: 'a...
关于python读取文件的index问题
问题：用python3读取文件的时候，有时会遇到输出结果多出了一列unnamed：0. 解决方法：df=pd.re...
解析数据记录
一：读取和写入多序列fasta文件,并将每条记录（序列+标题）写入不同的文件中。只适合去掉换行符的序列，用per...
利用Bio.SeqIO读取序列文件
利用Bio.SeqIO读取序列文件 1. fasta文件 from Bio import SeqIO #导入Seq...
#分子模拟# 用python将PDB转化成FASTA
用python将PDB转化成FASTA 很多时候我们都需要读取PDB的序列文件，虽然这个很容易，很多软件也可以做到...
python——fasta序列的读取和提取处理
fasta文件的读取是所有数据分析的第一步。fasta文件是包含一行含有">"的序列名和一行包含其对应的序列的文件...

网友评论

本文标题：对比两种用python3读取fasta文件的方法

本文链接：https://www.haomeiwen.com/subject/tyoyfctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

对比两种用python3读取fasta文件的方法

相关文章

对比两种用python3读取fasta文件的方法

R语言技巧：对stata软件文档来读取

R语言技巧：读取sas软件的sas格式文件

sed命令

python3 读文件时出现UnicodeDecodeError

关于python读取文件的index问题

解析数据记录

利用Bio.SeqIO读取序列文件

#分子模拟# 用python将PDB转化成FASTA

python——fasta序列的读取和提取处理

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读