使用bioawk对fasta文件进行序列分析

作者: 花生学生信 | 来源:发表于2022-04-12 22:38 被阅读0次

使用bioawk对fasta文件进行序列分析
Python脚本：fasta文件单序列信息提取
对数据进行操作（增、删、改、查）
WSL 一行命令快速合并文件 Fasta Fas合并
samtools faidx创建fasta格式文件索引fai
在linux中构建基因进化树
python——fasta序列的读取和提取处理
python--处理 fasta 和 fastq 文件
2021-12-25-基因甲基化位点分析
利用python将gbk格式转换为fasta &&

最近在做水稻基因组注释，对于注释结果进行整理过滤，还在探索中。

evm注释结果

将结果转化成蛋白文件：

gffread H7L1.EVM.all.gff -g ~/task/222anno/21/data/H7L1.arrow.polish.fasta -y cds.fa

提取长度大于100bp的序列

bioawk -c fastx 'length($seq) > 100{ print ">"$name; print $seq }'  cds.fa > 100.fa

查看结果：

共有41659条注释结果

对比过滤前

但是不同群体注释的结果差异较大，目前还在探索中，以后结果会更新。

使用bioawk对fasta文件进行序列分析
最近在做水稻基因组注释，对于注释结果进行整理过滤，还在探索中。 evm注释结果将结果转化成蛋白文件：提取长度大...
Python脚本：fasta文件单序列信息提取
使用Python对fasta格式的序列进行基本信息统计预期设计输出文件中包括fasta文件名，序列长度，GC含量以...
对数据进行操作（增、删、改、查）
1.FASTA/Q 利用seqkit对FASTA/Q格式的序列文件进行操作，使用说明和安装可以查看：seqkit ...
WSL 一行命令快速合并文件 Fasta Fas合并
有需求将多个单个基因序列.fasta文件合并到一个多序列的.fasta文件里，方便后续的序列比对和进化分析采用W...
samtools faidx创建fasta格式文件索引fai
fasta是一种常用的序列存储格式，GATK、IGV等软件对序列进行快速查找的时候通常需要建立fasta的索引文件...
在linux中构建基因进化树
首先利用muscle进行多序列比对：“muscle -in 序列文件.fasta -out 输出的比对结果文件.f...
python——fasta序列的读取和提取处理
fasta文件的读取是所有数据分析的第一步。fasta文件是包含一行含有">"的序列名和一行包含其对应的序列的文件...
python--处理 fasta 和 fastq 文件
fasta文件格式：fasta 文件为一个 ID 对应一个序列,可以是转录本序列, 蛋白序列 ''' V350...
2021-12-25-基因甲基化位点分析
SRAMP[http://www.cuilab.cn/sramp/]根据fasta序列文件进行m6a motif的...
利用python将gbk格式转换为fasta &&
将gbk格式文件转换成fasta格式文件将多个fasta序列中提取含有'Homo sapiens'的序列请关注...