GATK参考序列的操作（操作FASTA格式的序列）

GATK参考序列的操作（操作FASTA格式的序列）

作者: Greatji | 来源:发表于2020-02-10 10:50 被阅读0次

GATK参考序列的操作（操作FASTA格式的序列）
samtools faidx创建fasta格式文件索引fai
对数据进行操作（增、删、改、查）
一个 fasta 序列格式化小脚本
利用python将gbk格式转换为fasta &&
python--处理 fasta 和 fastq 文件
生信中常用的文件格式认识(一)-----fasta和fastQ
fasta和fastq文件格式详解
awk: 从格式化的fasta中提取部分id的序列
生信常用文件格式

工具名称	简介	运行命令
BaitDesigner (Picard)	设计杂交捕获反应设计杂交探针用的	" java -jar picard.jar BaitDesigner \ TARGET=targets.interval_list \ DESIGN_NAME=new_baits \ R=reference_sequence.fasta "
BwaMemIndexImageCreator	生成.img为GATK BWA所需	"gatk BwaMemIndexImageCreator \ -I reference.fasta \ -O reference.fasta.img"
"CountBasesInReference	替换成了CountBases"	统计在SAM/BAM/CRAM中的碱基 "gatk CountBases \ -I input_reads.bam"
CreateSequenceDictionary (Picard)	(Picard)生成.dict,这个文件是一个index,GATK很多过程都需要	java -jar picard.jar CreateSequenceDictionary \R=reference.fasta \O=reference.dict
ExtractSequences	(Picard)根据区域信息从参考序列中导出一个新的fasta序列	java -jar picard.jar ExtractSequences \INTERVAL_LIST=regions_of_interest.interval_list \R=reference.fasta \O=extracted_IL_sequences.fasta
FastaAlternateReferenceMaker	根据突变的VCF修改reference里的碱基，如果有区域信息，则只显示区域内的序列。	gatk FastaAlternateReferenceMaker -R reference.fasta -O output.fasta -L input.intervals -V input.vcf [--snp-mask mask.vcf]
FastaReferenceMaker	根据区域信息导出区域内的序列。	gatk FastaReferenceMaker \ -R reference.fasta \ -O output.fasta \ -L input.intervals
FindBadGenomicKmersSpark	BETA 检查参考序列中的高重复的序列	gatk FindBadGenomicKmersSpark \ -R reference.fasta \ -O kmers_to_ignore.txt
NonNFastaSize(Picard)	统计参考序列中非N的碱基个数，需要实现index生成.bai和.dict	java -jarpicard.jar NonNFastaSize \ I=input_sequence.fasta \ O=count.txt
NormalizeFasta(Picard)	将参考序列整理成除最后一行以外，长度相等的fasta格式，默认长度100	java -jar picard.jar NormalizeFasta \ I=input_sequence.fasta \ O=normalized_sequence.fasta
ScatterIntervalsByNs(Picard)	根据参考序列中的N生成区间文件	java -jar picard.jar ScatterIntervalsByNs \ REFERENCE=reference_sequence.fasta \ OUTPUT_TYPE=ACGT \ OUTPUT=output.interval_list

相关文章

GATK参考序列的操作（操作FASTA格式的序列）
工具名称简介运行命令BaitDesigner (Picard)设计杂交捕获反应设计杂交探针用的" java -ja...
samtools faidx创建fasta格式文件索引fai
fasta是一种常用的序列存储格式，GATK、IGV等软件对序列进行快速查找的时候通常需要建立fasta的索引文件...
对数据进行操作（增、删、改、查）
1.FASTA/Q 利用seqkit对FASTA/Q格式的序列文件进行操作，使用说明和安装可以查看：seqkit ...
一个 fasta 序列格式化小脚本
一个 fasta 小工具，主要用来格式化fasta序列的，也可以实现 fasta 核酸序列转为 pep 蛋白序列。...
利用python将gbk格式转换为fasta &&
将gbk格式文件转换成fasta格式文件将多个fasta序列中提取含有'Homo sapiens'的序列请关注...
python--处理 fasta 和 fastq 文件
fasta文件格式：fasta 文件为一个 ID 对应一个序列,可以是转录本序列, 蛋白序列 ''' V350...
生信中常用的文件格式认识(一)-----fasta和fastQ
一.fasta格式 fasta格式是一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母来表...
fasta和fastq文件格式详解
1. fasta格式 fasta格式是一种非常简单的储存序列的格式（主要是把序列储存到数据库中的一种形式），可以储...
awk: 从格式化的fasta中提取部分id的序列
看两个fasta的格式，一个是单行的序列，一个是格式化后的序列题目：提取id1和id2的序列，并组成fasta格...
生信常用文件格式
2021.6.6 1. 序列格式 1.1 fasta 简介一种基于文本的、用于表示核苷酸序列或氨基酸序列的格式。在...

网友评论

本文标题：GATK参考序列的操作（操作FASTA格式的序列）

本文链接：https://www.haomeiwen.com/subject/hlfaxhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|GATK参考序列的操作（操作FASTA格式的序列）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！