samtools faidx 是一个建索引的命令,那为什么要给参考基因组建索引呢?
想象一下你有一本非常厚的书,但这本书没有目录。如果我让你找到某一个特定的章节,你可能需要从头到尾翻阅整本书,这非常耗时。如果这本书有一个详细的目录,你可以很快查到那个章节的页码,直接翻到那一页,这就是索引的作用。
以这个序列为例
$ cat 111.fa
>11
AAAAA
>222
AAAAAA
AAAA
>333
AAAA
$ samtools faidx 111.fa
111.fa.fai 第一列是序列ID, 第二列是序列长度,第三列是序列在文件的位置(单位字符),第四列是序列字符数(一行),第五列是序列字符数加换行符(第一行)。
![](https://img.haomeiwen.com/i27226870/f187850b52d5b4a8.png)
网友评论