odgi 把GFA文件按染色体拆分
odgi explode -i joint-clip.P.og -g --prefix=subgraph
$ ls subgraph*
subgraph.0.gfa subgraph.1.gfa subgraph.2.gfa subgraph.3.gfa subgraph.4.gfa
odgi 提取PGGB泛基因组子图
gfabase 提取MC泛基因组子图
gfabase sub GRCh38-f1g-90-mc-aug11.gfab GRCh38.chr1:25240000-25460000 --range --connected --view --cutpoints 1 --guess-ranges -o RH_locus.walk.gfa
odgi extract -i chr1.pan.smooth.og -o chr1.pan.RH_locus.og -b chr1.RH_locus.bed -E -P
坐标系转换
gfa 有路径信息和Node信息,有时候为了研究需要将路径信息和Node信息相互转换
从y路径到 Node,
odgi position -i k.og -p y,10,+ -v
# 查找 y 路径上第10个方向为+ 的碱基所在Node的位置
output
#source.path.pos target.graph.pos
y,10,+ 6,0,+
从y路径到 转x路径
odgi position -i k.og -p y,10,+ -r x
# 查找 y 路径上第10个方向为+ 的离x路径的位置
output
#source.path.pos target.path.pos dist.to.ref strand.vs.ref
y,10,+ x,10,+ 0 +
从Node到路径
odgi position -i k.og -g 6,2
# 查找 Node 6 偏移量为2在路径的位置
output
#target.graph.pos target.path.pos dist.to.path strand.vs.ref
6,2,+ x,12,+ 0 +
odgi position -i k.og -g 4 -r x
# 查找 Node 6 偏移量为2在路径x的位置
给gfa文件添加颜色
gffread -T Sr.gff3 -o Sr.gtf
利用grep 提取一个gene保存为Sr.gff3.adj,查看
$ cat Sr.gff3.adj
Sr_t1 GETA transcript 5000 7561 . + . SrXXXXXXX0
# 根据gff文件注释GFA
odgi position -i merge.og -E gene.gtf.adj.exon > color.csv
odgi view -i merge.og -g merge.gfa
导入到bandage 中
## odgi 不支持walk 信息,而且sort 会重新命名节点,很讨厌。
网友评论