美文网首页组学
2022-04-14两个基因组间鉴定结果SV和SNP变异

2022-04-14两个基因组间鉴定结果SV和SNP变异

作者: AsuraPrince | 来源:发表于2022-04-14 11:57 被阅读0次

###01.序列比对

nohup nucmer --mum -c 100 -l 50 -g 1000 -t 12 $ref $qry &> step1.log &

#--mincluster/-c 用于聚类的匹配最低长度,默认65

#--minmatch/-l 单个匹配最小长度

#--maxgap/-g: 两个相邻匹配间的最大gap长度,默认90

---------------------------------------------------------------------------------------

--mum Use anchor matches that are unique in both the reference and query 或者 --maxmatch Use all anchor matches regardless of their uniqueness

同时比对也可以用minimap2等软件完成

--------------------------------------------------------------------------------------

###02.去除短的和低质量比对

delta-filter -1 -q -r -i 89 -l 50 out.delta > out.filter

#-1: 1对1联配,允许重排,是-r和-q的交集

#-q: 仅保留每个query在reference上的最佳位置,允许多条query在reference上重叠

#-r: 仅保留每个reference在query上的最佳位置,允许多条reference在query上重叠

##-i: 最小的相似度 [0,100], 默认0

##-l: 最小的匹配长度 默认0.

#-u: 最小的联配唯一度 [0,100], 默认0

#-o: 最大重叠度,针对-r和-q设置。 [0,100], 默认100

#-g: 1对1全局匹配,不允许重排

#-m: 多对对联配,允许重排,是-r和-q的合集

###03.比对结果转成表格格式

show-coords -THrd out.filter > out.filter.coords

#-r:以refID排序,相对的,还有-q,以queryID排序

#-T: Switch output to tab-delimited format

#-H: Do not print the output header

#-d 在附加的 FROM 列中显示对齐方向(引物的默认值)

###04.运行syri进行变异检测

syri -c out.filter.coords -d out.filter -r $ref -q $qry

# 输入mummer coords文件,记录共线性块位置信息

# 输入mummer delta文件,记录共线性区块内错配,插入,删除等信息;即SNP和indel信息。

# refence路径

# query路径

###05.绘图

syri plotsr syri.out $ref $qry -H 8 -W 5

相关文章

网友评论

    本文标题:2022-04-14两个基因组间鉴定结果SV和SNP变异

    本文链接:https://www.haomeiwen.com/subject/hxstertx.html