测序fa文件里的序列:
sam文件里的序列:
sam序列=reference文件序列,不管正负,都是一个顺序的序列,这个是在IGV里验证的


测序的fa文件:


将图1末尾反向取补,可知是CACTGGCC,能在图2处对上,确实fa是有一条反向互补的,
图1又有和sam的第三条完全一样,而图2的逆序互补和sam的第四条一致,由此,sam是同方向的,fa是反向互补的,唯一不知道的为什么fa不是U而是T,而且fa的一条序列和参考基因组一致。
因此,顺序比对到基因组的那个序列,start=5’
逆序的需要知道它的start指的是什么,
经过IGV的观察,和原本的方向无关,和比对到正向还是反向无关,只要是start小的就是5‘ start大的+length就是3’
因此将脚本改到V11,忽略比对到intron的过程,改为只看start大的,加上比对长度得到end,end为bp。
跑完是能得出结果

命令:
python filter_for_cirregion_v11.py -i ../one_pair_SRR6999003_mapped.bam -o ./one_pair_filter_result.sam -g /mnt/x110/wus/BP_new/BWA_mapping/dingh/SRR6999003_mapped.bam.sort -O ./one_pair_filter_gff.gff
但是是print标准输出,v12改为重定向到文件,重定向后可以输出bed和gff两种格式。

命令:python filter_for_cirregion_v12.py -i ../one_pair_SRR6999003_mapped.bam -o ./one_pair_filter_result.sam -g /mnt/x110/wus/BP_new/BWA_mapping/dingh/SRR6999003_mapped.bam.sort --gff ./one_pair_filter_gff.gff --bed ./one_pair_filter_bed.bed
网友评论