美文网首页细胞器
用组装出来的线粒体序列call SNP

用组装出来的线粒体序列call SNP

作者: 深山夕照深秋雨OvO | 来源:发表于2021-07-13 19:19 被阅读0次

想用线粒体基因组建一个树,看一下系统发生关系。

一个思路是从文献中看到的,将线粒体序列的13个蛋白编码基因分别先mafft比对,然后再串联到一起建树

另一个思路用线粒体基因组call SNP,详情见下图

第一种做法是用个体的重测序文件比对到参考(线粒体)基因组上;

第二种也是本文所用的,是用重测序文件组装出来的线粒体序列比对到参考(线粒体)基因组上,但是这种方法靠性存疑

0.用getorganelle组装线粒体序列

详情见https://github.com/Kinggerm/GetOrganelle

1.比对到参考基因组上(bwa mem,用bwa aln的话call不出来,原因不明)

for i in {xxx}  这部分下面省略

do

bwa mem -t 4 -R "@RG\tID:$i\tPL:illumina\tSM:$i\tLB:$i"  ref.fasta $i.fasta | samtools view -bS- > $i.bam

done

tID和tSM和tLB要保持一致,这里设置的是 个体名,否则call不出来,原因暂不明。tPL即测序平台。

2.排序、标记重复序列、建索引

samtools sort -@ 3 $i.bam -o $i.sorted.bam

gatk MarkDuplicates -I $i.sorted.bam -O $i.sorted.markdup.bam -M $i.sorted.markdup_metrics.txt

samtools index $i.sorted.markdup.bam

http://www.360doc.com/content/19/1224/14/68068867_881793271.shtml 标记重复序列的意义与作用,-M参数即把标记到的重复序列输出

3.call SNP

samtools mpileup 1.bam 2.bam… -f ref.fasta –gD –o test.bcf

bcftools view test.bcf > test.vcf   这两行代码的作用和 bcftools mpileup等效

bcftools call test.vcf -c  -v -o end.vcf  

这行代码的作用见下图,参考自https://www.bioinfo-scrounger.com/archives/248/

另外,用gatk就call不出来,所以换成了bcftools

最后得到了end.vcf便是结果,因为这种做法用到的线粒体序列数据很小,一个个体一百多kb,所以没有进行过滤

画了一个PCA的图

相关文章

  • 用组装出来的线粒体序列call SNP

    想用线粒体基因组建一个树,看一下系统发生关系。 一个思路是从文献中看到的,将线粒体序列的13个蛋白编码基因分别先m...

  • 线粒体组装

    1.下载线粒体参考序列 2.构建索引文件 参考Hisat2, Bowtie, Bowtie2和BWA构建基因组索引...

  • Call SNP用MUMmer

    Mummer (NUCmer)通过比较基因组获取突变信息。NUCmer,该方法适合多个近缘物种的基因组比较。 NU...

  • 种群基因组学笔记

    一、SNP分析内容(包括但不局限):①call SNP的软件——freebayes;②计算全部SNP数量;③平均多...

  • 关于call SNP无变异位点的解决方法

    本次使用bcftools call SNP 按以上流程跑完后,vcf文件没有call 出任何SNP。 bcftoo...

  • 生物信息软件收集

    1 . 线粒体组装软件 1.1 ARC 1.2 MITObim

  • bcftools call snp

    之前call snp 都是用samtool mpileup 以及bcftools view进行,但是版本更新忒快,...

  • AmyTree算法

    1. input要求:四个文件,Y-SNP基因型, 树文件, 编译名称文件,参考序列 2. Call Qualit...

  • Call细菌SNP用Snippy

    从reads/contig中call细菌突变 Github: https://github.com/tseeman...

  • 线粒体组装软件MitoZ安装及运行

    线粒体组装软件MitoZ安装报错:sqlite3.IntegrityError: UNIQUE constrain...

网友评论

    本文标题:用组装出来的线粒体序列call SNP

    本文链接:https://www.haomeiwen.com/subject/hkvspltx.html