叶绿体基因组组装

作者: 就叫啵啵吧 | 来源:发表于2022-11-14 10:10 被阅读0次

叶绿体基因组组装
叶绿体基因组组装
利用OGDRAW绘制叶绿体圈图＋Geneious长度的统计
线粒体组装软件(2) NOVOPlasty
使用GetOrganelle软件组装叶绿体基因组
教程 | 使用 CPGAVAS2 进行叶绿体基因组注释
利用Geneious对叶绿体基因组进行注释及查看
Bacteria genome denovo assembly
利用bandage手动组装叶绿体基因组
mVISTA:在线程序展示叶绿体基因组相似性小实例

getorganelle组装叶绿体基因组

安装

conda install -c bioconda getorganelle

安装叶绿体基因组databases

get_organelle_config.py --add embplant_pt

NCBI测试数据下载

从网上随机找了一篇文章进行组装
文章链接

# download data
prefetch SRR15255748.sra
# split files
fasterq-dump --split-3  SRR15255748.sra
# after split 
# SRR15255748_1.fastq  SRR15255748_2.fastq

软件运行

get_organelle_from_reads.py  -1 SRR15255748_1.fastq -2 SRR15255748_2.fastq  -k 21,77,127 -o results -t 30 -R 25 -F embplant_pt

组装结果

使用Bandage 对 gfa/fastg 结果文件进行查看

getorganelle组装结果
IR区域拆分之后就可以行成叶绿体的环状结构

两种解环方式
IR拆分之后就行成了两种成环方式，这也是为什么getorganelle会给出两条序列的原因，两条序列的差异在于SSC的方向。因此我们需要对得到的两条序列做共线性分析。选择一条和参考相同的，或者NCBI用的比较多的一种方式进行下一步分析。

选用参考自己做组装

参考序列下载

选用近缘的物种作为参考物种这里选用 NC_063470.1 做为参考物种

数据处理

# build index  
bowtie2-build  test.fa  ref # test.fa NC_036134.1
# mapping
bowtie2 -x ref --very-sensitive-local -1 SRR15255748_1.fastq -2 SRR15255748_2.fastq  > mapping.sam
# sam to bam
samtools view -h -F 4 -@ 6 mapping.sam  > mapping.bam
# bam to fastq
samtools fastq -1 1.fq -2 2.fq -s unmapped.fq mapping.bam

SPAdes组装

spades.py -k 21,77,127 -1 1.fq  -2 2.fq -t 30 -o results

组装结果

使用Bandage 对 gfa/fastg 结果文件进行查看

SPAdes组装结果
然后按照上面的处理方式就可以得到相同的结果如果序列前端和序列后端有一条Kmer是相似的需要删除该Kmer

写在结尾

序列组装好之后鉴定叶绿体的四个区域，然后序列调整LSC的第一个碱基作为序列的开始，接着就可以进行注释等后续分析。

当序列复杂度比较高时，使用getorganelle无法成环或者成环数比较多时（失败的原因是多种多样的），需要自己进行纠正！！！

如果大家有想做的分析，也可以私信我哦。

网友评论

本文标题：叶绿体基因组组装

本文链接：https://www.haomeiwen.com/subject/djklxdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

叶绿体基因组组装

getorganelle组装叶绿体基因组

安装

安装叶绿体基因组databases

NCBI测试数据下载

软件运行

组装结果

选用参考自己做组装

参考序列下载

数据处理

SPAdes组装

组装结果

写在结尾

相关文章