基因组的从头组装

作者: 麋鹿吃了颗草莓 | 来源:发表于2019-11-07 21:26 被阅读0次
  • 基因组组装一般分为三个层次,contig, scaffold和chromosomes.

contig表示从大规模测序得到的短读(reads)中找到的一致性序列。组装的第一步就是从短片段(pair-end)文库中组装出contig。进一步基于不同长度的大片段(mate-pair)文库,将原本孤立的contig按序前后连接,这一步会得到scaffolds。最后基于遗传图谱或光学图谱将scaffold合并调整,形成染色体级别的组装(chromosome)

一. 短序列拼接

SPAdes

  • SPAdes 主要用于进行单细胞测序的细菌与基因组拼接,也能用于非单细胞测序数据。
安装
#下载SPAdes
wget http://cab.spbu.ru/files/release3.12.0/SPAdes-3.12.0/SPAdes-3.12.0-Linux.tar.gz      

#解压压缩包,路径为SPAdes压缩包的位置,解压到家目录下
tar zvxf [路径] /SPAdes-3.12.0-Linux.tar.gz -C 

#配置环境变量
echo 'export PATH =~SPAdes-3.12.0-Linux/bin:$PATH'
#使配置生效
source ~/.bashrc

#查看结果
spades.py -h

结果


1.PNG
拼接基因组
#将结果保存到SPAdes文件夹中
#同一个基因组分别拼接一个优化过和没优化过的
spades.py --careful -1 test_7942raw_1.fq -2 test_7942raw_2.fq.gz -o ./SAPAdes
spades.py --only-assembler --careful -1 test_7942raw_1.fq -2 test_7942raw_2.fq.gz -o ./SPAdes_without_correction

ps:这里因为没有设置K值,所以会运行较长时间来寻找合适的K值,当知道K值时可以加上合适的K值,会缩短运行时间
结果

2.PNG

二. 序列拼接结果评价

Quast

安装

ps:已经提前把下载好的压缩包传到虚拟机上了,因为直接用sudo apt install命令下载太慢

tar zvxf quast-5.0.0.tar.gz    ##解压压缩包
cd quast-5.0.0
./quast.py                            ##查看是否能运行
echo 'export PATH=~/quast-5.0.0:$PATH' >> ~/.bashrc   ##配置环境变量
source ~/.bashrc
序列拼接结果评价
#对SPAdes的拼接结果进行评价
quast.py ~/SPAdes/contigs.fasta -o ~/SPAdes quast_out
#比较with和without error correction的拼接结果
quast.py -o compare_correction ./SPAdes/contigs.fasta ./SPAdes_without_correction/contigs.fasta

结果


4.PNG
5.PNG

相关文章

  • 使用ALLMAPS进行辅助组装得到准染色体水平基因组

    使用ALLMAPS进行辅助组装 简介 在从头组装过程中,确定基因组的scaffolds/contig的顺序和朝向是...

  • 基因组的从头组装

    基因组组装一般分为三个层次,contig, scaffold和chromosomes. contig表示从大规模测...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 序列拼接 - Velvet

    基因组测序数据的从头组装过程:测序读段(reads) > contig > scaffold > chromoso...

  • 基因组从头组装软件

    从头组装- de novo assembly 指在不需要任何参考序列的情况下对某一物种进行基因组测序,然后将测得的...

  • 从头组装基因组实践

    一般需要8步骤: ![ME(}JV]M(16}157JQ6TIMWH.png](https://upload-im...

  • 国科大课程——基因组分析与原理

    ligc写于2019.4.30 基因组组装 重测序 从头组装 谷氨酸蛋白酶:四龄幼虫中肠转录组测序高表达基因 li...

  • 常用转录组组装软件集合

    转录组组装软件 基因组组装 基因组组装(Genome assembly)是指使用测序方法将待测物种的基因组生成序列...

  • 基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量...

  • 基因组 组装教程 (T2T)

    导读 本文将介绍T2T基因组,并提供一份基因组组装的资料,其中包含:基因组组装数据和组装策略介绍;染色体水平基因组...

网友评论

    本文标题:基因组的从头组装

    本文链接:https://www.haomeiwen.com/subject/cqsjbctx.html