基因组survey

作者: Bioinfor生信云 | 来源:发表于2023-01-15 17:24 被阅读0次

背景

基因组测序现在已经成为生物学研究的一个重要手段,基因组的杂合度和重复序列对后续基因组组装有很大的影响。高杂合的基因组往往无法合并姊妹染色体,导致组装的结果偏大,而重复序列在组装中会被折叠,使组装中出现缺口、错误,导致组装的结果偏小。不同的生物体的基因组之间杂合率和重复序列含量差异巨大,因此在进行基因组测序前往往需要对基因组的特征进行调研,以确定测序方案,周期等。

Survey 是评估基因组基本信息的有效手段,对于没有参考基因组的物种,对基因组信息有个明确的概念对后续的测序及组装方案是很有必要的。

通过survey我们可以知道如下信息:

  • 基因组大小:决定测序策略和测序量
  • 重复序列比例
  • 杂合度:对于二倍体,两组染色体会有差异
  • GC含量:过高或过低的GC含量会导致测序偏向性(二代测序)

生成Kmer频数表:jellyfish
基因组大小、杂合、重复估计:GenomeScope2、gce

jellyfish的使用

进行Kmer计算

jellyfish count  \ 
-t 4  \ #线程数
-C  \ #统计正负链
-m 19  \ #Kmer大小
-s 1G  \ #设置初始内存大小
-g f1.fasta \ #输出文件(多个文件输入列表)
#-G 2   \ #多个文件解压并行
-o Kmer_19  #输出前缀

生成kmer频数统计表

jellyfish histo  \
-v \#生成日志
-o Kmer_19.histo  \#指定输出文件
-t 4 \#设置线程数
-h 10000  \ #设置 最大值
Kmer_19 #输入文件
频数表

统计kmer总数

 jellyfish stats \
Kmer_19 \ #输入文件
-o Kmer_19.stat #输出文件

gce的使用

gce -f Kmer_19.histo \ # kmer频数表
-c 170 \ # kmer深度
-H 0 \ # 启用纯合模式,1杂合模式
-g 725214236 \ # kmer总个数
-M 10000 >gce.table 2>gce.log #-M设置阈值

结果文件


GenomeScope2 的使用

genomescope.R \
-i Kmer_19.histo \
-o gs_out \
-p 1 \
-k 19\
-m 10000

结果文件



linear_plot.png
log_plot.png

欢迎关注Bioinfor 生信云!

相关文章

  • 基因组Survey(二代测序数据质控)

    2021-06-26 一. 为什么要做基因组Survey? Survey分析要做什么数据准备?(1)QC方法介绍(...

  • 基因组survey

    基因组survey 在组装基因组之前一定要先对要组装的物种有一个大致的了解,判断其复杂程度, 标准如下 简单基因组...

  • 基因组survey

    几种做基因组survey的方法包括jellyfish、genomescope2.0、gce等软件1.jellyfi...

  • 基因组survey

    背景 基因组测序现在已经成为生物学研究的一个重要手段,基因组的杂合度和重复序列对后续基因组组装有很大的影响。高杂合...

  • 2019-08-29内容

    基因组拼接 基因组Survey:基因组大小、杂合度、重复序列含量评估 拼接策略制定:二代、三代、Hi-C等 拼接原...

  • [基因组] 基于二代数据的Genome Survey

    基因组Survey评估基因组的大小、杂合情况在做一个基因组之前,需要了解这个物种的基因组大小、杂合情况以及其倍性等...

  • 「基因组survey」使用GenomeScope进行基因组分析

    在我写的基因组survey介绍了如何通过jellyfish统计k-mer然后绘制k-mer分布图研究基因组的方法。...

  • 基因组- genome survey(1)

    尚未进行基因组测序的物种,在进行基因组测序前,首先需对该物种进行 genome survey。一般通过两个途径:细...

  • 基因组-genome survey(2)

    在实际基因组概貌调查中,流式细胞术、染色体基数观察和基因组调查测序往往是同时进行的。在此,我们主要介绍下基因组调查...

  • 基因组survey调研图分析

    杂合度:大多数真核生物有两套匹配的染色体组(同源染色体) ; 也就是说,它们是二倍体。二倍体生物,如果两个同源染色...

网友评论

    本文标题:基因组survey

    本文链接:https://www.haomeiwen.com/subject/cdgbcdtx.html