美文网首页小教程收藏2022
如何获取测序数据的average insert size

如何获取测序数据的average insert size

作者: TOP生物信息 | 来源:发表于2018-10-24 15:44 被阅读0次

在学习用SOAPdenovo2组装基因组的过程中,发现配置文件需要填average insert size这一项。建库过程我是没有参与的,所以就不知道insert size到底多大(以后这种情况尽量避免,毕竟建库是很重要的)。搜了搜谷歌,找到了答案,作者以BBMap为例介绍了三种基本方法,适用于不同的情景——Average Insert Size

  • 基于比对,需要参考基因组;
  • 基于重叠,read1 + read2 > insert;
  • 基于组装,需要足够的测序深度和内存来组装基因组。

我的重测序数据应该用第一种方法,如果是基于比对,那其他的软件应该也可以,有没有呢?先留一个问题。

下载安装

$ wget https://nchc.dl.sourceforge.net/project/bbmap/BBMap_38.26.tar.gz
#最近一次更新是2018年9月,作者真勤劳。
$ tar zxvf BBMap_38.26.tar.gz
$ cd ./bbmap
$ ls
太多了吧
$ ./../bbmap.sh in1=/ifs1/Grp3/huangsiyuan/learn_assemble/data/chr1_R1.fq \
 in2=/ifs1/Grp3/huangsiyuan/learn_assemble/data/chr1_R2.fq \
 ref=./chr1.fa ihist=ihist.txt reads=2m pairlen=1000 threads=4
#运行了近三个小时才得到了ihist.txt文件,感觉比对有些慢
平均数,中位数等等以及insert size的频数分布
insert size的频数分布

所以平均insert size就取354左右吧!

相关文章

网友评论

    本文标题:如何获取测序数据的average insert size

    本文链接:https://www.haomeiwen.com/subject/bpjttqtx.html