美文网首页
基因组的七七八八

基因组的七七八八

作者: 溪溪溪溪溪川 | 来源:发表于2023-08-21 16:26 被阅读0次

图片今天上传不了,改天加上。

1.组装后Contig基因组过滤污染或线粒体质体

文献来源:异源四倍体早熟禾:https://doi.org/10.1093/g3journal/jkad073

利用NCBI数据库,可下载线粒体,质体,真菌的序列等。利用blast比对和计算覆盖度,对基因组contig进行比对过滤。
每隔几个月会更新一版本,最新20230713版本,如下图。
下载地址:https://ftp.ncbi.nlm.nih.gov/refseq/release/

目前CCS测序,hifiasm组装之后发现植物中会有较多的片段的contig或者污染序列,由于NT库太大,下载和分库也麻烦,不好比对,建议使用https://ftp.ncbi.nlm.nih.gov/refseq/release/进行过滤。

标准:考虑比对的覆盖度,一般认为50%以上覆盖度建议去掉。

2.Busco D值

一般植物busco v5 有胚植物 1614库评估完成以后,busco D值大于10%以上需要注意,要么有冗余,要么WGD事件,或异源多倍体,或同源多倍体。
如果基因组项目把异源四倍体当做二倍体就尴尬了。比如:
如梨,大豆,busco D值都比较高,是因为有全基因组复制时间,异源四倍体棉花 busco D值能达到80%。

同样的数据库,基因busco一般比基因组的busco 更高,说明基因预测肯能不太准确,同源物种选择不合适。

最近看到一篇较高分的传统期刊文章结果如下:很明显是多倍体的特征,D值十分的高,但是文章当做二倍体处理的,没有提过多倍体的信息,实际上百度一下这个物种都是有四倍体存在的,基因组干了这么多,最后只能说sci信一半。


3.HiC热图

现在越来越多的基因组文章不放HiC热图,为什么不放正文?因为很有可能被看穿做的HiC有问题,所以不放在正文,大家一般都不会去看,被拆穿的概率比较小。

相关文章

  • 参考基因组的选择

    基因组的研究都离不开参考基因组,本文带大家了解参考基因组的组成,及如何选择参考基因组。 参考基因组的 contig...

  • 测序基础介绍-NGS方法小结

    1 测序方法分类 2 基因组测序 2.1 全基因组测序 大型全基因组测序对人类、植物或动物基因组等大型基因组(>5...

  • Bacteria genome denovo assembly

    细菌基因组组装金标准:GAGE-B 组装软件的选择 细菌基因组组装的目标不同于大型生物基因组的组装,大型基因组组装...

  • 五个网站查物种基因组大小

    动物基因组大小(需翻墙) 植物已测序的基因组大小 真菌基因组大小 原核生物基因组大小 NCBI怎么缺呢注:若如,可...

  • 泛基因组测序简介

    泛基因组包括核心基因组(Core genome)和非必须基因组(Dispensable genome)。其中,核心...

  • 比对分析及bam文件

    比对分析 参考基因组的一些概念: Seq number:基因组组装的序列总数。 Total length:基因组组...

  • MD-什么是泛基因组学? 怎么构建物种的泛基因组?应用?

    什么是泛基因组学? 怎么构建物种的泛基因组?应用? 什么是泛基因组学? 怎么构建物种的泛基因组?应用? 参考链接:...

  • 生物信息学名词解释(待完善)

    易混淆名词 gene:基因genome:基因组genomic:基因组的;染色体组的genomics:基因组学gen...

  • 组装简介

    基因组 应该是 生信分析的基因组。一个好的基因组会让生信分析事半功倍。基因组组装简单的理解:借助工具进行 read...

  • 混沌

    脑袋一片混沌,七七八八的人,七七八八的事,喝着七七八八的酒,感觉好累,这不是我想要的生活! 都说活出自己,为自己而...

网友评论

      本文标题:基因组的七七八八

      本文链接:https://www.haomeiwen.com/subject/lzqymdtx.html