美文网首页
超大基因组,hisat2 超长染色体物种的转录组分析?windo

超大基因组,hisat2 超长染色体物种的转录组分析?windo

作者: 生信石头 | 来源:发表于2023-10-04 01:15 被阅读0次

各种原因,今晚晚睡。
想想还是简单记录一下,大体是好友刘教授最近在搞一个超大基因组,总大小是 12G+,同时只有 5 个染色体。这意味着每条染色体的长度都很长,超过 1G 很正常。这当然让我想起来大蒜基因组。
两个人折腾了两天,愣是没怎么找到原因。后来想想,基因组太大的可能性不大,因为小麦有 16G。于是剩下的或许是单个染色体太长?与朋友大鸡哥确认了下,bing测试了下。初步结果,确实如此。
大体是 hisat2-build 可以支持超长染色体,但实际上 hisat2-align 则无法支持。所以一旦装载了染色体,开始比对时,就会报错,error 代码 134。
解决的办法简单,
结合 IGV 和 基因结构注释信息,找几个断点,把染色体都分为单条长度不超过 1G 的基因组,随后用做基因组,进行比对测试。逻辑上,这个并不会影响到基因表达量估算。或者其他转录组数据分析....
另外一个有趣的发现是,WSL2 模式的运行效率远远低于 TBtools 插件。或许多了一层虚拟机(WSL2本质也是虚拟机),到底还是慢了很多,无论是 IO 还是 CPU 效率。或许,真是是 10 倍差异。那么是 1个小时 和 10个小时的区别。

相关文章

  • hisat2比对

    基因组比对软件常用bwa,转录组比对软件常用bowtie2、hisat2等,其中有参考基因组的常用hisat2,没...

  • RNA-seq名词解释(8)

    (十)、分析流程及软件列表 有参转录组:针对有参考基因组序列的物种进行 mRNA 的分析。 无参转录组:针对尚无参...

  • 转录组测序技术和结果解读(五)——参考基因组mapping

    转录组测序根据目标物种是否存在基因组信息分为有参转录组和无参转录组。 有参转录组通过将测序数据与参考基因组进行ma...

  • 如何获取染色体长度

    我们在做基因组或者转录组数据分析的时候,经常需要用到染色体的长度。今天我们就来聊聊如何获取染色体的长度。我们以人的...

  • RNA-seq 分析常用的软件

    如果所研究的物种有组装注释质量较好基因组序列,且和该基因组序列比对效率较高,那么可以采用有参转录组的分析策略,直接...

  • IGV基因组浏览器打开BAM文件查看reads比对情况

    输入文件有:物种基因组序列文件、物种基因组注释文件、转录本比对后的BAM文件;以斑胸草雀为例:-基因组注释文件: ...

  • 转录组学习笔记1

    基因课视频笔记——仅用于个人学习转录组原理篇 由于一个物种的基因组差异不大,目前所说的基因组通常指一个物种的基因组...

  • 在NCBI查找指定物种基因组信息

    【原创】在NCBI查找指定物种基因组信息 生信分析中经常需要查找指定物种的基因组信息。如:基因组相关分析中需要借助...

  • day47 转录组 比对

    学习资料:B站视频:生物技能树 第八季转录组测序数据分析 一、转录组比对常用软件 转录组比对常用:hisat2、s...

  • gff文件格式(每一列的含义)

    GFF全称Generic Feature Format, 描述了基因组上各种特征的区间信息,包括染色体,基因,转录...

网友评论

      本文标题:超大基因组,hisat2 超长染色体物种的转录组分析?windo

      本文链接:https://www.haomeiwen.com/subject/rukybdtx.html