美文网首页
教程及软件有错误是常态

教程及软件有错误是常态

作者: 因地制宜的生信达人 | 来源:发表于2018-12-17 21:43 被阅读17次

有些时候,我们可能真的很努力了,但事情就是解决不了,这个时候仍然是自己的问题,努力能解决一些问题,但不是所有。

最近在用star找融合基因,对人类物种的数据来说,没啥问题,很轻松就运行成功了,合作方给我了一些小鼠的测序数据,居然出现了问题,当然,我下载数据库肯定不会出错的啦。

├── [ 26G]  GRCh37_gencode_v19_CTAT_lib_Nov012017.plug-n-play.tar.gz
├── [ 20G]  GRCh38_gencode_v26_CTAT_lib_Nov012017.plug-n-play.tar.gz
├── [ 24G]  Mouse_M15_CTAT_lib_Nov012017.plug-n-play.tar.gz

报错如下:

-parsing GTF file: /home/jianmingzeng/biosoft/starFusion/db/Mouse_M15_CTAT_lib_Nov012017/ctat_genome_lib_build_dir//ref_annot.gtf
Error, cannot get transcript_id from gene_id "ENSMUSG00000102693.1"; gene_type "TEC"; gene_name "4933401J01Rik"; level 2; havana_gene "OTTMUSG00000049935.1"; of line
chr1    HAVANA  gene    3073253 3074322 .   +   .   gene_id "ENSMUSG00000102693.1"; gene_type "TEC"; gene_name "4933401J01Rik"; level 2; havana_gene "OTTMUSG00000049935.1"; at /home/jianmingzeng/miniconda3/lib/STAR-Fusion/util/../lib/GTF_utils.pm line 111, <$fh> line 6.
    GTF_utils::GTF_to_gene_objs("/home/jianmingzeng/biosoft/starFusion/db/Mouse_M15_CTAT_lib_N"...) called at /home/jianmingzeng/miniconda3/lib/STAR-Fusion/util/../lib/GTF_utils.pm line 30
    GTF_utils::index_GTF_gene_objs_from_GTF("/home/jianmingzeng/biosoft/starFusion/db/Mouse_M15_CTAT_lib_N"..., HASH(0x1998ac8)) called at /home/jianmingzeng/miniconda3/lib/STAR-Fusion/util/../lib/GTF_utils.pm line 20
    GTF_utils::index_GTF_gene_objs("/home/jianmingzeng/biosoft/starFusion/db/Mouse_M15_CTAT_lib_N"..., HASH(0x1998ac8)) called at /home/jianmingzeng/miniconda3/lib/STAR-Fusion/util/STAR-Fusion.predict line 331
    main::parse_GTF_features("/home/jianmingzeng/biosoft/starFusion/db/Mouse_M15_CTAT_lib_N"..., HASH(0x23174a8), HASH(0x23174d8)) called at /home/jianmingzeng/miniconda3/lib/STAR-Fusion/util/STAR-Fusion.predict line 100

看起来很复杂,又是perl又是模块,还有gtf的问题,事实上只需要看第一句话,就是star-fusion自带的基因注释数据库文件里面的gtf问题,有一些基因是没有对应转录本的。

我去gencode数据库里面搜索了同样的ID,发现这个问题一模一样,很有可能是gencode那边的人并没有做好这个数据库的维护,而star-fusion的开发团队直接沿用了这个数据库文件。

但是为什么star-fusion的开发团队并没有去仔细检查呢?

难道他们开发了数据库缺没有实际上运行任何一个小鼠的例子吗?

当然了,解决方案非常简单:

grep gene_id ref_annot.gtf |grep transcript_id

就是挑选那些既有基因ID,又有转录本ID的那些咯,可以看到原来是1745955行,经过过滤只剩下1693314行。

当然了,软件也成功运行了。

├── [4.0K]  star-fusion.filter.intermediates_dir
│   ├── [ 47K]  star-fusion.pre_blast_filter
│   ├── [ 19K]  star-fusion.pre_blast_filter.abridged
│   ├── [105K]  star-fusion.pre_blast_filter.filt_info
│   ├── [ 65K]  star-fusion.pre_blast_filter.filt_info.abridged
│   ├── [ 48K]  star-fusion.pre_blast_filter.post_blast_n_promisc_filter
│   └── [ 21K]  star-fusion.pre_blast_filter.post_blast_n_promisc_filter.abridged
├── [ 42K]  star-fusion.fusion_candidates.final
├── [ 17K]  star-fusion.fusion_candidates.final.abridged
├── [ 87K]  star-fusion.fusion_candidates.preliminary
├── [ 131]  star-fusion.predict.intermediates_dir
│   ├── [ 22M]  star-fusion.junction_breakpts_to_genes.txt
│   ├── [125K]  star-fusion.junction_read_names
│   └── [1.6M]  star-fusion.spanning_frag_names
├── [   0]  star-fusion.STAR-Fusion.filter.ok
└── [   0]  star-fusion.STAR-Fusion.predict.ok

相关文章

  • 教程及软件有错误是常态

    有些时候,我们可能真的很努力了,但事情就是解决不了,这个时候仍然是自己的问题,努力能解决一些问题,但不是所有。 最...

  • 错误是常态

    客观世界的一切如果不输入大脑,那么就没有意义。 感官接收的局限性在于大脑处理信息的速度慢,习惯性的只关注有敏感度的...

  • arcgis教程 arcgis视频教程 arcgis10下载

    找到一个arcgis教程,还不错,有视频、有文档 视频及相关材料下载地址 教程包含三大部分,视频+文档+配套小软件...

  • Ubuntu 18.04装机及美化

    Ubuntu 系统安装及美化教程,以及一些实用软件推荐 一、Ubuntu 18.04 装机 安装教程以Ubuntu...

  • cocoapod安装教程

    安装cocoapod教程在安装Xcode 软件及插件command tool体验极好 终端是支持ruby语言的1....

  • 青言青语270:微课制作

    《微课制作软件下载及选题素材准备说明》 一、录屏软件: 1、按照camtasia studio 9安装教程逐步安装...

  • MySQL软件安装及数据库基础

    一、软件安装及服务器设置 1.mysql安装包及教程地址:http://www.runoob.com/mysql/...

  • React native官方UIExplorer

    操作系统为windows7按照网上教程,安装了很多软件,最后依然报错,由于网上这方面教程少,而且我的错误比较少见,...

  • ATAC-seq上游分析

    参考教程:生信技能树ATAC-seq教程 1. 环境配置及软件安装 1.1. 安装conda并配置镜像 1.2. ...

  • 嵌入式

    嵌入式操作系统安装及相关教程 安装VMware-workstation-full-10.0.1-1379776软件...

网友评论

      本文标题:教程及软件有错误是常态

      本文链接:https://www.haomeiwen.com/subject/fkrhkqtx.html