这次主要记录一下俺在使用该软件的时候遇到的问题。
软件指路:ciriquant-cookbook
问题描述
这次使用这个软件,一开始是在一台有64g内存的机器上跑的,然后卡在了De novo alignment for circular RNAs ..
这一步。
具体表现是:程序没有停下来,还再跑,但是用top
查看后台发现没有任何程序在跑,并且没有报错。
[Thu 2020-07-16 15:44:46] [INFO ] Input reads: SRR5635537_1_val_1.fq.gz,SRR5635537_2_val_2.fq.gz
[Thu 2020-07-16 15:44:46] [INFO ] Library type: unstranded
[Thu 2020-07-16 15:44:46] [INFO ] Output directory: /home/dick/Circ/STAR_map/37_CIRI, Output prefix: SRR5635537
[Thu 2020-07-16 15:44:46] [INFO ] Config: hg19 Loaded
[Thu 2020-07-16 15:44:46] [INFO ] 32 CPU cores availble, using 30
[Thu 2020-07-16 15:44:46] [INFO ] Align RNA-seq reads to reference genome ..
[Thu 2020-07-16 16:09:12] [INFO ] Estimate gene abundance ..
[Thu 2020-07-16 16:20:15] [INFO ] No circRNA information provided, run CIRI2 for junction site prediction ..
[Thu 2020-07-16 16:20:15] [INFO ] Running BWA-mem mapping candidate reads ..
[Thu 2020-07-16 16:52:35] [INFO ] Running CIRI2 for circRNA detection ..
[Thu 2020-07-16 16:59:36] [INFO ] Extract circular sequence
[Thu 2020-07-16 16:59:36] [100% ] [##################################################]
[Thu 2020-07-16 16:59:36] [INFO ] Building circular index ..
[Thu 2020-07-16 16:59:37] [INFO ] De novo alignment for circular RNAs ..
于是我观察了一下输出文件
-rw-rw-r-- 1 dick dick 0 7月 16 16:55 SRR5635537.ciri
-rw-rw-r-- 1 dick dick 0 7月 16 16:59 SRR5635537_denovo.bam
-rw-rw-r-- 1 dick dick 0 7月 16 16:59 SRR5635537_index.fa
-rw-rw-r-- 1 dick dick 28G 7月 16 16:52 SRR5635537_unmapped.sam
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samaa
-rw-rw-r-- 1 dick dick 0 7月 16 16:59 SRR5635537_unmapped.samaa.list
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samab
-rw-rw-r-- 1 dick dick 4.3K 7月 16 15:21 SRR5635537_unmapped.samab.list
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samac
-rw-rw-r-- 1 dick dick 3.2K 7月 16 16:58 SRR5635537_unmapped.samac.list
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samad
-rw-rw-r-- 1 dick dick 0 7月 16 16:59 SRR5635537_unmapped.samad.list
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samae
-rw-rw-r-- 1 dick dick 941M 7月 16 16:55 SRR5635537_unmapped.samaf
注意:这儿第一个.ciri
、_denovo.bam
、_index.fa
都没输出结果,所以我怀疑可能是在生成这些文件的时候,创建了文件但是没输出东西,然后后来观察了一下,应该还有个.list2
结尾的文件,所以应该是在Running CIRI2 for circRNA detection ..
出错了可能。
解决办法
这个还挺麻烦的,我读了一下代码,没找到啥问题。因为是比较新的软件,所以搜索不到太多的解决办法。
重点来了:董劳斯让我试一下软件的测试代码,结果跑!!出!!来!!了!!
那就是说本身我环境问题可能不大?要么是文件问题,要么机器问题。
然后我仔细检查了一下我的文件配置,每个文件是否正常,然后发现都是正常的。
实在没办法,向赵教授团队发了个邮件,他们让我提供CIRIerror.log
文件。我查看了一下发现这个文件里面空的,没有输出。
于是我决定重跑一下,跑个结果出来,恰逢服务器宕机,和老师借了个更牛的服务器跑。结果跑出来了!!!
细细观察一下,发现这个程序在Running CIRI2 for circRNA detection ..
步骤会用最多120G往上的内存!!!俺之前服务器只有64G,导致输出不全,所以没结果,换了好的服务器就行了!!
结论
在Running CIRI2 for circRNA detection ..
步骤仔细检查是否会很有规律的生成很多文件后缀如下
_unmapped.samaa
_unmapped.samaa.list
_unmapped.samaa.list2
_unmapped.samab
_unmapped.samab.list
_unmapped.samab.list2
以此类推
如果没生成全或者生半停了,那可能是内存不够嗯。你会发现后面Extract circular sequence
秒完成,那大概率就是这个原因?
吐槽一下
第一次跑一个程序还是要细细观察一下输出,全扔后台啥都不知道,出了问题还没法trouble shoot。
网友评论