在通过搬运别人代码来学习circilize过程中,(http://blog.sciencenet.cn/blog-3406804-1185274.html
)敲下如下代码时:
gene <- read.delim(genome_gff, header = FALSE, stringsAsFactors = FALSE, comment.char = '#')[c(1, 3, 4, 5, 7)]
发现这样个提示。

自己断断续续接触生信也快半年了,遇到报错也见怪不怪了,但是这个并不是报错,第一时间当然是问谷歌了。

但是谷歌出来的东西对解决问题并没有实质性的帮助,这个时候我就去请教我师兄这个老司机。
师兄上来就跟我劈头盖脸一顿,"你忘了上次我跟你说过的用rtracklayer来读取gff文件?"
我就老老实实地看了看rtracklayer的说明,顺便附上果子老师对gff文件读取的总结。(http://guoshipeng.com/2017/11/16/20-GTF-in-R/)
我先学了最简单的那个/捂脸:
source("[https://bioconductor.org/biocLite.R](https://bioconductor.org/biocLite.R)")
biocLite("rtracklayer")
biocLite("SummarizedExperiment")
gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.90.chr.gtf')
gtf_df <- as.data.frame(gtf1)
geneid_df <- dplyr::select(gtf_df,c(gene_name,gene_id,gene_biotype)) #取出需要的列,形成新的data.frame
这样的话,确实可以正常的解决问题,本来以为事情就这样结束了,结果重头戏来了。因为我平时会进行批评与自我批评,我就回头看一下这行代码,结果发现,我这行代码上面有 三个问号,并且前面没有 "#" !!!! 这是我平时的一个小习惯,就是会用三个问号来标记我看到的地方,结果正是这个习惯坑了我,R无法对这三个问号进行解读。最后,谨记,若做标记 勿忘加 “#”。
网友评论