美文网首页
代码学习之单基因分析

代码学习之单基因分析

作者: 要努力学习的菜 | 来源:发表于2020-12-11 17:16 被阅读0次

尝试做一篇单基因的文献复现:
https://cloud.tencent.com/developer/article/1425575
在学习这篇教程中遇到一些问题:
一.问题1

image.png
1.1 解决方案
image.png
仍旧报错,继续修改:
image.png
1.2 教程
https://github.com/ramnathv/slidify/issues/505

知识点(一):
install.packages()
installed.packages()

二.问题2

知识点(二):Rscript在保存的时候需要加后缀.R才能再次运行

三.问题3
继续运行,不明白这一部分作用,盲猜是测试集,请教大佬后发现是基因组注释文件,需要下载。

image.png

a.下载GTF格式的基因注释文件:

相关参考链接:
1.基因组注释文件(GFF,GTF)下载的四种方法https://zhuanlan.zhihu.com/p/79631226
选用的是Ensembl中的下载方式:
(1).FTP 地址:ftp://ftp.ensembl.org/pub/current_gtf

image.png
找到homo_sapiens/,下载下图这个文件
image.png
b.无需解压,用下述代码读入R语言:
BiocManager::install("rtracklayer")
library("rtracklayer")
gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.102.gtf')
gtf_df=as.data.frame(gtf1)
test <- gtf_df[1:5,]
View(test)

2.R语言提取GTF文件信息http://vlambda.com/wz_wR7drRQtry.html
有两篇教程是用Xshell读入GTF文件的,没看懂。
教程下载注释文件时候还搜到了生信技能树的两篇笔记需要Mark一下:
https://mp.weixin.qq.com/s/Z4fK6RObUEfjEyY_2VS4Nw
https://mp.weixin.qq.com/s/pBVXMqddYPH2COjXKUYQnA

知识点(三):理解基因注释文件and注释文件的使用

问题4
遇到管道操作时候报错:

image.png

4.1 解决方案:
加载dplyr这个包,修订代码:
library("dplyr")
expr <- expr %>% tibble::rownames_to_column("gene_id")
4.2 教程https://statisticsglobe.com/convert-row-names-into-column-of-data-frame-in-r

相关文章

网友评论

      本文标题:代码学习之单基因分析

      本文链接:https://www.haomeiwen.com/subject/cvjrgktx.html