美文网首页
代码学习之单基因分析

代码学习之单基因分析

作者: 要努力学习的菜 | 来源:发表于2020-12-11 17:16 被阅读0次

    尝试做一篇单基因的文献复现:
    https://cloud.tencent.com/developer/article/1425575
    在学习这篇教程中遇到一些问题:
    一.问题1

    image.png
    1.1 解决方案
    image.png
    仍旧报错,继续修改:
    image.png
    1.2 教程
    https://github.com/ramnathv/slidify/issues/505

    知识点(一):
    install.packages()
    installed.packages()

    二.问题2

    知识点(二):Rscript在保存的时候需要加后缀.R才能再次运行

    三.问题3
    继续运行,不明白这一部分作用,盲猜是测试集,请教大佬后发现是基因组注释文件,需要下载。

    image.png

    a.下载GTF格式的基因注释文件:

    相关参考链接:
    1.基因组注释文件(GFF,GTF)下载的四种方法https://zhuanlan.zhihu.com/p/79631226
    选用的是Ensembl中的下载方式:
    (1).FTP 地址:ftp://ftp.ensembl.org/pub/current_gtf

    image.png
    找到homo_sapiens/,下载下图这个文件
    image.png
    b.无需解压,用下述代码读入R语言:
    BiocManager::install("rtracklayer")
    library("rtracklayer")
    gtf1 <- rtracklayer::import('Homo_sapiens.GRCh38.102.gtf')
    gtf_df=as.data.frame(gtf1)
    test <- gtf_df[1:5,]
    View(test)

    2.R语言提取GTF文件信息http://vlambda.com/wz_wR7drRQtry.html
    有两篇教程是用Xshell读入GTF文件的,没看懂。
    教程下载注释文件时候还搜到了生信技能树的两篇笔记需要Mark一下:
    https://mp.weixin.qq.com/s/Z4fK6RObUEfjEyY_2VS4Nw
    https://mp.weixin.qq.com/s/pBVXMqddYPH2COjXKUYQnA

    知识点(三):理解基因注释文件and注释文件的使用

    问题4
    遇到管道操作时候报错:

    image.png

    4.1 解决方案:
    加载dplyr这个包,修订代码:
    library("dplyr")
    expr <- expr %>% tibble::rownames_to_column("gene_id")
    4.2 教程https://statisticsglobe.com/convert-row-names-into-column-of-data-frame-in-r

    相关文章

      网友评论

          本文标题:代码学习之单基因分析

          本文链接:https://www.haomeiwen.com/subject/cvjrgktx.html