美文网首页
R读取蛋白fasta文件,提取基因名

R读取蛋白fasta文件,提取基因名

作者: 一只小脑斧 | 来源:发表于2022-05-13 21:32 被阅读0次

    #BiocManager::install("Biostrings",force = TRUE)

    library(Biostrings)

    library(plyr)

    fastaFile <- readBStringSet("D:/DATA/Homo_sapiens/Homo_sapiens.fasta",

                                format="fasta")

                                #nrec=-1L,

                                #skip=0L,

                                #seek.first.rec=FALSE,

                                #use.names=FALSE)

    test<-name[1,1]

    #获取名字id

    name <- names(fastaFile) %>% as.data.frame()

    #######################按"|"分割----

    #############自定义函数

    filler <- function(x){

      a <- strsplit(x,split = "|",fixed = T) %>% as.data.frame()##按"|"分割

      y <- a[5,]

      return(y)

    }

    #####应用函数

    results.list <- lapply(name$.,filler)

    results.list <- unlist(results.list) %>% as.data.frame()

    #######################按";"分割----

    #############自定义函数

    #results.list$.[1]

    filler <- function(x){

      #x <- results.list$.[3]

      a <- strsplit(x,split = ";",fixed = T) %>% as.data.frame()##按";"分割

      y <- a[1,]

      return(y)

    }

    #####应用函数

    results <- lapply(results.list$.,filler)

    results <- unlist(results) %>% as.data.frame()

    results <- unique(results$.)

    write.csv(results,"iuuCD.human.list.RDS")

    相关文章

      网友评论

          本文标题:R读取蛋白fasta文件,提取基因名

          本文链接:https://www.haomeiwen.com/subject/pibuurtx.html