美文网首页
R读取蛋白fasta文件,提取基因名

R读取蛋白fasta文件,提取基因名

作者: 一只小脑斧 | 来源:发表于2022-05-13 21:32 被阅读0次

#BiocManager::install("Biostrings",force = TRUE)

library(Biostrings)

library(plyr)

fastaFile <- readBStringSet("D:/DATA/Homo_sapiens/Homo_sapiens.fasta",

                            format="fasta")

                            #nrec=-1L,

                            #skip=0L,

                            #seek.first.rec=FALSE,

                            #use.names=FALSE)

test<-name[1,1]

#获取名字id

name <- names(fastaFile) %>% as.data.frame()

#######################按"|"分割----

#############自定义函数

filler <- function(x){

  a <- strsplit(x,split = "|",fixed = T) %>% as.data.frame()##按"|"分割

  y <- a[5,]

  return(y)

}

#####应用函数

results.list <- lapply(name$.,filler)

results.list <- unlist(results.list) %>% as.data.frame()

#######################按";"分割----

#############自定义函数

#results.list$.[1]

filler <- function(x){

  #x <- results.list$.[3]

  a <- strsplit(x,split = ";",fixed = T) %>% as.data.frame()##按";"分割

  y <- a[1,]

  return(y)

}

#####应用函数

results <- lapply(results.list$.,filler)

results <- unlist(results) %>% as.data.frame()

results <- unique(results$.)

write.csv(results,"iuuCD.human.list.RDS")

相关文章

网友评论

      本文标题:R读取蛋白fasta文件,提取基因名

      本文链接:https://www.haomeiwen.com/subject/pibuurtx.html