R读取蛋白fasta文件，提取基因名

R读取蛋白fasta文件，提取基因名

作者: 一只小脑斧 | 来源:发表于2022-05-13 21:32 被阅读0次

R读取蛋白fasta文件，提取基因名
基因家族鉴定---Blastp
「数据整理」处理fasta文件的简单命令
使用TBtools提取基因组CDS并转换成蛋白文件
从fasta文件中批量提取特定序列
#Python#提取基因对应的蛋白质名
可以从fasta中提取基因序列的4款软件
linux学习
fastq、fasta、bed、gtf、gff、sam、bam生
MCScanX

#BiocManager::install("Biostrings",force = TRUE)

library(Biostrings)

library(plyr)

fastaFile <- readBStringSet("D:/DATA/Homo_sapiens/Homo_sapiens.fasta",

format="fasta")

#nrec=-1L,

#skip=0L,

#seek.first.rec=FALSE,

#use.names=FALSE)

test<-name[1,1]

#获取名字id

name <- names(fastaFile) %>% as.data.frame()

#######################按"|"分割----

#############自定义函数

filler <- function(x){

a <- strsplit(x,split = "|",fixed = T) %>% as.data.frame()##按"|"分割

y <- a[5,]

return(y)

}

#####应用函数

results.list <- lapply(name$.,filler)

results.list <- unlist(results.list) %>% as.data.frame()

#######################按";"分割----

#############自定义函数

#results.list$.[1]

filler <- function(x){

#x <- results.list$.[3]

a <- strsplit(x,split = ";",fixed = T) %>% as.data.frame()##按";"分割

y <- a[1,]

return(y)

}

#####应用函数

results <- lapply(results.list$.,filler)

results <- unlist(results) %>% as.data.frame()

results <- unique(results$.)

write.csv(results,"iuuCD.human.list.RDS")

相关文章

R读取蛋白fasta文件，提取基因名
#BiocManager::install("Biostrings",force = TRUE) library(...
基因家族鉴定---Blastp
数据：研究物种的基因组文件：Protein.fasta 近源种的基因家族蛋白序列 :protein.fasta ...
「数据整理」处理fasta文件的简单命令
1. 将fasta中的header name替换为对应的fasta文件名 2. 提取fasta文件第一条序列信息 ...
使用TBtools提取基因组CDS并转换成蛋白文件
基因功能注释需要蛋白文件，有时候注释或下载的基因组没有蛋白文件，需提取并转换，据师兄师弟说gffread提取结...
从fasta文件中批量提取特定序列
如题，目的是从fasta文件中批量提取特定的基因序列.实现办法有几种： perl脚本：CSDN博主「little^...
#Python#提取基因对应的蛋白质名
提取基因对应的蛋白质官方名最开始，是需要将基因跟其编码的蛋白质对应起来，找遍了各种数据库都没发现有相关的注释文件...
可以从fasta中提取基因序列的4款软件
前言做生分析有时候需要从基因组fasta文件中提取基因的序列，对于这个需求有不少现成的软件可以来实现，今天来...
linux学习
批量复制和解压批量修改后缀名提取fastq中的fasta序列 diamond结果筛选和去冗余提取文件某行并统...
fastq、fasta、bed、gtf、gff、sam、bam生
生信分析过程中的文件格式：除了原始测序数据fastq、fasta之外，还有基因组文件fasta格式，基因注释文件g...
MCScanX
MCScanX 使用方法：首先需要得到物种的蛋白序列以及基因组注释文件：fasta 与 gff 然后通过本地bl...

网友评论

本文标题：R读取蛋白fasta文件，提取基因名

本文链接：https://www.haomeiwen.com/subject/pibuurtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|R读取蛋白fasta文件，提取基因名|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！