美文网首页
2019-08-28 基因注释

2019-08-28 基因注释

作者: smile_lucky爱上阳光 | 来源:发表于2019-08-28 23:41 被阅读0次

以前做基因注释总用R包:TxDb.Hsapiens.UCSC.hg38.knownGene,但是今天做发现1个问题,就是有的基因特别长,与ncbi中检索出来的不一样,查找原因,在生物技能树上也看到了相关的问题,于是是果断参考用了gencode.v27.annotation.gtf.gz。

之前做法:

#有问题

Gene=as.data.frame(genes(TxDb.Hsapiens.UCSC.hg38.knownGene))

ann <- tryCatch(

  suppressWarnings(select(org.Hs.eg.db,

                          keys=unique(Gene$gene_id),

                          keytype="ENTREZID",

                          columns=c("SYMBOL"))))

colnames(ann)[1]="gene_id"

Gene=merge(Gene,ann)

gn=as(Gene,"GRanges")

************************************************

现在参考基因组文件及注释:

wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_27/gencode.v27.annotation.gtf.gz

grep -v "^#" gencode.v27.annotation.gtf|awk '$3=="gene"{print $1,$2,$3,$4,$5,$7,$12,$14}'|sed 's/;/\t/g'|sed 's/"//g'|sed 's/ /\t/g' >gencode.v2.annotation.gene

Gene=read.table("gencode.v2.annotation.gene",sep="\t",header=F,stringsAsFactors = F) gn=GRanges(seqnames =Gene$V1,ranges = IRanges(start=Gene[,4],end=Gene$V5),strand = Gene$V6,Symbols=Gene$V9)  

peak1=GRanges(seqnames = paste("chr",sv_dt$Chr1,sep=""),ranges=IRanges(sv_dt$Pos1,sv_dt$Pos1),mcols=sv_dt[,1:2]) over.Peak1=mergeByOverlaps(peak1,gn)

相关文章

  • 2019-08-28 基因注释

    以前做基因注释总用R包:TxDb.Hsapiens.UCSC.hg38.knownGene,但是今天做发现1个问题...

  • RNA-seq名词解释(7)

    (九)、分析内容相关 gene annotation:基因注释,分为基因的结构注释和基因的功能注释。 CDS pr...

  • R语言KEGG分析

    #读取背景基因(所有注释到KEGG的基因)和差异基因列表,以K号表示 #读取背景基因(所有注释到KEGG的基因)和...

  • ID转换以及LncRNA和mRNA相关性分析

    基因注释 UCSC Xena的基因注释文件gencode.v22.annotation.gene.probeMap...

  • 对任何物种所有基因进行功能注释

    所有基因功能注释汇总表 1.注释结果统计 2.所有基因的注释信息 3.每个基因注释到 GO 数据库上的编号 4.对...

  • 基因注释

    前情提要 搞NGS,注释文件是我们经常需要用到的。但是不同的实验室偏爱的数据库各不相同,甚至同一个课题组的小伙伴都...

  • 基因组注释--重复序列注释(一):Trf软件安装与使用

    前言 动植物基因组注释包括重复序列注释以及基因结构注释,重复序列注释是注释中非常重要的环节,主要包括的软件有T...

  • Where are the Genes in the Genom

    基因组注释(Genome annotation) 基因组注释是利用生物信息学方法和工具,对基因组所有基因的生物学功...

  • python从基因组注释文件中提取GO信息

    问题 在转录组或基因组注释文件中有基因的GO注释,为了做GO富集分析,需要从中提取每个有GO注释的基因对应的GO号...

  • GO注释结果整理

    对于非模式生物或者无参考基因组的项目,经常需要进行基因的功能注释,而GO注释是基因功能注释的重要部分。有很多软件能...

网友评论

      本文标题:2019-08-28 基因注释

      本文链接:https://www.haomeiwen.com/subject/ienvectx.html