美文网首页
提取水稻promoter的坐标并转换成为bed文件

提取水稻promoter的坐标并转换成为bed文件

作者: 余绕 | 来源:发表于2024-06-22 15:40 被阅读0次

数据来源于ngsplot的MSU的基因组文件

load("F:/H3K9hib_salt/WT_chip-seq/Meta_plots/MSUv7.ensembl.exon.promoter.protein_coding.RData")

# 检查对象的类型
class(genome.coord)

# 尝试将对象转换为数据框
if (class(genome.coord) != "data.frame") {
  genome.coord <- as.data.frame(genome.coord)
  print("The object has been converted to a data frame.")
} else {
  print("The object is already a data frame.")
}

# 查看转换后的数据框内容
head(genome.coord)

 chrom start   end                   gid                 gname                   tid strand    class        biotype byname.uniq bygid.uniq
75652  ChrSy   785  1168  ChrSy.fgenesh.gene.1  ChrSy.fgenesh.gene.1  ChrSy.fgenesh.mRNA.1      - promoter protein_coding        TRUE       TRUE
329717 ChrSy 50779 51012 ChrSy.fgenesh.gene.10 ChrSy.fgenesh.gene.10 ChrSy.fgenesh.mRNA.10      - promoter protein_coding        TRUE       TRUE
337755 ChrSy 53593 53841 ChrSy.fgenesh.gene.11 ChrSy.fgenesh.gene.11 ChrSy.fgenesh.mRNA.11      - promoter protein_coding        TRUE       TRUE
325371 ChrSy 58993 59748 ChrSy.fgenesh.gene.12 ChrSy.fgenesh.gene.12 ChrSy.fgenesh.mRNA.12      + promoter protein_coding        TRUE       TRUE
93954  ChrSy 68366 68668 ChrSy.fgenesh.gene.13 ChrSy.fgenesh.gene.13 ChrSy.fgenesh.mRNA.13      - promoter protein_coding        TRUE       TRUE
152362 ChrSy 73936 74597 ChrSy.fgenesh.gene.14 ChrSy.fgenesh.gene.14 ChrSy.fgenesh.mRNA.14      + promoter protein_coding        TRUE       TRUE

转化为bed文件


bed_data <- genome.coord[, c("chrom", "start", "end", "gid", "strand")]

# 确保列名符合 BED 文件格式
colnames(bed_data) <- c("chrom", "chromStart", "chromEnd", "name", "strand")

# 查看转换后的数据框内容
head(bed_data)

      chrom    chromStart chromEnd        name           strand
75652  ChrSy        785     1168  ChrSy.fgenesh.gene.1      -
329717 ChrSy      50779    51012 ChrSy.fgenesh.gene.10      -
337755 ChrSy      53593    53841 ChrSy.fgenesh.gene.11      -
325371 ChrSy      58993    59748 ChrSy.fgenesh.gene.12      +
93954  ChrSy      68366    68668 ChrSy.fgenesh.gene.13      -
152362 ChrSy      73936    74597 ChrSy.fgenesh.gene.14      +


# 保存为 BED 文件
write.table(bed_data, file = "output_with_gene_id_and_strand.bed", quote = FALSE, sep = "\t", row.names = FALSE, col.names = FALSE)

print("The BED file has been saved as 'output_with_gene_id_and_strand.bed'.")

相关文章

  • bedtools getfasta提取基因序列实战

    由gtf文件得到含CDS坐标的bed文件,并提取CDS序列 首先要注意,gtf文件的序列起始坐标减一,才是bed文...

  • 从vcf文件提取exon中的snp和Indel

    首先制作bed格式的文件包含基因组全部的外显子区域坐标如下: 从vcf文件中提取位于exon区域的变异位点

  • bed文件格式

    有snp的坐标,提取snp位点前后100bp的参考基因组 对snp位点bed文件 start 减10 ,end 加...

  • bedtools intersect 常用

    输出两个文件的染色体位置的交集,这里输出的是 1.bed 和 2.bed 位置取交集后的坐标,跟两文件原位置坐标信...

  • read depth per BED region with B

    输入按坐标排序过的bam比对结果文件和bed区间信息文件,统计bed文件中,目标区间内比对结果的深度信息。 关于S...

  • 收集 | 序列提取工具

    1.BED格式相关的提取 bedtools 最知名的bed文件相关工具,但是和samtools并非出自一家 htt...

  • 使用TBtools提取基因组CDS并转换成蛋白文件

    基因功能注释需要蛋白文件,有时候注释或下载的基因组没有蛋白文件,需提取并转换,据师兄师弟说gffread提取结...

  • hg19_refseq.txt文件各列含义

    ANNOVAR注释会用到的refseq文件(bed文件格式,左闭右开,0 based坐标系统)的各列含义,最后几列...

  • 在R里面对坐标进行映射

    在R里面对坐标进行映射 比如把自己制作好的bam文件的坐标,跟提取自gtf文件的坐标信息对应起来,使用Genomi...

  • Java一些常用得转换

    1提取字符串中得数字 2 html中图片转换,让剧中显示 3 获取assets文件下json文件并转换成json ...

网友评论

      本文标题:提取水稻promoter的坐标并转换成为bed文件

      本文链接:https://www.haomeiwen.com/subject/nvwiqjtx.html