BED 文件格式

作者: Z_bioinfo | 来源:发表于2022-03-17 17:09 被阅读0次

    BED (Browser Extensible Data)格式文件就是通过规定行的内容来展示注释信息

    BED文件每行至少包括chrom,chromStart,chromEnd三列;另外还可以添加额外的9列,这些列的顺序是固定的。

    在自定义BED文件时,前面可以有注释行,以“browser”或“track”开头,可以设置一些参数便于浏览器更好展示BED文件信息。但是,下游的一些分析工具,例如bedToBigBed,是不接受有注释的BED文件的。

    BED文件必须的3列:

    chrom - 染色体号; 例如,chr1,chrX。。。。。。。

    chromStart - feature在染色体上起始位置. 从0开始算,染色体上第一个碱基位置标记为0。

    chromEnd - feature在染色体上终止位置。染色体上前100个碱基片段的位置位置标记为:chromStart=0, chromEnd=100。 实际上,第100个碱基不属于当前片段中,当前片段的碱基应该是0-99。所以在BED文件中,起始位置从0开始,终止位置从1开始。

    BED文件可选的9列:

    4.name - BED行名,在基因组浏览器左边显示;

    5.score - 在基因组浏览器中显示的灰度设定,值介于0-1000;

    6.strand - 正负链标记. Either "." (=no strand) or "+" or "-".

    7.thickStart - feature起始位置。绘制特征的起始位置(例如,基因显示中的起始密码子)。当没有这部分时,thickStart和thickEnd通常设置为chromStart位置。

    8.thickEnd - feature编码终止位置

    9.itemRgb - R,G,B (e.g. 255,0,0)值,当itemRgb 设置为 "On",BED的行会显示颜色

    10.blockCount - blocks (exons)数目

    11.blockSizes - blocks (exons)大小列表,逗号分隔,对应于blockCount

    12.blockStarts -blocks (exons)起始位置列表,逗号分隔,对应于blockCount.;这个起始位置是与chromStart的一个相对位置。

    例如:

    bio@ubuntu ~]$ less -S GRCh38.gene.bed 
    
    chr3    124792319       124792562       ENSG00000276626 RF00100 -
    chr1    92700819        92700934        ENSG00000201317 RNU4-59P        -
    chr14   100951856       100951933       ENSG00000200823 SNORD114-2      +
    chr22   45200954        45201019        ENSG00000221598 MIR1249 -
    chr1    161699506       161699607       ENSG00000199595 RF00019 +
    

    相关文章

      网友评论

        本文标题:BED 文件格式

        本文链接:https://www.haomeiwen.com/subject/bkavdrtx.html