转自:http://blog.sina.com.cn/s/blog_46d703950101fqi5.html
BED文件格式
BED文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。
必须包含的3列:
chrom,染色体或scafflold的名字(eg chr3,chrY, chr2_random, scaffold0671 )
chromStart染色体或scaffold的起始位置,染色体第一个碱基的位置是0
chromEn染色体或scaffold的结束位置,染色体的末端位置没有包含到显示信息里面。例如,首先得100个碱基的染色体定义为chromStart =0 . chromEnd=100,碱基的数目是0-99
9个额外的可选列:
4. name指定BED行的名字,这个名字标签会展示在基因组浏览器中的bed行的左侧。
5. score 0到1000的分值,如果在注释数据的设定中将原始基线设置为1,那么这个分值会决定现示灰度水平(数字越大,灰度越高),下面的这个表格显示Genome Browser
shade
score in range≤ 166167-277278-388389-499500-611612-722723-833834-944≥ 945
6. strand定义链的方向,''+”或者”-”
7. thickStart起始位置(The starting position at which the feature is drawn thickly)(例如,基因起始编码位置)
8. thickEnd终止位置(The ending position at which the feature is drawn thickly)(例如:基因终止编码位置)
9 itemRGB 是一个RGB值的形式, R, G, B (eg. 255, 0, 0),如果itemRgb设置为'On”,这个RBG值将决定数据的显示的颜色。
10blockCount BED行中的block数目,也就是外显子数目
11blockSize用逗号分割的外显子的大小,这个item的数目对应于BlockCount的数目
12blockStarts-用逗号分割的列表,所有外显子的起始位置,数目也与blockCount数目对应.
网友评论