当前位置: 首页 > 工具软件 > bed > 使用案例 >

BED 文件格式

丁景山
2023-12-01

原文:http://blog.csdn.net/biubiuv/article/details/40348135


BED 文件格式

 BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释信息,用于展示序列注释信息

 BED行有3个必须的列9个额外可选的列。 以tab隔开。每行的数据格式要求一致。

必须包含的3列:

   1.  chrom  - 染色体名字(e.g. chr3chrY, chr2_random)scafflold 的名字(e.g. scaffold0671 ).

   2.  chromStart - 染色体或scaffold的起始位置,染色体第一个碱基的位置是0

   3.  chromEnd - 染色体或scaffold的结束位置,染色体的末端位置没有包含到显示信息里面。至少为1。例如,首先得100个碱基的染色体定义为chromStart =0 .chromEnd=100, 碱基的数目是0-99


9 个额外的可选列

  4.   name - 指定BED行的名字,这个名字标签会展示在基因组浏览器中的bed行的左侧。【官方名字或自定义

  5.   score   - 01000的分值,如果在注释数据的设定中将原始基线设置为,那么这个分值会决定显示灰度水平(数字越大,灰度越高),下面的这个表格显示GenomeBrowser

 

shade         
score in range  ≤ 166167-277278-388389-499500-611612-722723-833834-944≥ 945

.6.    strand - 定义链的方向,''+” 或者”-”

  7.     thickStart - 起始位置(The starting position atwhich the feature is drawn thickly)(例如,基因起始编码位置)

  8.     thickEnd - 终止位置(The ending position at whichthe feature is drawn thickly)(例如:基因终止编码位置)   

  9.     itemRGB - 是一个RGB值的形式, R, G, B (eg. 255, 0,0), 如果itemRgb设置为'On”, 这个RBG值将决定数据的显示颜色

  10.   blockCount   - BED行中的block数目,也就是外显子数目

  11.   blockSize - 用逗号分割的外显子的大小, 这个item的数目对应于BlockCount的数目

  12.   blockStarts  - 用逗号分割的列表, 所有外显子的起始位置,数目也与blockCount数目对应.


例子:
track name=pairedReads description="Clone Paired Reads" useScore=1
chr22 1000 5000 cloneA 960 + 1000 5000 0 2 567,488, 0,3512
chr22 2000 6000 cloneB 900 - 2000 6000 0 2 433,399, 0,3601

BED文件中起始坐标为 0,结束坐标至少是 1 。

bed格式可以用在类似GBrowse这样的基因组数据可视化工具中。常用软件有bedtools。

注意:用于在GBrowse上展示相关注释的bed格式通常第一行有一个关于track的描述信息。

参考:http://http://genome.ucsc.edu/FAQ/FAQformat.html#format1

 类似资料: