码迷,mamicode.com
首页 > 其他好文 > 详细

bed文件格式解读

时间:2018-08-19 13:03:12      阅读:2373      评论:0      收藏:0      [点我收藏+]

标签:sans   nbsp   格式   mil   browser   染色体   额外   形式   分割   

1)BED文件

 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段数目必须是任意单条数据的在注释上一致。

技术分享图片

 BED文件结构:
-------------------------------------------------------------必须有以下3列------------------------------------------------------------------------
    chrom :即染色体号
    chromStart :即feature在染色体上起始位置 。在染色体上最左端坐标是0
    chromEnd :即feature在染色体上的终止位置。例如一个染色体前100个碱基定义为chromStart=0,  chromEnd=100, 跨度为 0-99.
----------------------------------------------------------------可选9列-------------------------------------------------------------------------------
    name :feature的名字 ,在基因组浏览器左边显示;
    score :在基因组浏览器中显示的灰度设定,值介于0-1000;

   技术分享图片
    strand :定义链的方向,‘‘+” 或者”-”
    thickStart :起始位置(例如,基因起始编码位置)
    thickEnd :终止位置(例如:基因终止编码位置) 
    itemRGB :是一个RGB值的形式, R, G, B (eg. 255, 0,0), 如果itemRgb设置为‘On”, 这个RBG值将决定数据的显示的颜色。
    blockCount :BED行中的block数目,也就是外显子数目
    blockSize:用逗号分割的外显子的大小, 这个item的数目对应于BlockCount的数目
    blockStarts :用逗号分割的列表, 所有外显子的起始位置,数目也与blockCount数目对应

2)和gff之间的关系


   

4) 参考资源

https://en.wikipedia.org/wiki/BED_file_format
   

 

bed文件格式解读

标签:sans   nbsp   格式   mil   browser   染色体   额外   形式   分割   

原文地址:https://www.cnblogs.com/djx571/p/9499795.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!