码迷,mamicode.com
首页 > 其他好文 > 详细

BED文件格式

时间:2020-03-09 16:19:25      阅读:55      评论:0      收藏:0      [点我收藏+]

标签:水平   end   count   字段   rac   mat   定义   core   blocks   

bed文件(browse extensive data)以及gff文件(general fearture format) bed文件

第一列是染色体或者contig信息。

第二列是起始位置,从0开始。

第三列是终止位置。

第四列是bed列的名字。

第五列是score。

第六列是链方向。

第七列是基因起始。

第八列是基因终止。

第九列是RGB值。

第十列是外显子数量。

第十一列是外显子大小。

第十二列是外显子起始位置。

详解:

首先是三个要求的BED字段
1,chrom, 染色体或scafflold 的名字(eg chr3, chrY, chr2_random, scaffold0671 )
2,chromStart 染色体和scaffold的起始位置,第一个染色体的位置是0
3,chromEn 染色体和scaffold的结束位置,染色体的末端位置没有包含到显示信息里面。例如,首先得100个碱基的染色体定义为chromStart =0 . chromEnd=100, 碱基的数目是0-99
 
其次9个额外的可选BED字段是:
4,name 定义BED 的名字
5,score 0到1000的分值,如果track线在注释时属性设置为1,那么这个分值会决定现示灰度水平,数字越大,灰度越高。下面的这个表格显示Genome Browser
6,strand 定义链的‘‘+” 或者”-”
7,thickStart 开始的位置,这个特征是画thickly(例如,在开始的编码显示基因的显示
8,thickEnd 结束的位置,这个特征是画thickly例如,在结束的编码显示基因的显示 
9,itemRGB An AGB 值的形式, R, G, B (eg. 255, 0, 0), 如果track line itemRgb属性是设置为‘On”, 这个RBG 值将决定数据的显示的颜色在BED 线。 注意, 它推荐简单的颜色方案(eight color or less )是用作这个属性避免颜色资源在基因组浏览器上过多
10,blockCount BED线在exon 的block数目
11,blockSize 用逗号分割block size, 这个item的列表对应于BlockCount
12,blockStarts- 用逗号分割的列表, 所有的blockStart位置应该被计算相关于chromStart, 这个数字的项应该对应于blockCount..

BED文件格式

标签:水平   end   count   字段   rac   mat   定义   core   blocks   

原文地址:https://www.cnblogs.com/daxiongblog/p/12449279.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!