标签:部分 估计 tin 序列 结构 存在 info 因此 alt
人类基因组包含22条染色体和1条X或者Y染色体,这些染色体长度为45~279Mb,加起来共为3286Mb。
基于染色体的结构,全部基因可被分为常染色质(euchromatin)区域(通常包含活性基因)和异质染色质(heterochromatin)区域,后者携带低密度的活性基因。常染色质组成了基因组的主要成分,约为2.9×109bp,已测序的基因组序列覆盖了约90%的常染色质。
实际上只有一小部分人类基因序列(约1%,相当于外显子部分)是用来编码蛋白质的,而内含子则组成了蛋白质基因的其他部分,这样,这些编码蛋白质的基因(外显子加内含子)占基因组总量的约25%。人类基因的平均长度为27kb,平均有9个外显子,而这9个外显子组成总共约1340bp的编码序列,因此编码序列平均占基因长度5%。
两组队人类基因组的相互独立的测序结果分别产生了30000个和40000个基因数目的估计。另人惊奇的结果是,他们分析到的基因只有50%的交叉。早起的根据RNA转录物来分析人类基因组的方法鉴定到了11000个基因,几乎所有这些基因在这两套方法中都存在,占领鉴定到相同基因的绝大多数。
标签:部分 估计 tin 序列 结构 存在 info 因此 alt
原文地址:https://www.cnblogs.com/daimakun/p/10068506.html