标签:soc oci 来源 技术 mic 结果 mamicode leo 工作者
自从武汉报告了未知流感病毒,相关科技工作者和疾病预防控制人员加班加点,第一时间分离了病毒,并测序了病毒基因组。相比于当年的SARS,这种进步是非常非常巨大的。所以我们能够以最快的速度拿到病毒基因组,下面是该病毒基因组和SARS病毒基因组的简单比较。结果仅供参考。
武汉新冠状病毒基因组共有30473个碱基,SARS病毒基因组29751个碱基,通过blast比对二者基因组,有21905个碱基能够准确比对到SARS基因组中,武汉病毒基因组和SARS病毒基因组有大约72%的相似性。
下图是两种病毒基因组中4种碱基占比,其中SARS病毒基因组中GC含量略高一些。
【新病毒基因组和SARS病毒基因组中各个碱基含量占比】
通过VGAS工具http://cefg.uestc.cn/vgas/,对该病毒基因组进行注释,结果得到11的蛋白编码序列。下面为11个序列的区域和相关注释基因:
起始点 终止点 长度 编码基因
1: 282 13499 13218 orf1a polyprotein (pp1a)
2: 13784 21571 7788 orf1ab polyprotein (pp1ab)
3: 21552 25400 3849 E2 glycoprotein precursor
4: 25409 26236 828 hypothetical protein sars3a
5: 26261 26488 228 <NA>
6: 26539 27207 669 matrix protein
7: 27410 27775 366 hypothetical protein sars7a
8: 27910 28275 366 <NA>
9: 28290 29549 1260 nucleocapsid protein
10: 28300 28593 294 <NA>
11: 29574 29690 117 <NA>
【提示:可左右滑动,显示全部】
基因组图如下
【新病毒基因组与SARS病毒碱基匹配率(上),以及新病毒基因组基因注释(下)】
图中上图表示在新病毒基因组中和SARS病毒基因组碱基匹配程度,以100bp大小为窗口扫描基因组。可以看到整个基因组和SARS病毒匹配最低的窗口也在60%以上。底部图是注释基因在新病毒基因组中的位置和长度。
下图是文献资料中SARS基因组注释图,可以和上述新病毒基因组图比较,可以看到具有高度的相似性和同源性。
【SARS病毒基因组图谱,来源见引用文献】
下表是新病毒的7个基因序列和SARS病毒对应基因序列的匹配度。其中编码衣壳蛋白的nuclecapsid具有最高的相似性(89%),其次为pp1ab基因;匹配程度最低的是sars3a,该基因中只有76%碱基序列和SARS病毒相同。
【备注:本文仅供学习参考!】
参考资料:
Marra, M. A., Jones, S. J., Astell, C. R., Holt, R. A., Brooks-Wilson, A., Butterfield, Y. S., ... & Cloutier, A. (2003). The genome sequence of the SARS-associated coronavirus. Science, 300(5624), 1399-1404.
封面图来源:Image Source: CDC/Dr. Fred Murphy
标签:soc oci 来源 技术 mic 结果 mamicode leo 工作者
原文地址:https://blog.51cto.com/15069450/2577082