标签:The 用法 sof 最可靠的 enc dash log ast 课程
glean工具
当用各类工具完成了注释后,一个问题是,每一个基因组区域,都会获得大量redundant的基因结构注释,到底哪一个注释才是最可靠的?所以,我们需要一个整合工具。
有一种工具是通过统计打分,先手工注释一些基因,然后把所有的自动注释结果跟手工注释比较,给各个工具打个分,最后用这个打分矩阵扩展到所有的基因上。常用的有glean,它不需要training。
evidence modeler是pasa的开发者做的另一个工具,文档详细,使用简单,而且它自带很多格式转换代码,虽然这个工具也需要training,但是它也可以人工打分,虽然人工给的不是最好 http://evidencemodeler.sourceforge.net/
maker工具
从头构建一个物种的基因组,至少包含三个步骤:序列拼接、基因结构注释和基因功能注释。
其中,基因结构注释原理上是最为复杂的,需要首先根据序列结构、已有的转录本序列、蛋白序列,寻找基因结构的证据,然后对这些证据进行整合,给出最终判断。在注释之前,还要考虑重复序列的影响。
MAKER 是一款强大的结构注释流程,它整合了所有以上步骤涉及到的主流算法和软件,使我们能够快速完成基因结构注释。
本课程介绍基因结构注释的原理以及 MAKER 的用法。
MAKER官网:http://www.yandell-lab.org/software/maker.html
MAKER软件使用说明
输入文件,主要有三个(fasta格式):
基因组序列、RNA序列(ESTs/cDNA/mRNA transcripts) 、相关或者近源物种的蛋白质序列
运行maker –CTL,生成如下三个文件:
• maker_exe.ctl - contains the path information for the underlying executables.
• maker_bopt.ctl - contains filtering statistics for BLAST and Exonerate
• maker_opt.ctl - contains all other information for MAKER, including the location of the input genome file.
修改中的maker_opts.ctl的参数。
运行maker
参考来源:
http://blog.sina.com.cn/s/blog_83f77c940102vzeo.html
标签:The 用法 sof 最可靠的 enc dash log ast 课程
原文地址:https://www.cnblogs.com/bio-mary/p/12257159.html