在比较基因组学的时候,经常会听到“共线性”这个词,但是与其对应的有两个不同的概念,即 (1) synteny (2) collinear 二者的区别如下图所示: 可以看到,syntenic,表示的共线性区域,其基因顺利可以不同; 但是, collinear,表示的共线性区域,其基因顺序一致。 ...
分类:
其他好文 时间:
2020-04-05 11:38:49
阅读次数:
63
BWA简介 BWA(Burrow Wheeler Aligner),是一款将DNA序列mapping到参考基因组上的软件。有三个比对算法:BWA backtrack,BWA SW和BWA MEM。详情可以看看 "李恒" 的解释。 BWA backtrack : 100bp以内的短序列,对应的命令: ...
分类:
其他好文 时间:
2020-03-18 18:33:17
阅读次数:
87
1. GapFiller简介 组装出来的基因组草图的scaffold需要进一步进行gaps的close。进行这样功能的软件有:SOAPdenovo GapCloser v1.12r6; IMAGE; GapFiller. GapFiller文章发表在Genome Biology上:Boetzer M ...
分类:
其他好文 时间:
2020-02-24 13:17:46
阅读次数:
91
首先QTL是数量性状位点,比如身高是一个数量性状,其对应的控制基因的位点就是一个数量性状位点,而eQTL就是控制数量性状表达位点,即能控制数量性状基因(如身高基因)表达水平高低的那些基因的位点。 数量性状基因座:控制数量性状的基因在基因组中的位置称数量性状基因座。常利用DNA分子标记技术对这些区域进 ...
分类:
其他好文 时间:
2020-02-22 21:44:38
阅读次数:
154
1、RepeatMasker 1.1、输入 输入格式为fasta序列,不接受其它 GenBank, Staden,等格式。它既可以处理一个批文件(一个文件包含许多条序列),也可以批处理许多文件(每个文件含有一条序列)。 RepeatMasker *.fasta 该命令将mask当前目录下所有的以.f ...
分类:
其他好文 时间:
2020-02-21 12:34:32
阅读次数:
123
1、下载所需的数据库及软件 nr数据库已经有了,这里不做介绍 2、pfam数据库 wget ftp://ftp.ebi.ac.uk/pub/databases/Pfam/current_release/Pfam-A.hmm.gzwget ftp://ftp.ebi.ac.uk/pub/databas ...
分类:
其他好文 时间:
2020-02-18 09:37:31
阅读次数:
103
glean工具 当用各类工具完成了注释后,一个问题是,每一个基因组区域,都会获得大量redundant的基因结构注释,到底哪一个注释才是最可靠的?所以,我们需要一个整合工具。 有一种工具是通过统计打分,先手工注释一些基因,然后把所有的自动注释结果跟手工注释比较,给各个工具打个分,最后用这个打分矩阵扩 ...
分类:
其他好文 时间:
2020-02-03 20:53:19
阅读次数:
105
原位连接:补平产物4℃低温500g离心2min,弃上清,沉淀用1X T4连接酶buffer重悬,按照1~2 Cohesive unit/μL的连接酶用量在250μL连接体系中进行平末端连接,16℃连接4-8小时。 (连接酶的活性,浓度,反应温度和时间都有可能是影响连接效果的因素?而下面解交联后的DN ...
分类:
其他好文 时间:
2020-01-24 00:35:51
阅读次数:
120
导读 :2015 年,阿里云和华大基因立下一个目标:到 2020 年,要在 24 小时完成个人全基因组测序。这在当时是一个几乎被认为不可能的挑战。 而在 2020 年刚开始的第 17 天,我们就实现了这个目标!并且把个人全基因组测序分析做到只需要 15 分钟,不到一顿饭的功夫。 云端实现大规模弹性调 ...
分类:
其他好文 时间:
2020-01-21 10:42:02
阅读次数:
83
去除基因组序列中的未定位的scaffold、Contig序列和线粒体序,主要针对NCBI提供refseq基因组序列,组装到染色体级别的物种基本都通用。将所有碱基统一成大写字母,并计算每条染色体长度,每80个字符换行。处理脚本如下: 1 use strict; 2 open A,"$ARGV[0]";... ...
分类:
其他好文 时间:
2020-01-08 11:00:43
阅读次数:
100