码迷,mamicode.com
首页 > 其他好文 > 详细

混合纠错PBcR--Hybrid error correction and de novo assembly of single-molecule sequencing reads

时间:2016-11-16 02:08:58      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:范围   lan   软件   重复   dna   复杂   san   算法   nat   

原文链接:Hybrid error correction and de novo assembly of single-molecule sequencing reads

单分子测序reads(PB)的混合纠错和denovo组装

我们广泛使用的PBcR的原始文章就是这一篇

摘要:

PB技术可以产生极长的reads,可以显著提高基因组和转录组的组装。

然而,单分子测序的reads的error rate非常高,这限制了它们在重测序方面的应用。

为了解决这个问题,我们创造了PBcR这个纠错算法和组装策略:使用短的、高精准度的reads 来校正单分子测序reads中的错误。

我们在PB RS平台证明了这个算法的实用性,从噬菌体、原核、真核;从基因组到转录组。

我们的长reads纠错达到了99.9%的base-call accuracy,从而使得组装的效果比当下的策略更好。

在最好的栗子里,三代的组装结果的contig的N50是二代的组装结果的五倍。

 

前言:

二代技术:454焦磷酸测序,Illumina边合成边测序,低成本,高通量;相较于一代的sanger测序。

二代的明显的缺点:测序之前,源DNA需要扩增,会引入偏差;reads短,导致组装和分析困难。

三代,单分子,实时测序,无偏差,reads长,周期短,有利于denovo的基因组和转录组组装,可以解决复杂的重复,可以跨越基因的整个转录本。

然而,三代只有82.1%~84.6%的准确率,主要由insertion和deletion造成;如此高的错误率会严重影响reads的比对,双序列比对会double错误率,远超过5%~10%的组装软件的承受范围;简单的增加alignment sensitivity是不可行的。

 

文章信息量太大,慢慢读…

混合纠错PBcR--Hybrid error correction and de novo assembly of single-molecule sequencing reads

标签:范围   lan   软件   重复   dna   复杂   san   算法   nat   

原文地址:http://www.cnblogs.com/leezx/p/6067845.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!