码迷,mamicode.com
首页 > 其他好文 > 详细

项目一:使用二代数据进行基因组组装(局部组装和全局组装)

时间:2016-06-20 20:31:48      阅读:165      评论:0      收藏:0      [点我收藏+]

标签:

项目数据:

  • kongyu_131_PCRfree_.CCAAT_L006_R1_001.fastq.gz (100X)(19G)
    kongyu_131_PCRfree_.CCAAT_L006_R2_001.fastq.gz (100X)(20G)
  • Y255_PCRfree_.TCCGC_L005_R1_001.fastq.gz (30X)(5.4G)
    Y255_PCRfree_.TCCGC_L005_R2_001.fastq.gz (30X)(6.0G)
  • all.chrs.con.fasta (364M)

工具:

  • BWA
  • IGV
  • SOAPdenovo

策略:

  • 将测序的二代reads使用BWA比对到参考基因组,分成不同的窗口,按窗口进行局部组装,然后合并。

 

预备知识:

  • 能用熟练使用 Perl 和 shell 写脚本
  • 会熟练使用 PBS 提交任务
  • BWA使用方法
  • IGV使用方法
  • SOAPdenovo使用方法

 

 

 

局部组装的问题:

已经有两批人没组出来了,局部组装大多不可能组装出完整的100K窗口,因为二代序列reads太短,重复序列太多,重复序列会导致连接中断,一个窗口会出现很多片段,而且也没有方法将其继续连接起来,所以他们都半途而废了。

后续可能会遇到的情况,必须借助后期的分析手段,将诸多片段连接成完整的序列。

杜发的文章,完全是在无参考基因组的情况下,denovo组装,利用多种手段,才将零碎的序列组装成完整的基因组。

老板懂得也不多,最大的贡献就是督促。

项目一:使用二代数据进行基因组组装(局部组装和全局组装)

标签:

原文地址:http://www.cnblogs.com/leezx/p/5601487.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!