码迷,mamicode.com
首页 > 其他好文 > 详细

使用trim_galore软件遇到的问题

时间:2017-09-02 11:29:41      阅读:406      评论:0      收藏:0      [点我收藏+]

标签:fast   令行   --   end   length   排除   日志   .gz   sam   

我的原始测序数据是双端测序,在用trim_galore软件去接头的这一步,使用的命令行是

time nohup trim_galore R17002628-SKOV3-m6A_combined_R1.fastq.gz R17002628-SKOV3-m6A_combined_R2.fastq.gz &

相当然的以为软件会默认为双端测序,结果接下来一步用tophat软件mapping到参考基因组上的时候,发现mapping率只用10%,低的惊人。后来排除建库失败的可能,我去查看了trim_galore运行时的日志文件,如下:

Input filename: /data/itmll/yanlu/2017-08-24_data/Project_s272g01038/Sample_R17002629-SKO
V3-Tax-m6AR17002629-SKOV3-Tax-m6A_combined_R2.fastq.gz
Trimming mode: single-end

发现是single_end!

正确的命令行是

time nohup trim_galore --paired R17002629-SKOV3-Tax-m6A_combined_R1.fastq.gz R17002629-SKOV3-Tax-m6A_combined_R2.fastq.gz &

指定--paired参数

mapping率低的原理:

single-end模式下,可能双端测序的同一条read中有一条的length不合格,所以trim_galore会将其删除,结果是trim后的两个文件read数不一样。tophat认为双端测序文件的顺序是一一对应的,这样导致的后果是,tophat以为双端测序的两条readmapping到不同的位置上了,就会舍弃,导致mapping率低。

使用trim_galore软件遇到的问题

标签:fast   令行   --   end   length   排除   日志   .gz   sam   

原文地址:http://www.cnblogs.com/zhengzh/p/7465888.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!