tophat的用法

时间：2017-07-01 23:24:25 阅读：362 评论：0 收藏：0 [点我收藏+]

标签：cti -o nbsp 不同 mic 融合 options 规范 rand

概述：tophat是以bowtie2为核心的一款比对软件。

tophat工作分两步：

1.将reads用bowtie比对到参考基因组上。

2.将unmapped-reads打断成更小的fragments，比对到参考基因组上，如果比对成功，建立剪切点。

用法：tophat [options]* <index_base> <reads1_1[,…,readsN_1]> [reads1_2,…readsN_2]

<index_base>：参考基因组的index文件的具体目录，例如，index文件存放在当前目录下的index文件夹，文件的名字是hg19.*.*, index数据的文件应该是：./index/hg19，不用写到./index/hg19.*.*。参考基因组应该和index文件放在同一目录中。

reads：PE reads必须放在不同的两个文件中，文件名必须按照*_1, *_2的规范成对出现。如：A.reads1_1.fastq B.reads1_1.fastq A.reads1_2.fastq B.reads1_2fastq

常用options:

-o | --output default: ./tophat_out 输出的文件夹路径。

-r | --mate-inner-dist default: 50 成对的reads之间的平均inner距离。例如：fragments长度300bp，reads长度50bp，则其inner距离为200bp，该值该设为200。

--mate-std-dev default:20 inner距离的标准偏差。

-a | --min-anchor-length default: 8 read的锚定长度：该参数能设定的最小值为3；锚定在junction两边的reads长度只有都大于此值，才能用于junction的验证。

--library-type Tophat处理的reads具有链特异性。比对结果中将会有个XS标签。一般Illumina数据的library-type为 fr-unstranded。

-G | --GTF 提供基因模型的注释文件，GTF 2.2 或者 GFF 3 格式的文件。如果设置了该参数，Tophat 则先提取出转录子序列，然后使用Bowtie2将reads比对到提取的转录组中；只有不能比对上的reads再比对到genome；比对上的reads再打断转变成genomic mappings；再融合新的mappings和junctions作为最后的输出。值得注意的是GTF/GFF文件代表chromosome和contig的第一列要和bowtie index中的参考序列名一致。




参考文章：
http://blog.sina.com.cn/s/blog_8808cae20101amqp.html

tophat的用法

标签：cti -o nbsp 不同 mic 融合 options 规范 rand

原文地址：http://www.cnblogs.com/timeisbiggestboss/p/7103559.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行