码迷,mamicode.com
首页 > 其他好文 > 详细

pindel 软件基本介绍

时间:2020-11-18 12:34:47      阅读:8      评论:0      收藏:0      [点我收藏+]

标签:mamicode   配置   文件内容   mapped   通过   ima   points   bae   文件格式   

目的:本文主要简单介绍pindel检测sv的基本知识

能力:会基本使用,简单结果文件解读

官网:
 
参考文献:
Ye, K., Schulz, M. H., Long, Q., Apweiler, R. & Ning, Z.
Pindel: a pattern growth approach to detect break points of large deletions and medium sized insertions from paired-end short reads.
Bioinformatics 25, 2865–2871(2009). 
 
pindel变异检测:
 
1.pindel进行sv检测时,需要一个配置文件, 配置文件内容如下所示:
$ cat FLT3_28608223_conf 
edit.sorted.bam	250	FLT3
第一列:bam的绝对路径
第二列:bam的intersize, 写个大概的值即可(本人的测序数据为PE100)
第三列:设一个标签,因为这边可以设多个bam文件,这边的标签就会代替文件名出现在最终的结果中来区分reads的不同来源。列与列之间用制表符或者空格分开。
 
2.pindel进行sv检测的命令行参数:
/jdfstj1/B2C_COM_P1/pipeline/miniconda3/bin/pindel 		-f hg19.fa 		-i FLT3_28608223_conf \  # 上述描述的配置文件
	       -c chr13 \    
		-o FLT3_28608223 \

上述命令可以产生多个结果文件: 不同类似的变异结果分开放置.

FLT3_28608223_BP              
FLT3_28608223_INT_final  
FLT3_28608223_LI  
FLT3_28608223_SI      
FLT3_28608223_TD
FLT3_28608223_CloseEndMapped  
FLT3_28608223_D     
FLT3_28608223_INV        
FLT3_28608223_RP
D = deletion 缺失序列
SI = short insertion  短的插入序列
INV = inversion 转位
TD = tandem duplication     串联重复
LI = large insertion 长的插入序列,这个文件的格式跟其他文件的很不相同
BP = unassigned breakpoints      没有分到上面任意一种类型剩下来的断点

 

3.第二步的结果可能利于我们的阅读,因此可通过以下操作将其转换为vcf文件格式

/jdfstj1/B2C_COM_P1/pipeline/miniconda3/bin/pindel2vcf 		-r hg19.fa 		-R hg19 		-p FLT3_28608223_TD 		-d 20201101 \  # 随便是个啥,没啥用
		-v FLT3_28608223_TD.vcf 		-G#让它尽可能符合GATK输入文件的要求。

  技术图片

 

 

 

技术图片

技术图片

技术图片

pindel 软件基本介绍

标签:mamicode   配置   文件内容   mapped   通过   ima   points   bae   文件格式   

原文地址:https://www.cnblogs.com/lmt921108/p/13964733.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!