标签:elf 二进制文件 conda bin art taf callback class import
Pysam可用来处理bam文件
安装:
用 pip 或者 conda即可
使用:
Pysam的函数有很多,主要的读取函数有:
AlignmentFile:读取BAM/CRAM/SAM文件
VariantFile:读取变异数据(VCF或者BCF)
TabixFile:读取由tabix索引的文件;
FastaFile:读取fasta序列文件;
FastqFile:读取fastq测序序列文件
一般常用的是第一个和第二个。
例子:
import pysam
bf = pysam.AlignmentFile("in.bam","rb"); 其中r = read, b:binary. 二进制文件。 bam文件index
bf是一个迭代器,可以next()或者for读取
for i in bf:
print i.reference_name,i.pos,i.mapq,i.isize
结果:
ctg000331_np121 144935 27 -284
ctg000331_np121 144940 48 291
ctg000331_np121 144941 48 309
ctg000331_np121 144944 48 255
ctg000331_np121 144946 27 -370
ctg000331_np121 144947 27 -346
i.reference_name代表read比对到的参考序列染色体id;
i.pos代表read比对的位置;
i.mapq代表read的比对质量值;
i.isize代表PE read直接的插入片段长度,有时也称Fragment长度;
一些功能:
检测index文件是否存在存在即为true
用完记得关闭
bf.count(contig="ctg000331_np121", start=1, stop=6000)
24
标签:elf 二进制文件 conda bin art taf callback class import
原文地址:https://www.cnblogs.com/zhanmaomao/p/11990448.html