标签:蛋白质 fast val 矩阵 out 一个 last 结果 pytho
由于获取位置特异性矩阵需要使用psiblast -db swissprot -query 0.txt -evalue 0.001 -num_iterations 3 -out_ascii_pssm 0.pssm命令获取,然而该命令只对一个序列比对,如果把大量蛋白质序列输入,其结果会不断更新,最后得到最后那个序列的位置特异性矩阵,所以,需要对于蛋白质序列进行分割成多个文件
代码如下:(这里每个人蛋白质序列所用的长度不同,可根据情况进行调整)
i = 0 fw = open(‘/blast-2.10.0+/bin/0.txt‘, ‘w‘) for line in open(‘/blast-2.10.0+/bin/1.fa‘, ‘r‘): fw.write(line) i += 1 if i % 2 == 0: fw.close() fw = open(str(i) + ‘.txt‘, ‘w‘) fw.close()
蛋白质序列位置特异性矩阵(PSSM)的获取的准备工作:fasta序列的处理
标签:蛋白质 fast val 矩阵 out 一个 last 结果 pytho
原文地址:https://www.cnblogs.com/cong3Z/p/12775480.html