码迷,mamicode.com
首页 > 编程语言 > 详细

python文本处理---计算fasta文件中不同氨基酸的数目

时间:2017-12-13 23:44:06      阅读:178      评论:0      收藏:0      [点我收藏+]

标签:out   round   family   字符   col   pytho   usr   class   [1]   

#::!/usr/bin/python3
#-*- coding:utf-8 -*-
#计算fasta文件中各个氨基酸的含量

import sys
args=sys.argv

f=open(args[1], r)
fw=open(out.txt, w)

line=f.read()
txt=‘‘.join(line.split(\n)[1:])       #可以得到氨基酸序列


#构建了各个氨基酸和含量的字典
##注意collections模块中Counter的用法
from collections import Counter
dict=Counter(txt)       #Counter直接返回字典


#文件的write方法只能写入字符串,
#因此要先将字典转变为字符串模式;json模块
import json
strdict=json.dumps(dict)
fw.writelines(strdict)
fw.writelines(\n)
fw.writelines(str(sum(dict.values())))
fw.writelines(\n)


#计算指定氨基酸的百分比
‘‘‘
for index  in dict.keys():
    if index==args[2]:
        rate=str(dict[index]/sum(dict.values()))
        fw.writelines(‘\n‘)
        fw.writelines(rate)
        fw.writelines(‘\n‘)
‘‘‘

f.close()
fw.close()

 

python文本处理---计算fasta文件中不同氨基酸的数目

标签:out   round   family   字符   col   pytho   usr   class   [1]   

原文地址:http://www.cnblogs.com/lmt921108/p/8034685.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!