码迷,mamicode.com
首页 > 其他好文 > 详细

23andme、gsa、wegene各染色体位点统计

时间:2017-07-20 15:24:59      阅读:184      评论:0      收藏:0      [点我收藏+]

标签:菜鸟   tar   python   优势   技术   open   pen   alt   width   



---
shell还没入门,确切的说是还没学,用python3写了个小脚本统计23andme、gsa、wegene各染色体位点.
代码如下:
23andme:

chromesomeset = set()
snp = {}
for x in range(1,24):
	snp[str(x)] = 0
snp[‘X‘] = 0
snp[‘Y‘] = 0
snp[‘MT‘] = 0
print(snp)
chromesome = ‘‘
inf = open(‘genome_jun_v3_Full_201608225359.txt‘)
for line in inf:
	if line.startswith(‘r‘):
		#snp_name = line.strip().split(‘\t‘)[0]
		chromesome = line.strip().split(‘\t‘)[1]
		chromesomeset.add(chromesome)
		snp[chromesome] += 1
		#print(chromesome)
		#print(snp[%s % str(chromesome)])
		
sorted(snp.keys())
for chromesome in chromesomeset:
	print(chromesome, ‘\t‘, snp[chromesome])

gsa的同上,稍做一两处调整。
wegene的没有源数据,找的生信菜鸟团jimmy的shell

cut -f 2 jimmy_wegene.txt | unique -c |grep -v "^#" 

# 结果分析

技术分享

从图中可以看出,毕竟23andme是最早做的,位点最多,但是,现在来讲,大约也就上千个点可以被解读,所以意义不大。但是,国内公司的还是引入了中国人的特征位点的,更具有人群优势,适合国人的基因检测,现阶段,大概也就这样了,不知何时可以每个人做全外或全基因检测。

 

23andme、gsa、wegene各染色体位点统计

标签:菜鸟   tar   python   优势   技术   open   pen   alt   width   

原文地址:http://www.cnblogs.com/zd200572/p/7210974.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!