要求:筛选染色体上符合要求的连续的纯合突变区域。perl (/(ㄒoㄒ)/~~现在只会用perl) 笨办法,正则匹配: 举例子1: my $info=(HOMA,871334,HET,874950,HOMA,876499,HOMA,887643); while($info =~ /((HOMA,(\ ...
分类:
其他好文 时间:
2017-05-18 16:53:27
阅读次数:
191
首先,进入NCBI的主页网站:https://www.ncbi.nlm.nih.gov/variation/view/ 进入后,在下图红色框框位置输入目的SNP,比如rs608139 输完后,出现如下结果,箭头指向的是该SNP当前所在基因座的位置,即p21,由于该SNP在2号染色体上,因为我们也写为 ...
分类:
其他好文 时间:
2017-04-12 21:41:45
阅读次数:
1128
很多时候,我们需要对取出的SNV进行注释,这个时候可能会在R上进行注释,通常注释文件都含有Chr(染色体)、Start(开始位点)、End(结束位点)、Description(描述),而我们的SNV文件通常是拥有Position(位置),因此我们可以先定位Chr,再用Postion去定位到Start ...
分类:
编程语言 时间:
2017-04-07 21:24:30
阅读次数:
332
问题描述 Tom教授正在给研究生讲授一门关于基因的课程,有一件事情让他颇为头疼:一条染色体上有成千上万个碱基对,它们从0开始编号,到几百万,几千万,甚至上亿。 比如说,在对学生讲解第1234567009号位置上的碱基时,光看着数字是很难准确的念出来的。 所以,他迫切地需要一个系统,然后当他输入12 ...
分类:
其他好文 时间:
2017-04-04 21:36:23
阅读次数:
272
由于基因组数据过大,想进一步用R语言处理担心系统内存不够,因此想着将文件按染色体拆分,发现python,awk,R 语言都能够非常简单快捷的实现,那么速度是否有差距呢,因此在跑几个50G的大文件之前,先用了244MB的数据对各个脚本进行测试,并且将其速度进行对比。 首先是awk处理,awk进行的是逐 ...
分类:
编程语言 时间:
2017-03-26 11:15:18
阅读次数:
237
遗传算法 1 基本概念 遗传算法(GA)的概念是由Holland于1973年受生物进化论的启发而首次提出的。它是一种通过模拟生物界自然选择和遗传机制的随机搜索算法。 遗传算法基本思想是模拟自然界优胜劣汰的进化现象,把搜索空间映射为遗传空间,把可能的解编码成一个向量——染色体,向量的每个元素称为基因。 ...
分类:
编程语言 时间:
2017-03-23 18:24:40
阅读次数:
242
http://www.cogonline.com/Article/zyyd/yjsj/144070515.html Desheng Liang,* Ying Peng,* Weigang Lv,* Linbei Deng,* Yanghui Zhang,* Haoxian Li,* Pu Yang, ...
分类:
其他好文 时间:
2017-03-16 18:57:39
阅读次数:
272
概念 图位克隆(Map - based cloning) 又称定位克隆(positional cloning) , 1986 年首先由剑桥大学的Alan coulson 提出[5 ] ,用该方法分离基因是根据目的基因在染色体上的位置进行的,无需预先知道基因的DNA 顺序,也无需预先知道其表达产物的有... ...
分类:
其他好文 时间:
2017-01-18 15:14:38
阅读次数:
241
什么是soft-clipped reads 当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads,这些reads对于鉴定染色体结构变异及外源序列整 ...
分类:
其他好文 时间:
2016-12-22 22:43:47
阅读次数:
856
20世纪中期,随着蛋白质空间结构的解析和DNA双螺旋的发现,形成了以遗传信息载体核酸和生命功能执行者蛋白质为主要研究对象的分子生物学时代。分子生物学的诞生使传统的生物学研究转变为现代实验科学。但是,在生命科学领域的实验科学与其它实验科学如实验物理学相比,更多地是注重经验,而非抽象的理论或概念。此外, ...
分类:
其他好文 时间:
2016-11-02 23:28:27
阅读次数:
288