MAGENTA是一款计算工具,利用全基因组遗传数据,计算预先设定的涉及生物过程或者功能性基因集在遗传相关性的富集程度。开发的目的是分析基因型不是现成的数据集,比如大型的全基因组关联荟萃分析。在以下两种情况下可以使用:1,检验某个特定的假设;2,通过检测一系列已知的生物基因集(从不同的公共数据库提供的 ...
分类:
Web程序 时间:
2016-10-23 17:52:42
阅读次数:
268
今天粗略学习了遗传算法,对于基因采用二进制表示、染色体采用一串二进制数表示(如11000100)还是比较容易理解的。但是,在TSP问题(旅行商问题,travelingsalesman problem)中,需要通过遗传算法求解较优的旅行路径,如何对基因和染色体进行建模?比较合理的思路是采用城市排列作为 ...
分类:
其他好文 时间:
2016-10-07 18:01:05
阅读次数:
159
题目大意是:给定两组DNA序列,要你求出它们的最大相似度 每个字母与其他字母或自身和空格对应都有一个打分,求在这两个字符串中插入空格,让这两个字符串的匹配分数最大 /* 思路是很好想的,设f[i][j]为A染色体前i个基因和B染色体前j个基因匹配的最大值 第一次测样例WA了一把,f又没有赋最小值,今 ...
分类:
其他好文 时间:
2016-10-06 22:12:05
阅读次数:
214
http://blog.csdn.net/skenoy/article/details/38346489 经过几天的摸索和网上资料的查询对GATK软件有点小心得,现总结如下: 1. fasta文件最好用定位到染色体上的数据,可以不用注释VCF文件(GVF),但如果用VCF文件保证以下几个条件: 1) ...
分类:
其他好文 时间:
2016-09-30 12:25:37
阅读次数:
177
GFF3文件按照染色体位置排序#!/usr/bin/envpython
#-*-coding:utf-8-*-
tmp=open(‘2.txt‘,‘w‘)
withopen(‘147389_transcript.fa.gff3‘,‘r‘)asf:
forlineinf:
if‘#‘notinline:
line1=line.strip().split()
ifline1[2]==‘mRNA‘:
tmp.write(line.strip()+‘\t@\t‘,)
ifline1[2]==‘e..
分类:
编程语言 时间:
2016-08-29 13:26:09
阅读次数:
527
对生物有一定了解的朋友都知道DNA是染色体的重要组成部分,DNA结构中包含重要的遗传物质,孩子的DNA来自父母DNA的组合,这就是为什么“一家人相像”的奥秘所在。ChemDraw虽然号称是化学结构绘制工具但是它并不仅仅只能够用于化学领域,生物领域也是可以使用的。使用其他图形编辑器绘制DNA结构并不是... ...
分类:
其他好文 时间:
2016-08-02 11:41:44
阅读次数:
363
2.交叉 交叉是遗传算法中的一个重要操作,它的目的是从两条染色体中各自取出一部分来组合成一条新的染色体这里,在车间调度中一种常见的交叉方法叫Generalized Order Crossover方法(GOX),假设有三个工件A,B,C, 每个工件下面包含三道工序,根据这一信息我们可以利用上一节介绍的 ...
分类:
编程语言 时间:
2016-07-16 23:11:21
阅读次数:
432
p-reads是啥?校正之后的reads 杂合度对基因组组装的影响?Aa就是杂合,一般植物测序的材料都会处理为纯合,因此我们可以认为同源染色体是完全相同的序列,默认我们还认为姐妹染色单体之间的序列是一致的。这样我们测序得到的就是一个整套的单倍体。动物和人的基因组组装就会显得十分复杂,因为无法弄到纯合... ...
分类:
其他好文 时间:
2016-06-16 20:10:00
阅读次数:
124
蓝桥杯网站修好了,今天才关注到,补上上次没有发的BASIC-20和开始今天的五道题:
【BASIC-20】 基础练习 数的读法
问题描述
Tom教授正在给研究生讲授一门关于基因的课程,有一件事情让他颇为头疼:一条染色体上有成千上万个碱基对,它们从0开始编号,到几百万,几千万,甚至上亿。
比如说,在对学生讲解第1234567009号位置上的碱基时,光看着数...
分类:
其他好文 时间:
2016-06-07 13:10:13
阅读次数:
248