人类基因组包含22条染色体和1条X或者Y染色体,这些染色体长度为45~279Mb,加起来共为3286Mb。 基于染色体的结构,全部基因可被分为常染色质(euchromatin)区域(通常包含活性基因)和异质染色质(heterochromatin)区域,后者携带低密度的活性基因。常染色质组成了基因组的 ...
分类:
其他好文 时间:
2018-12-05 02:14:07
阅读次数:
180
遗传算法基本原理 遗传算法是从代表问题可能潜在解集的一个种群开始的,而一个种群则由经过基因编码的一定数量的个体组成。每个个体实际上是染色体带有特征的实体。作为多个基因的集合,单个染色体是遗传物质的主要载体,其在种群中的命运由其基因组合决定。初始种群产生以后按照优胜劣汰、适者生存的原理,逐代演化产生出 ...
分类:
编程语言 时间:
2018-10-21 12:08:08
阅读次数:
354
1)BED文件 BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段数目必须是任意单 ...
分类:
其他好文 时间:
2018-08-19 13:03:12
阅读次数:
2373
1)gff3及gtf2简介 一个物种的基因组测序完成后,需要对这些数据进行解读,首先要先找到这些序列中转录起始位点、基因、外显子、内含子等组成元件在染色体中的位置信息(即注释)后才能再进行深入的分析。gff/gtf是贮存这些注释信息的两种文件格式。 GFF(general feature forma ...
分类:
其他好文 时间:
2018-08-18 17:47:21
阅读次数:
330
浅谈遗传算法: "https://www.cnblogs.com/AKMer/p/9479890.html" Description $mzf$在踏上寻找$oxy$的路程之后不小心碰到了大魔王$fater$。 大魔王看了看$mzf$的命运,心生怜悯,便给$mzf$和自己做一个交换的机会。 这个交换是 ...
分类:
编程语言 时间:
2018-08-18 14:24:52
阅读次数:
483
1、下载安装bedtools; 2、生成bed文件;标准的bed文件格式如下: 如果你只有染色体、起始位置和终止位置信息的话,也无大碍。不大标准但是不伤大雅的bed文件格式如下: 3、提取多个位置的vcf文件; ...
分类:
其他好文 时间:
2018-07-25 23:09:11
阅读次数:
397
一、BED 文件格式 BED 文件格式提供了一种灵活的方式来定义的数据行,以用来描述注释的信息。BED行有3个必须的列和9个额外可选的列。 每行的数据格式要求一致。 必须包含的3列: 1.chrom, 染色体名字(e.g. chr3, chrY) 2.chromStart, 目标区段在染色体起始位置 ...
分类:
其他好文 时间:
2018-07-18 21:44:50
阅读次数:
984
bed file是靶向测序中一个重要的文件,是告诉call SNP的软件,目标的基因位置在染色体的什么地方。主要用到的工具是UCSC gene browser 1.外显子的靶向文件 UCSC:http://genome.ucsc.edu/cgi-bin/hgTables. 按照下表填好,把自己的目标 ...
分类:
其他好文 时间:
2018-06-25 17:00:44
阅读次数:
324
首先,下载SHAPEIT. 按照里面的步骤安装完后,将vcf文件进行基因型定相,分四步走。 第一步,将vcf文件转化为plink二进制文件(.bed, .bim, .fam)。 这一步需要用到GATK里的GenomeAnalysisTK工具,见如下命令: 注:这里的metaData,输入的fam文件 ...
分类:
其他好文 时间:
2018-06-20 18:57:24
阅读次数:
822
1、遗传算法介绍 遗传算法,模拟进化论的自然选择和生物进化构成的计算模型,一种不断选择优良个体的算法。谈到遗传,想想自然界动物遗传是怎么来的,自然主要过程包括染色体的选择,交叉,变异,这些操作后,保证了以后的个基本上是最优的,那么以后再继续迭代这样下去,就可以一直最优了。 2、解决的问题 遗传算法能 ...
分类:
编程语言 时间:
2018-05-12 11:17:18
阅读次数:
332