最近一直在处理samtools freebayes gatk 产生的snp数据, 结果文件都是vcf,于是自己就写了相应的类,但是总是不够完善。 海宝推荐这个模块,他都推荐了 我还抱着我那烂代码不放干啥 之前写的就当练习类了安装:sudo pip install pyvcf然后报错说没有counte...
分类:
其他好文 时间:
2014-08-18 20:13:42
阅读次数:
2182
互信息已广泛应用于特征选择问题,但应用在 SNP 选择上还存在着一些局限。第一,互信息只能衡量一个 SNP 组合与表型的相关性, 无法衡量多个 SNP 与表型的相关性。第二, 利用互信息排序 SNP 时,隐含着一个假设,即: SNP 间是相互独立的,不存在着依赖关系。然而事实上,SNP 间存在着广泛...
分类:
其他好文 时间:
2014-08-04 20:54:57
阅读次数:
192
在windows 2003 sp2 或者 windows 2008 rac环境中,可能会由于默认的SNP( Scalable Networking Pack)特性会导致 实例驱逐或者节点驱逐...
1, 今天在调用call的时候出错:File "/share/Public/cmiao/MyScripts/call_snp_pipeline/call_snp_pipeline.py", line 115, in pre_tophat2 call(['bowtie2-bulid', i, p...
分类:
编程语言 时间:
2014-06-26 16:27:17
阅读次数:
241
选择的品种组合为:父本(p1)9311,为籼稻。 母本(p2)12,为粳稻。 后代(f1)F12.数据为RNA-seq数据。R 代表root, L 代表leaf。参考基因组选择日本晴。数据位置:参考基因组:/share/bioinfo/miaochenyong/call_snp/Osativa_20...
分类:
其他好文 时间:
2014-06-17 14:51:52
阅读次数:
212
1, Creating the fasta sequence dictionary
filejava -jar CreatSequenceDictionary.jar R=sequencename.fasta
O=sequencename.dict2,Creating the fasta index...
分类:
其他好文 时间:
2014-06-10 12:23:44
阅读次数:
335
1, 如果是DNA数据, 那就是选择标准的参考基因组。2, 如果是RNA-seq数据,
能否用参考基因组的cDNA 数据呢? 答案是否定的,因为存在着选择性剪切,所以,一个基因可能对应着多个mRNA, 那么你进行比对的时候很容易出现一个read
比对到多个地方, 这种情况可能会导致比对结果出现误差。...
分类:
其他好文 时间:
2014-06-02 09:28:28
阅读次数:
558
samtools 之前博文已经介绍过一些常用的方法。本篇主要说下如何利用samtools 和
bcftools来call snp。和其他工具一样,bam文件都要经过处理(另见博文)。假如对C17样本进行call snp,
数据为:LC17-1_L002.sorted.rmp.rg.recal.bam...
分类:
其他好文 时间:
2014-06-02 07:29:20
阅读次数:
783
用GATK call snp 的同学都会为繁琐的数据前期处理而苦恼,甚至放弃GATK
而用别的工具,对于bam文件,read group信息是必不可少的,别的软件也许只需要一个sample name, 而在GATK中
除了SM(sample)是必须的之外,还需要read group ID, plat...
分类:
其他好文 时间:
2014-05-29 23:04:38
阅读次数:
409