1, 如果是DNA数据, 那就是选择标准的参考基因组。
2, 如果是RNA-seq数据, 能否用参考基因组的cDNA 数据呢? 答案是否定的,
因为存在着选择性剪切,所以,一个基因可能对应着多个mRNA, 那么你进行比对的时候很容易
出现一个read 比对到多个地方, 这种情况可能会导致比对结果出现误差。不利于Call SNP,
况且cDNA不一定准确,但模式生物的基因组一般都很准确,如水稻的9311(籼)和Nipponbare(粳)。
参考基因组应该选择标准的全基因组。
附水稻参考基因组下载地址
Nipponbare:
ftp://ftp.jgi-psf.org/pub/compgen/phytozome/v9.0/Osativa/assembly/
http://rice.plantbiology.msu.edu/annotation_pseudo_current.shtml(下载速度极慢)
http://rapdb.dna.affrc.go.jp/download/irgsp1.html(较快)
93-11:
http://rice.genomics.org.cn/rice/link/download.jsp
参考基因组应该选择标准的全基因组。
Call SNP时参考序列的选择,布布扣,bubuko.com
原文地址:http://www.cnblogs.com/freemao/p/3763460.html