标签:img lex 算法 体系 san bsp abi article 表示
FASTQ格式的每第四行表示这条序列的质量值。用ACSII码表示。
测序仪一般是按照荧光信号来判断所测序的碱基是哪一种的,例如红黄蓝绿分别对应ATCG,因此对每个结果的判断都是一个概率的问题。
Phred Quality Score Probability of incorrect base call Base call accuracy
10 1 in 10 90 %
20 1 in 100 99 %
30 1 in 1000 99.9 %
40 1 in 10000 99.99 %
50 1 in 100000 99.999 %
最初Sanger中心用Phred Quality Score来衡量该read中每个碱基的质量,Q=-10logP ,其中P代表该碱基被测序错误的概率,如果该碱基测序出错的概率为0.001,则Q应该为30,那么30+33=63,那么63对应的ASCii码为“?”,则在该碱基对应的质量值即“?”。
Solexa系列测序仪使用不同的公示来计算质量值:Q=-10log(P/1-P)
在测序质量较高时,这两个算法得到的Q值没有显著差异。如下图所示
不同测序平台,在表示质量值时选择的字符区段也有差异:
Sanger = Q+33;Solexa = Q+64
来源:https://blog.csdn.net/godsunshine/article/details/51946314
标签:img lex 算法 体系 san bsp abi article 表示
原文地址:https://www.cnblogs.com/bio-mary/p/13225221.html