标签:
一组探针是否能被检测到,可以用检测值来表示。simpleaffy包的detection.p.val方法默认alpha1=0.05,alpha2=0.065。检测值小于alpha1为A(无,Absent),介于alpha1和alpha2之间为M(不确定,Marginal Present),大于alpha2为P(有,Present)。
以样品GSM286756.CEL为例,计算它的231211_s_at探针组的检测值:
library(affy)
library(simpleaffy)
rawData <- ReadAffy("GSM286756.CEL")
> pm(rawData,"231211_s_at")
GSM286756.CEL
231211_s_at1 78
231211_s_at2 85
231211_s_at3 80
231211_s_at4 101
231211_s_at5 86
231211_s_at6 92
231211_s_at7 110
231211_s_at8 114
> mm(rawData,"231211_s_at")
GSM286756.CEL
231211_s_at1 66
231211_s_at2 85
231211_s_at3 123
231211_s_at4 131
231211_s_at5 72
231211_s_at6 67
231211_s_at7 114
231211_s_at8 117
dpv<-detection.p.val(rawData,calls = FALSE)
在dpv中可找到231211_s_at探针组对应的检测值是0.662787911775382
整理出231211_s_at探针组的PM、MM强度为:
PM MM
78 66
85 85
80 123
101 131
86 72
92 67
110 114
114 117
Detection.p.val的计算过程:
一、默认值:
tao=0.015
sat=46000
alpha1=0.05
alpha2=0.065
若MM中有MM>sat的值,则把该项数据去掉
筛选后:
PM MM
78 66
85 85
80 123
101 131
86 72
92 67
110 114
114 117
二、计算X = (PM - MM) / (PM + MM) - tao
X
0.06833333333333333
-0.015
-0.22682266009852214
-0.1443103448275862
0.07360759493670886
0.14223270440251573
-0.032857142857142856
-0.027987012987012987
若X中有等于0的数据,则把该项数据去掉
三、wilcox算法
1)X的数据取绝对值
ABSX XIDX
0.06833333333333333 1
0.015 2
0.22682266009852214 3
0.1443103448275862 4
0.07360759493670886 5
0.14223270440251573 6
0.032857142857142856 7
0.027987012987012987 8
2)ABSX按照升序排序
ABSX 排名 XIDX
0.015 1 2
0.027987012987012987 2 8
0.032857142857142856 3 7
0.06833333333333333 4 1
0.07360759493670886 5 5
0.14223270440251573 6 6
0.1443103448275862 7 4
0.22682266009852214 8 3
注意:如果ABSX中出现相同的数,那么它们的排名取平均值。如下面这个例子:
ABSX ABSX 排名 排名
2 0.5 1 (1+2)/2=0.5
1 0.5 2 平均值 (1+2)/2=0.5
2 -------> 1 3 -------> 3
0.5 2 4 (4+5)/2=4.5
0.5 2 5 (4+5)/2=4.5
3)排名按照XIDX排回原来的位置
排名 XIDX
4 1
1 2
8 3
7 4
5 5
6 6
3 7
2 8
4)排名按照X取正负号
R
4
-1
-8
-7
5
6
-3
-2
5)STATISTIC = (R中大于0的值相加)
STATISTIC=4+5+6=15
6)
nx=探针对数=8
z = STATISTIC - (nx * (nx + 1))/4 = -3
SIGMA = sqrt((nx * (nx + 1) * (2 * nx + 1)) / 24 )=sqrt(51)=7.14142842854285
PVAL = pnorm_approx(z / SIGMA)=0.33721208822461746
PVAL = 1 - PVAL=0.6627879117753825
因为PVAL>alpha2,所以探针组231211_s_at的检测值为"P"
标签:
原文地址:http://www.cnblogs.com/xianwen/p/4522348.html