标签:str 而在 sum cin pst 重要 集合 转化 属性
在支持向量机SVM中,通常使用核函数将样本输入空间转化为重构核Hilbert空间(Reproducing kernel Hilbert space,RKHS),提高算法处理非线性分类问题的性能。相比于Hilbert空间,重构核Hilbert空间有着很多优秀的性质。下面从RKHS的定义、RKHS刻画、RKHS与Hilbert空间关系等三个部分展开工作。
定义1和定义3给出了重构核Hilbert空间(Reproducing kernel Hilbert space, RKHS)的定义。定理2证明了定义1与定义3的等价性。
定义1 (RKHS定义)。设\(\mathcal{H}\)是一个由定义在非空集合\(\mathcal{X}\)上函数\(f:\mathcal{X}\mapsto \mathbb{K}\)构成的Hilbert函数空间,若函数\(k:\mathcal{X}\times \mathcal{X}\mapsto \mathbb{R}\)满足:
- \(?x∈\mathcal{X} ,k(?,x)∈\mathbb{K}\)
- \(?x∈\mathcal{X},?f∈\mathcal{H},\left <f,k(?,x) \right >_\mathcal{H}=f(x)\),(重构属性)
- 特别地,对于\(?x,y∈\mathcal{X}\),有\(k(x,y)=\left <k(?,x),k(?,y) \right >_\mathcal{H}\)。
其中\(<?,?>_\mathcal{H}\)是内积。则\(k\)称为\(\mathcal{H}\)的重构核函数,\(\mathcal{H}\)为重构核Hilbert空间(RKHS)。
定义2(评估算子定义,Evaluation Functional)。设\(\mathcal{H}\)是一个由定义在非空集合\(\mathcal{X}\)上函数\(f:\mathcal{X}?\mathbb{K}\)构成的Hilbert函数空间,对于一个固定的\(x∈\mathcal{X}\),定义映射\(δ_x:\mathcal{H}?\mathbb{K}\)满足\(δ_x f=f(x)\),则\(δ_x\)是在\(x\)点的评估算子。
显然,评估算子\(δ_x\)是一个线性泛函,因为对于\(?f,g∈\mathcal{H}\)和\(?α,β∈\mathbb{K}\),有
一个重要的数学问题是\(δ_x\)是否是连续线性泛函(是否是有界线性泛函)。下面从评估算子的有界性质来重新考察重构核Hilbert空间。
定义3(RKHS定义)。\(\mathcal{H}\)是重构核Hilbert空间当且仅当对于\(?x∈\mathcal{X}\),评估算子\(δ_x\)是有界的,即存在一个与\(x\)有关的常量\(λ_x≥0\)满足对\(?f∈\mathcal{H}\),有
\[|f(x)|=|δ_x f|≤λ_x ‖f‖_\mathcal{H} \]
定理1(Riesz表示定理)。在一个Hilbert空间\(\mathcal{H}\)中,对于任意的一个有界线性算子\(A\)均存在\(g_A∈\mathcal{H}\),使得\(Af=\left <f,g_A \right>_H,?f∈\mathcal{H}\)。
下面定理证明了重构核Hilbert空间的两种定义之间等价性。
定理2。\(\mathcal{H}\)是一个重构核Hilbert空间(其评估算子\(δ_x\)是有界的)当且仅当\(\mathcal{H}\)有一个重构核。
证明:充分性:如果\(\mathcal{H}\)有一个重构核\(k(?,?)\),下面证明\(δ_x\)是一个有界线性泛函。
其中,第二行是\(k\)的重构属性,第三行是Schwarz不等式。因此,当\(λ_x=\sqrt{(k(x,x))}\)时\(|δ_x (f)|≤λ_x ‖f‖_H\),所以\(δ_x\)是一个有界线性泛函。
必要性:记\(\mathcal{H}‘\)是\(\mathcal{H}\)的对偶空间,假设\(δ_x∈\mathcal{H}‘\)且\(δ_x:\mathcal{H}?\mathbb{K}\)是一个有界评估算子,有\(δ_x f=f(x)\)。Riesz表示定理表明,\(δ_x\)是有界的,则存在\(g_{δ_x}∈\mathcal{H}\)使得,
因为\(\mathcal{H}\)是一个Hilbert空间,所以存在一个等距共轭线性同构\(I:\mathcal{H}‘?\mathcal{H}\)使得\(δ_x\)映射成\(g_{δ_x}\),即有\(Iδ_x=g_{δ_x}\)。定义\(\mathcal{H}\)上函数\(k\)为
下面我们验证\(k\)是\(\mathcal{H}\)上的重构核。
1. 对\(?x‘∈\mathcal{X}\),我们有\(k(?,x‘)=Iδ_{x‘}∈\mathcal{H}\)。因为
其中,\((a)\)使用了共轭线性同构,\((b)\)使用了\(Iδ_x=g_{δ_x}\),\((c)\)是评估算子的定义。
2. \(k\)满足重构属性,即
因此,\(k\)是\(\mathcal{H}\)上的重构核。
重构Hilbert空间的定义比较抽象,该如何刻画一个具体的RKHS呢?
定义4(正定核函数)。设\(\mathcal{X}\)是一个非空集。对于函数\(\mathcal{X}\times \mathcal{X}?\mathbb{K}\),若存在一个\(\mathbb{K}\)-Hilbert空间\(\mathcal{H}\)和一个映射\(?:\mathcal{X}?\mathcal{H}\),满足对\(?x,y∈\mathcal{H}\),有
\[k(x,y)=< ?(x),?(y)>_\mathcal{H} \]则\(k\)为正定核函数。
引理1。正定核函数一定是正定的。
证明:对于任意的\(?n≥1\),\(?(a_1,?,a_n )∈\mathbb{C}^n\),\(?(x_1,?,x_n )∈\mathcal{X}^n\),总有
所以正定核函数\(k\)是正定的。
引理2。重构核函数一定是正定核函数。
证明:对RKHS \(\mathcal{H}\)中重构核\(k\),满足\(k(x,y)=<k(?,x),k(?,y) >_\mathcal{H}\),取\(?:x?k(?,x)\),即证。
正定核函数是否也是重构核函数呢?下面的Moore-Aronszajn定理回答了这个问题。
定理3(Moore-Aronszajn定理)。每一个正定核k都与唯一一个重构核Hilbert空间相对应。
该定理证明比较复杂,参考文献[1]中第4节。
虽然正定核与重构核相互确定,但对于正定核\(k\),对象\(x\)的映射向量\(?(x)\)并不是唯一的;即给定不同的正交基空间,映射向量\(?(x)\)在不同基下的坐标是不一致的,但是其内积的性质在不同基下是保持一致的。当\(?(x)= k(?,x)\)时,\(?(x)\)被称作\(x\)的典型映射向量。
在实际的计算过程中, \(?(x)\)的维数往往是无穷的,而且很难去计算它的具体的值。我们往往采用核技巧的方法来避免去直接处理\(?(x)\)。我们直接用\(k(x_i,x_j)\)直接替代公式中的\(\left <?(x_i ),?(x_j)\right >\),然后得到算法的非线性版本。这种方法简化了计算量,而且十分容易去处理。在实际计算过程中我们只需要选择合适的正定核函数。
RKHS是一个Hilbert函数空间,Hilbert空间范围更广。毫无疑问,RKHS是Hilbert空间的一部分。但是,Hilbert空间未必是RKHS。
RKHS的一个关键属性就是评估算子的性质。在一般的Hilbert空间下,评估算子并不是连续的(有界的)。这意味着当依范数f_n?f时,不能推断出\(δ_x f_n?δ_x f\)。比如,在\(L_2 (0,1)\)空间(\(L2\)也是一个Hilbert空间)中,取\(f(x)=0\)和\(f_n (x)=\sqrt{n} I(x<1/n^2)\)。有
而\(δ_0 f_n=\sqrt{n}\)显然不会收敛到\(δ_0 f=0\),当\(n?∞\)。
因此,直观地说,Hilbert空间中包含了很多非光滑的函数。而在RKHS中,所有函数都依点态收敛\(f_n (x)?f(x)\),即\(δ_x f_n?δ_x f\)。这意味着RKHS中的函数相比于Hilbert空间中的函数都是well-behaved,对于\(?f,f_n∈\mathcal{H}\)当依范数\(f_n?f\)时,总有\(δ_x f_n=\left <f_n,k(?,x)\right >?\left <f,k(?,x)\right >=f(x)=δ_x f\)成立。我们有如下定理。
定理4。如果RKHS中的两个函数依范数收敛,则它们必然在每一个点都收敛。即如果\(\lim_{n→∞}?\|f_n-f\|_\mathcal{H}=0\) ,则有\(\lim_{n→∞} f_n (x)=f(x),?x∈X\)。
证明:对于\(?x∈\mathcal{X}\),
其中\(‖δ_x ‖\)是评估算子的范数,因为评估算子是有界的,所以\(‖δ_x ‖<∞\)。
综上分析,Hilbert空间和RKHS最本质的区别是Cauchy列收敛条件。Hilbert空间是完备的,所以Hilbert空间中的所有Cauchy列依范数收敛,即假设\(\{f_n \}_{n=1}^∞\)是Hilbert空间中的Cauchy列,则对任意的\(ε>0\),存在自然数\(N\),使得\(?i,j>N\)时,有\(‖f_i-f_j ‖<ε\)。而在RKHS中,条件要求更严格,要求所有的Cauchy列依点态收敛,即\(?x∈\mathcal{X}\),式子\(|f_i (x)-f_j (x)|<ε\)都成立。
标签:str 而在 sum cin pst 重要 集合 转化 属性
原文地址:https://www.cnblogs.com/zhangcn/p/13289236.html