标签:
给定
其中矩阵
K-means算法之所以很难,其中一个原因是存在一个assignment过程,需要将数据集中每个点根据距离分配到离它最近的唯一的类中心所在的类别。
对于上述的矩阵
这时b不再是1-of-k 编码了,而是b的分量可以有0个或多个1。assignment时时间复杂度是
一个直观的想法是,如果上述矩阵
其中sgn(*)函数作用于向量的每个分量。
平移后的ok-means优化的目标函数为:
变形后为:
其中
这个形式下,最小化问题是一个Orthogonal Procrustes
problem,可以先固定
此等式可进一步变形为:
其中
而矩阵
回顾下解决Orthogonal Procrustes problem的方法:
当B固定时求解这个目标式的最小值就是一个Orthogonal Procrustes problem。于是,先对矩阵做SVD分解为
,更新R使得
。
在ANN中,检索有两种方法,一种是计算对database特征和query特征都进行量化后的距离,另一种是计算仅仅对database特征进行量化后与query之间的距离。分别叫SQD和AQD。SQD要比AQD快,但是效果差些。AQD相似度标准下,度量函数为:
在ok-means算法中,矩阵
ck-means优化的目标函数为:
变形为:
ck-means在假设各个子空间互相独立的情况下,优化的目标函数可以化为在各个子空间进行优化。
未完,待续。。。
标签:
原文地址:http://blog.csdn.net/chieryu/article/details/51170843