标签:规模 图片 集中 标准 inf 算法 k-means算法 子集 中心
Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数; Mini Batch K-Means算法可以减少K- Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法
算法步骤如下:
●首先抽取部分数据集,使用K-Means算法构建出K个聚簇点的模型
●继续抽取训|练数据集中的部分数据集样本数据,并将其添加到模型中,分配给距离最近的聚簇中心点
●更新聚簇的中心点值(每次更新都只用抽取出来的部分数据集)
●循环迭代第二步和第三步操作,直到中心点稳定或者达到迭代次数,停止计算操作
例如,10000个样本,每次拿1000个样本,做一次K-means,无放回。
再取1000个......
标签:规模 图片 集中 标准 inf 算法 k-means算法 子集 中心
原文地址:https://www.cnblogs.com/qianchaomoon/p/12129184.html