码迷,mamicode.com
首页 >  
搜索关键字:聚类算法    ( 542个结果
聚类分析
线性回归和逻辑回归都是监督学习方法,聚类分析是非监督学习的一种,可以从一批数据集中探索信息,比如在社交网络数据中可以识别社区,在一堆菜谱中识别出菜系。本节介绍K-means聚类算法。 1、K-means k是一个超参数,表示要聚类成多少类。K-means计算方法是重复移动类的重心,以实现成本函数最小 ...
分类:其他好文   时间:2017-03-13 22:00:51    阅读次数:356
聚类算法对比
https://github.com/endymecy/spark-ml-source-analysis/blob/master/%E8%81%9A%E7%B1%BB/k-means/k-means.md ...
分类:编程语言   时间:2017-03-11 11:50:05    阅读次数:171
k-means聚类算法
聚类聚类主要内容是将样本进行归类,同种类别的样本放到一起,所有样本最终会形成K个簇,它属于无监督学习。核心思想根据给定的K值和K个初始质心将样本中每个点都分到距离最近的类簇中,当所有点分配完后根据每个...
分类:编程语言   时间:2017-03-08 19:36:08    阅读次数:199
Tensorflow快速入门1--实现K-Means聚类算法
快速入门1–实现K-Means聚类算法 环境: 虚拟机 版本:0.12.0(仅使用cpu下,pip命令安装) 目录 1.环境搭建 的安装 1.2简单测试 学习文档 相关的库Seaborn、pandas安装 实现K-Means聚类算法 2.1最基本的K-Means聚类算法步骤 实现K-Means聚类算 ...
分类:编程语言   时间:2017-03-06 14:23:11    阅读次数:275
knn与kmeans算法的区别
1.knn是分类算法 2.监督学习 3.给它的数据是有label的,是已经事先分类好了的, 类别数不变。 1.kmeans是聚类算法 2.非监督学习 3.给它的数据是没有label,是没有事先分类好的, 以“物以类聚”原理进行聚集成簇。 K的含义:来了一个样本x,要给它分类,即求出它的类别,就从数据 ...
分类:编程语言   时间:2017-03-04 13:09:54    阅读次数:467
[数据挖掘] - 聚类算法:K-means算法理解及SparkCore实现
聚类算法是机器学习中的一大重要算法,也是我们掌握机器学习的必须算法,下面对聚类算法中的K-means算法做一个简单的描述: 一、概述 K-means算法属于聚类算法中的直接聚类算法。给定一个对象(或记录)的集合,将这些对象划分为多个组或者“聚簇”,从而使同组内的对象间比较相似而不同组对象间差异比较大 ...
分类:编程语言   时间:2017-03-04 00:09:43    阅读次数:254
大数据风控模型
基本流程: 数据收集、数据建模、构建数据画像、风险定价。 数据收集:网络行为数据、企业服务范围内行为数据、用户内容偏好数据、用户交易数据、授权数据源、第三方数据源、合作方数据源、公开数据源。 数据建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法。 数据画像:基本属性、购买能力、行为特征、兴 ...
分类:其他好文   时间:2017-01-22 22:40:47    阅读次数:235
数据挖掘之聚类算法Apriori总结
项目中有时候需要用到对数据进行关联分析,比如分析一个小商店中顾客购买习惯. 1 package com.data.algorithm; 2 3 import com.google.common.base.Splitter; 4 import com.google.common.collect.Lis ...
分类:编程语言   时间:2017-01-20 21:59:21    阅读次数:547
数据挖掘之聚类算法K-Means总结
由于项目需要,需要对数据进行处理,故而又要滚回来看看paper,做点小功课~,这次就带着忧伤的心情系统的总结下K-means算法吧,以及它的各式各样变种~ 1 package com.data.algorithm; 2 3 import java.util.ArrayList; 4 import j ...
分类:编程语言   时间:2017-01-17 20:08:01    阅读次数:207
K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比
一、概述 在本篇文章中将对四种聚类算法(K-means,K-means++,ISODATA和Kernel K-means)进行详细介绍,并利用数据集来真实地反映这四种算法之间的区别。 首先需要明确的是上述四种算法都属于"硬聚类”算法,即数据集中每一个样本都是被100%确定得分到某一个类别中。与之相对 ...
分类:编程语言   时间:2017-01-11 08:11:04    阅读次数:450
542条   上一页 1 ... 26 27 28 29 30 ... 55 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!