码迷,mamicode.com
首页 >  
搜索关键字:聚类算法    ( 542个结果
Python爬虫技术(从网页获取图片)+HierarchicalClustering层次聚类算法,实现自动从网页获取图片然后根据图片色调自动分类—Jason niu
网上教程太啰嗦,本人最讨厌一大堆没用的废话,直接上,就是干! 网络爬虫?非监督学习? 只有两步,只有两个步骤? Are you kidding me? Are you ok? 来吧,follow me, come on! 第一步:首先,我们从网上获取图片自动下载到自己电脑的文件内,如从网址,下载到F ...
分类:编程语言   时间:2018-01-08 20:14:13    阅读次数:199
HierarchicalClustering:编写HierarchicalClustering层次聚类算法—Jason niu
from numpy import * class cluster_node: def __init__(self,vec,left=None,right=None,distance=0.0,id=None,count=1): self.left=left self.right=right self... ...
分类:编程语言   时间:2018-01-08 19:41:10    阅读次数:246
数据挖掘聚合算法K-Means
目录 基本信息 工作原理 算法优缺点 算法实现 基本信息 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 工作原理 从n个数据对象任意选择 k 个对象 ...
分类:编程语言   时间:2017-12-29 12:08:04    阅读次数:243
Kmeans聚类算法及其 Python实现
python Kmeans聚类之后如何给数据贴上聚类的标签?<!-- /react-text --> 用了二分Kmeans 来聚类 质心和聚类的簇都得到了,不知道如何给每一条数据贴上具体的标签? 这个链接下的代码,可以作为参考: http://blog.csdn.net/fzch_strugglin ...
分类:编程语言   时间:2017-12-27 20:29:14    阅读次数:188
通过IDEA及hadoop平台实现k-means聚类算法
有段时间没有操作过,发现自己忘记一些步骤了,这篇文章会记录相关步骤,并随时进行补充修改。 1 基础步骤,即相关环境部署及准备 2 IDEA编辑代码,打jar包 参考以下链接: IntelliJ IDEA Windows下Spark开发环境部署 IDEA开发Spark的漫漫摸索(一) IDEA开发Sp ...
分类:编程语言   时间:2017-12-20 20:11:19    阅读次数:251
k均值聚类
1.k均值聚类是聚类算法,不是分类算法 k均值聚类就是利用欧氏距离的度量将距离相近的样本分为k类 2.算法思想 a. 假设有m个样本,{[x1,y1],[x2,y2],,,,[xm,ym]},首先随机选择k个样本作为聚类的质心(要分成k类) b. 然后对于每个样本,计算它到每个质心的距离,将它归类于 ...
分类:其他好文   时间:2017-12-19 01:10:57    阅读次数:99
最大最小距离算法
title: 最大最小距离算法 date: 2017 12 16 17:36:54 tags: 聚类算法 categories: Algorithms 课程设计 使用最大最小距离算法做聚类分析 cpp / 使用最大最小距离法做聚类分析 1. 任选一个样本作为聚类中心z1 2. 选择离z1距离最大的样 ...
分类:编程语言   时间:2017-12-16 19:48:49    阅读次数:202
k-means 非监督学习聚类算法
非监督学习 非监督学习没有历史样本数据和标签,直接对数据分析或得结果。 k means 使用 k means重要参数 1. n_clusters 估计聚类的数量 2. n_init k means算法基于不同中心点运行的次数 3. max_tier k means一次运行的迭代次数,默认300,通常 ...
分类:编程语言   时间:2017-11-30 12:06:58    阅读次数:180
机器学习实战笔记-利用K均值聚类算法对未标注数据分组
聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好 簇识别给出聚类结果的含义。假定有一些数据,现在将相似数据归到一起,簇识别会告诉我们这些簇到底都是些什么。聚类与分类的最大不同在于,分类的目标事先巳知,而聚类则不 ...
分类:编程语言   时间:2017-11-21 01:19:28    阅读次数:289
GSDMM小记
GSDMM是一种基于狄利克雷多项式混合模型的收缩型吉布斯采样算法(a collapsed Gibbs Sampling algorithm for the Dirichlet Multinomial Mixture model)的简称,它是发表在2014年KDD上的论文《A Dirichlet Mu ...
分类:其他好文   时间:2017-11-13 21:28:18    阅读次数:165
542条   上一页 1 ... 17 18 19 20 21 ... 55 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!