搜索关键字：clustering，搜索到336个结果！码迷,mamicode.com！

K-Means Hadoop MapReduce

聚类与分类聚类(clustering)是指根据“物以类聚”的原理，将本身没有类别的样本聚集成不同的组，这样的一组数据对象的集合叫做簇，并且对每一个这样的簇进行描述的过程。在分类（ classification ）中，对于目标数据库中存在哪些类是知道的，要做的就是将每一条记录分别属于哪一类标记出来。聚类分析也称无监督学习，因为和分类学习相比，聚类的样本没有标记，需要由聚类学习算法来自动确定。...

分类：其他好文时间：2016-05-18 19:18:17 阅读次数：291

Stanford机器学习笔记-9. 聚类(Clustering)

9. Clustering Content 9. Clustering 9.1 Supervised Learning and Unsupervised Learning 9.2 K-means algorithm 9.3 Optimization objective 9.4 Random Init ...

分类：其他好文时间：2016-05-15 02:09:58 阅读次数：230

简单易学的机器学习算法——Mean Shift聚类算法

参考文献 Mean Shift Clustering Meanshift，聚类算法...

分类：编程语言时间：2016-05-13 15:05:30 阅读次数：351

Cassandra Primary Key讲解

在抽象设计模型时，我们常常需要面对另外一个问题，那就是如何指定各Column Family所使用的各种键。在Cassandra相关的各类文档中，我们常常会遇到以下一系列关键的名词：Partition Key，Clustering Key，Primary Key以及Composite Key。那么它们指的都是什么呢？　　Primary Key实际上是一个非常通用的概念。在Cassandra中...

分类：其他好文时间：2016-05-12 22:28:46 阅读次数：324

集群因子(Clustering Factor)

clustering factor是CBO使用的统计信息，用来衡量一个表中的列是否是规则排序存放的。在通过索引访问表的时候，被用来作为代价评估的指示器。扫描索引的时候，clustering factor记录需要访问的数据块数量。可以在以下数据字典中查看clustering factor：如何计 ...

分类：其他好文时间：2016-04-26 14:00:01 阅读次数：123

Redis

Redis:KVcacheandstorein-memory所有工作在内存中进行，支持持久化支持主从(借助于sentinel实现一定意义上的HA)支持Clustering(分布式集群)Redis数据类型String（字符串）,List（列表）,Hash（哈希值）,Set（集合）,SortedSet（有序集合）,Bitmap,HyperLoglog存储系统有三类：R..

分类：其他好文时间：2016-04-16 19:37:33 阅读次数：288

聚类算法总结

K-measns Clustering 1)Original k-means clustering 最经典的聚类算法缺点一个是k的选择，另一个是init是随机点，最后cluster的结果可能不同，需要测量多次。 2)Sequential k-means clustering 采用增量学习 3)Fo ...

分类：编程语言时间：2016-04-12 01:45:20 阅读次数：569

redis

redis:保存在内存中，周期的将内存写到磁盘中，数据冗余。单线程，不如memcache。主从架构（通过哨兵），3.0已经支持cluster.redies:内存缓存和磁盘存储。数据结构存储服务器KVcacheandstore冗余；持久化主从(借助于sentinel实现一定意义上的HA)Clustering(分布式)队列数据结构..

分类：其他好文时间：2016-04-03 07:24:30 阅读次数：290

机器学习简易入门（三） - 聚类

摘要：本文简单叙述了如何用聚类来通过投票记录分析美国参议员的实际政治倾向声明：（本文的内容非原创，但经过本人翻译和总结而来，转载请注明出处）本文内容来源：https://www.dataquest.io/mission/60/clustering-basics 在前面的两篇文章中使用的线性回归和...

分类：其他好文时间：2016-03-20 19:41:03 阅读次数：349

Weka算法Clusterers-DBSCAN源代码分析

假设说世界上仅仅能存在一种基于密度的聚类算法的话。那么它必须是DBSCAN（Density-based spatial clustering of applications with noise）。DBSCAN作为基于密度聚类算法的典型，相对于Kmeans，最大长处是能够自己决定聚类数量。同一时候能

分类：数据库时间：2016-03-12 09:09:26 阅读次数：275

共336条上一页 1 ... 17 18 19 20 21 ... 34 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)