码迷,mamicode.com
首页 >  
搜索关键字:clustering    ( 336个结果
K-Means Hadoop MapReduce
聚类与分类聚类(clustering)是指根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,这样的一组数据对象的集合叫做簇,并且对每一个这样的簇进行描述的过程。 在分类( classification )中,对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。 聚类分析也称无监督学习, 因为和分类学习相比,聚类的样本没有标记,需要由聚类学习算法来自动确定。...
分类:其他好文   时间:2016-05-18 19:18:17    阅读次数:291
Stanford机器学习笔记-9. 聚类(Clustering)
9. Clustering Content 9. Clustering 9.1 Supervised Learning and Unsupervised Learning 9.2 K-means algorithm 9.3 Optimization objective 9.4 Random Init ...
分类:其他好文   时间:2016-05-15 02:09:58    阅读次数:230
简单易学的机器学习算法——Mean Shift聚类算法
参考文献 Mean Shift Clustering Meanshift,聚类算法...
分类:编程语言   时间:2016-05-13 15:05:30    阅读次数:351
Cassandra Primary Key讲解
在抽象设计模型时,我们常常需要面对另外一个问题,那就是如何指定各Column Family所使用的各种键。在Cassandra相关的各类文档中,我们常常会遇到以下一系列关键的名词:Partition Key,Clustering Key,Primary Key以及Composite Key。那么它们指的都是什么呢?   Primary Key实际上是一个非常通用的概念。在Cassandra中...
分类:其他好文   时间:2016-05-12 22:28:46    阅读次数:324
集群因子(Clustering Factor)
clustering factor是CBO使用的统计信息,用来衡量一个表中的列是否是规则排序存放的。 在通过索引访问表的时候,被用来作为代价评估的指示器。扫描索引的时候,clustering factor记录需要访问的数据块数量。 可以在以下数据字典中查看clustering factor: 如何计 ...
分类:其他好文   时间:2016-04-26 14:00:01    阅读次数:123
Redis
Redis:KVcacheandstorein-memory所有工作在内存中进行,支持持久化支持主从(借助于sentinel实现一定意义上的HA)支持Clustering(分布式集群)Redis数据类型String(字符串),List(列表),Hash(哈希值),Set(集合),SortedSet(有序集合),Bitmap,HyperLoglog存储系统有三类:R..
分类:其他好文   时间:2016-04-16 19:37:33    阅读次数:288
聚类算法总结
K-measns Clustering 1)Original k-means clustering 最经典的聚类算法 缺点一个是k的选择,另一个是init是随机点,最后cluster的结果可能不同,需要测量多次。 2)Sequential k-means clustering 采用增量学习 3)Fo ...
分类:编程语言   时间:2016-04-12 01:45:20    阅读次数:569
redis
redis:保存在内存中,周期的将内存写到磁盘中,数据冗余。单线程,不如memcache。主从架构(通过哨兵),3.0已经支持cluster.redies:内存缓存和磁盘存储。数据结构存储服务器KVcacheandstore冗余;持久化主从(借助于sentinel实现一定意义上的HA)Clustering(分布式)队列数据结构..
分类:其他好文   时间:2016-04-03 07:24:30    阅读次数:290
机器学习简易入门(三) - 聚类
摘要:本文简单叙述了如何用聚类来通过投票记录分析美国参议员的实际政治倾向 声明:(本文的内容非原创,但经过本人翻译和总结而来,转载请注明出处) 本文内容来源:https://www.dataquest.io/mission/60/clustering-basics 在前面的两篇文章中使用的线性回归和...
分类:其他好文   时间:2016-03-20 19:41:03    阅读次数:349
Weka算法Clusterers-DBSCAN源代码分析
假设说世界上仅仅能存在一种基于密度的聚类算法的话。那么它必须是DBSCAN(Density-based spatial clustering of applications with noise)。DBSCAN作为基于密度聚类算法的典型,相对于Kmeans,最大长处是能够自己决定聚类数量。同一时候能
分类:数据库   时间:2016-03-12 09:09:26    阅读次数:275
336条   上一页 1 ... 17 18 19 20 21 ... 34 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!