搜索关键字：聚类，搜索到1791个结果！码迷,mamicode.com！

机器学习之K-means算法

前言以下内容是个人学习之后的感悟，转载请注明出处~ 简介在之前发表的线性回归、逻辑回归、神经网络、SVM支持向量机等算法都是监督学习算法，需要样本进行训练，且样本的类别是知道的。接下来要介绍的是非监督学习算法，其样本的类别是未知的。非监督学习算法中，比较有代表性的就是聚类算法。而聚类算法中， ...

分类：编程语言时间：2017-08-30 15:51:24 阅读次数：377

使用Apriori进行关联分析（二）

大型超市有海量交易数据，我们可以通过聚类算法寻找购买相似物品的人群，从而为特定人群提供更具个性化的服务。但是对于超市来讲，更有价值的是如何找出商品的隐藏关联，从而打包促销，以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系？当然可以使用穷举法，但代... ...

分类：其他好文时间：2017-08-29 23:01:59 阅读次数：293

DBSCAN算法

一。基于密度的聚类算法简介 DBSCAN是数据挖掘中最经典基于密度的聚类算法。基于密度的聚类算法的核心是，通过某个点r邻域内样本点的数量来衡量该点所在空间的密度。和k-means算法的不同的是： 1.可以不需要事先指定cluster的个数。 2.可以找出不规则形状的cluster。二。DBSCA ...

分类：数据库时间：2017-08-27 10:08:04 阅读次数：197

k-means算法的优缺点以及改进

大家接触的第一个聚类方法，十有八九都是K-means聚类啦。该算法十分容易理解，也很容易实现。其实几乎所有的机器学习和数据挖掘算法都有其优点和缺点。那么K-means的缺点是什么呢? 总结为下： (1)对于离群点和孤立点敏感； (2)k值选择; (3)初始聚类中心的选择； (4)只能发现球状簇。对 ...

分类：编程语言时间：2017-08-26 20:42:16 阅读次数：165

使用Apriori进行关联分析（一）

大型超市有海量交易数据，我们可以通过聚类算法寻找购买相似物品的人群，从而为特定人群提供更具个性化的服务。但是对于超市来讲，更有价值的是如何找出商品的隐藏关联，从而打包促销，以增加营业收入。其中最经典的案例就是关于尿不湿和啤酒的故事。怎样在繁杂的数据中寻找到数据之间的隐藏关系？当然可以使用穷举法，但代... ...

分类：其他好文时间：2017-08-24 00:03:36 阅读次数：433

扩增子分析解读4去嵌合体非细菌序列生成代表性序列和OTU表

本节课程，需要先完成扩增子分析解读1质控实验设计双端序列合并 2提取barcode 质控及样品拆分切除扩增引物 3格式转换去冗余聚类先看一下扩增子分析的整体流程，从下向上逐层分析分析前准备 # 进入工作目录 cd example_PE250 上一节回顾：我们制作了Usearch要求格 ...

分类：其他好文时间：2017-08-22 01:41:44 阅读次数：2871

扩增子分析解读3格式转换去冗余聚类

本节课程，需要完成扩增子分析解读1质控实验设计双端序列合并和2提取barcode 质控及样品拆分切除扩增引物先看一下扩增子分析的整体流程，从下向上逐层分析分析前准备 # 进入工作目录 cd example_PE250 上一节回顾：我们提取barcode，质控及样品拆分，切除扩增引物，经历了 ...

分类：其他好文时间：2017-08-21 20:41:16 阅读次数：401

Weka算法Clusterers-Xmeans源代码分析（一）

上几篇博客都是分析的分类器算法（有监督学习），这次就分析一个聚类算法（无监督学习）。<span style= ...

分类：编程语言时间：2017-08-20 14:55:10 阅读次数：233

ML: 聚类算法R包-对比

测试验证环境数据: 7w+ 条，数据结构如下图：机器配置： R version: R包性能对比全局函数及参数设置 ## 全局设置 remove(list=ls()) space_path <- c("E:\\RScore\\kmeans\\") setwd(space_path) Sys.se ...

分类：编程语言时间：2017-08-19 00:53:12 阅读次数：534

ML: 聚类算法R包-模糊聚类

1965年美国加州大学柏克莱分校的扎德教授第一次提出了‘集合’的概念。经过十多年的发展，模糊集合理论渐渐被应用到各个实际应用方面。为克服非此即彼的分类缺点，出现了以模糊集合论为数学基础的聚类分析。用模糊数学的方法进行聚类分析，就是模糊聚类分析。FCM（Fuzzy C-Means）算法是一种以隶属度来 ...

分类：编程语言时间：2017-08-19 00:49:26 阅读次数：344