前面,我们已经解释并实现了部分的sklean算法,下表展示了sklean所能使用的聚类算法 发现,还有几种未写出来,例如AP(亲和传播)聚类、FeatureAgglomeration聚类,以及我们的MInIBathK-means未单独写出来,代码和前面几篇类似。在这些算法中 我们实验统一使用iris ...
分类:
其他好文 时间:
2017-08-18 22:27:52
阅读次数:
452
用户画像就是根据用户的特征对用户的数学建模,可以用许多标签来表示,标签就是特征空间的维度 一、用户画像的作用 1.用户精细化运营 2.商户精细化运营支持 3.个性化 4.大数据报告 5.趋势预测 二。用户画像处理流程 1.明确问题和了解数据 *需求和数据的匹配 *明确需求 分类、聚类、推荐和其他 * ...
分类:
其他好文 时间:
2017-08-18 21:25:05
阅读次数:
121
聚类根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。 谱聚类可以在任意形状的样本空间聚类,且收敛于全局最优解,因此在处理高维数据方面存在着明显优势。总的来说,该算法存在一些不足之处。算法在聚类之前需要设置具体应 ...
分类:
其他好文 时间:
2017-08-18 18:36:12
阅读次数:
158
模型聚类 mclust::Mclust RWeka::Cobweb mclust::Mclust EM算法也称为期望最大化算法,在是使用该算法聚类时,将数据集看作一个有隐形变量的概率模型,并实现模型最优化,即获取与数据本身性质最契合的聚类方式为目的,通过‘反复估计’模型参数找出最优解,同时给出相应的 ...
分类:
编程语言 时间:
2017-08-18 00:05:55
阅读次数:
421
1. Scikit-learn Scikit-learn 是基于Scipy为机器学习建造的的一个Python模块,他的特色就是多样化的分类,回归和聚类的算法包括支持向量机,逻辑回归,朴素贝叶斯分类器,随机森林,Gradient Boosting,聚类算法和DBSCAN。而且也设计出了Python n ...
分类:
编程语言 时间:
2017-08-16 14:06:01
阅读次数:
285
k聚类算法中如何选择初始化聚类中心所在的位置。 在选择聚类中心时候,如果选择初始化位置不合适,可能不能得出我们想要的局部最优解。 而是会出现一下情况: 为了解决这个问题,我们通常的做法是: 我们选取K<m个聚类中心。 然后随机选择K个训练样本的实例,之后令k个聚类中心分别与k个训练实例相等。 之后我 ...
分类:
编程语言 时间:
2017-08-16 11:24:13
阅读次数:
175
学习利用sklearn的几个聚类方法: 一.几种聚类方法 1.高斯混合聚类(mixture of gaussians) 2.k均值聚类(kmeans) 3.密度聚类,均值漂移(mean shift) 4.层次聚类或连接聚类(ward最小离差平方和)二.评估方法 1.完整性:值:0-1,同一个类别所有 ...
分类:
其他好文 时间:
2017-08-15 21:10:33
阅读次数:
516
word2vec相关基础知识、下载安装參考前文:word2vec词向量中文文本相似度计算 文件夹: word2vec使用说明及源代码介绍 1.下载地址2.中文语料3.參数介绍4.计算相似词语5.三个词预測语义语法关系6.关键词聚类 1、下载地址 官网C语言下载地址:http://word2vec.g ...
分类:
编程语言 时间:
2017-08-13 15:19:15
阅读次数:
258
knn算法(k-Nearest Neighbor algorithm).是一种经典的分类算法. 注意,不是聚类算法.所以这样的分类算法必定包含了训练过程. 然而和一般性的分类算法不同,knn算法是一种懒惰算法.它并不是 像其它的分类算法先通过训练建立分类模型.,而是一种被动的分类 过程.它是边測试边 ...
分类:
编程语言 时间:
2017-08-13 10:11:24
阅读次数:
117
经典无监督学习 聚类 K均值 PCA主成分分析 等 深度学习下的无监督学习 自编码器 传统的基于特征学习的自编码器 变种的生成式自编码器 Gen网络(对抗式生成网络) 传统的基于特征学习的自编码器 变种的生成式自编码器 传统自编码器 原理 类似于一个自学习式PCA,如果编码/解码器只是单层线性的话 ...
分类:
其他好文 时间:
2017-08-12 17:04:22
阅读次数:
169