有监督学习Supervised Learning: 从已经标记的样本中进行学习 可用于目标识别、分类 本身不适合交互环境,但是若用正确的行为(action)对场景(situation)进行标注,也可学习。 适用于标注难度不大,成本不高的情况。 无监督学习Unsupervised Learning: ...
分类:
其他好文 时间:
2018-09-22 19:52:34
阅读次数:
491
1. 聚类分析 聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术 >> 将观测对象的群体按照相似性和相异性进行不同群组的划分,划分后每个群组内部各对象相似度很高,而不同群组之间的对象彼此相异度很高。 *** 回归、分类、聚类的区别 : ...
分类:
其他好文 时间:
2018-09-20 01:13:09
阅读次数:
280
一、选择题+ +1.一般来说,当居民的收入减少时,居民储蓄存款也会相应减少,二者之间的关系是(B)A.负相关B.正相关C.零相关D.曲线相关+ +2.对客户的生命周期进行分类主要使用以下哪个方法?(A)A.聚类分析B.判别分析C.逻辑回归D.线性回归+ +3.下列哪项不属于数据预处理阶段做的任务?( ...
分类:
其他好文 时间:
2018-09-18 16:02:34
阅读次数:
285
k-means聚类算法python实现 K-means聚类算法 算法优缺点: 优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们 ...
分类:
编程语言 时间:
2018-09-13 01:19:55
阅读次数:
229
数据稀疏问题严重制约着协同过满推荐系统的发展。对于大型商务网站来说,由于产品和用户数量都很庞大,用户评分产品一般不超过产品总数的1%,两个用户共同评分的产品更是少之又少,解决数据稀菊问题是提高推荐质量的关键。 为了提高推荐质量,许多研究人员都试图缓和数据稀疏问题。他们从不同的角度对用户和产品信息进行 ...
分类:
其他好文 时间:
2018-09-11 12:17:50
阅读次数:
415
R中利用cluster简单的绘制常见聚类离散图 ...
分类:
其他好文 时间:
2018-09-09 15:17:47
阅读次数:
346
R中cluster中包含多种聚类算法,下面通过某个数据集,进行三种聚类算法的评估 ...
分类:
其他好文 时间:
2018-09-09 15:08:18
阅读次数:
145
k -means聚类是一种分区方法。该函数kmeans将数据分区为k个互斥集群,并返回它为每个观察分配的集群的索引。 与层次聚类不同,k -means聚类对实际观察(而不是较大的相异度度量集)进行操作,并创建单个级别的聚类。这些区别意味着k -means聚类通常比大量数据的层次聚类更合适。 使用方法 ...
分类:
其他好文 时间:
2018-09-08 21:03:38
阅读次数:
1024
一、什么是高斯混合模型(GMM) 高斯混合模型(Gaussian Mixed Model)指的是多个高斯分布函数的线性组合,通常用于解决同一集合下的数据包含多个不同的分布的情况,如利用GMM来解决分类情况, 如下图,在我们看来明显分成两个聚类。这两个聚类中的点分别通过两个不同的正态分布随机生成而来。 ...
分类:
其他好文 时间:
2018-09-06 20:00:33
阅读次数:
451
最通俗的机器学习介绍 https://zhuanlan.zhihu.com/p/43612979 摘要:在本文中,我将描述数据分析是如何与机器学习相关的,还将揭开机器学习中的一些荒唐和错误的说法,并解释机器学习的过程和类型。 如果你不是一个人工智能专家,不要担心,我不会提及线性回归和k-均值聚类。 ...
分类:
其他好文 时间:
2018-09-05 17:41:43
阅读次数:
247