码迷,mamicode.com
首页 >  
搜索关键字:聚类    ( 1791个结果
[论文阅读&翻译]Item-to-Item Collaborative Filtering
Amazon.com Recommendations Item-to-Item Collaborative Filtering 个人感受: 这篇论文首先介绍了历史上的三种算法:传统协同过滤、聚类、基于搜索的算法。第一种方法在计算效率、少量数据上表现欠佳;第二种方法准确率欠佳;第三种方法比较“简单”,因此提出了大量计算在线下的物品-物品的相似记录进行推荐。 揣测一下作者的思路,计算量大是因为数...
分类:其他好文   时间:2016-05-13 02:37:37    阅读次数:372
Stanford 机器学习-clustering
clustering13.2 K-Means Algorithm 输入K和训练集,K代表聚类后的cluster数目。 μi\mu_{i} 是指第i个聚类中心点,首先随机指定k个聚类的中心。 第一步:对于每个点,选取离这个点最近的中心为该点的分类。 第二步:根据分类后的结果,进行聚类中心μi\mu_{i} 的更新13.3 Optimization Objective 从公式可以看出优化目...
分类:其他好文   时间:2016-05-12 20:30:56    阅读次数:300
哈工大深研院数字图像处理第二次大作业:水果自动识别(2)HSV空间聚类及SIFT算法目标识别
老规矩,直接贴报告~ Programe list: Programe was developed in the condition of Windows aswell as Linux server, programming language is Matlab (www.mathworks.com). Classify.m, Kmeans.m: function for K-means...
分类:编程语言   时间:2016-05-12 18:22:48    阅读次数:362
使用自带 cluster-reuters.sh 聚类使用
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re...
分类:其他好文   时间:2016-05-12 11:46:20    阅读次数:198
文本挖掘
文本挖掘介绍 文本挖掘:“自动化或半自动化处理文本的过程”,包含了文档聚类、文档分类、自然语言处理、文本变化分析及网络挖掘等领域内容。对于文本处理过程首先需要有分析的语料(text corpus),然后根据这些语料建立半结构化的文本库(text database)。最后生成包含语频的结构化的词条—— ...
分类:其他好文   时间:2016-05-11 01:26:11    阅读次数:397
轨迹聚类分析问题
一、对于基于密度的dbScan: 1、 dbScan 第一步选粗略划分出来的类是否相交合并问题 (1)合并,两两小分类,只要有交集,便合并为一个大类。问题:数据点过多的时候,数据密度大,容易引起大规模数据串联起来,归为一类,轨迹聚类结果,准确性较差(下图所有操作均为针对300条名航轨迹,大约2400 ...
分类:其他好文   时间:2016-05-09 00:10:01    阅读次数:415
Science发表的超赞聚类算法
作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定. 算法思想 该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大. 首先定义两个值: 局部密度 ...
分类:编程语言   时间:2016-05-07 16:39:05    阅读次数:219
二维空间轨迹聚类
一、dbScan 对关键点聚类 二、根据轨迹上关键点,对每两条轨迹上点的类别序列进行最长匹配 例如:(1-2-3-4 ,0-2-3-4) ——> 2-3-4,得出两两轨迹之间的差异度。 两两轨迹之间的差异度矩阵: 三、进行层次聚类 聚类结果:上图选取 300 条轨迹进行聚类,聚类后,轨迹缩减为 23 ...
分类:其他好文   时间:2016-05-06 20:24:52    阅读次数:383
windows下安装python科学计算环境,numpy scipy scikit等
背景: 目的:要用Python下的DBSCAN聚类算法。 scikit-learn 是一个基于SciPy和Numpy的开源机器学习模块,包括分类、回归、聚类系列算法,主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等,目前由INRI 资助,偶尔Google也资助一点。 SciPy是 ...
分类:编程语言   时间:2016-05-06 20:18:39    阅读次数:284
基于pyspark的对KDD-99数据集的聚类分析实验
官话套话不想讲,介绍也不想打,都知道pyspark和KDD-99是啥吧? 不知道的话...点这里1 或者这里2转载记得注明出处pyspark本身是用Scala语言编写的,而Scala语言呢又是Java的变形状态,虽说spark也支持Python,但是还是没有Scala支持的好,对于pyspark的书也很少.所以恰好前几天研究了一些,现在跟大家分享交流一下吧. 首先我是用替换后的kdd-99-1...
分类:其他好文   时间:2016-05-06 12:38:37    阅读次数:505
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!