搜索关键字：聚类，搜索到1791个结果！码迷,mamicode.com！

[论文阅读&翻译]Item-to-Item Collaborative Filtering

Amazon.com Recommendations Item-to-Item Collaborative Filtering 个人感受：这篇论文首先介绍了历史上的三种算法：传统协同过滤、聚类、基于搜索的算法。第一种方法在计算效率、少量数据上表现欠佳；第二种方法准确率欠佳；第三种方法比较“简单”，因此提出了大量计算在线下的物品-物品的相似记录进行推荐。揣测一下作者的思路，计算量大是因为数...

分类：其他好文时间：2016-05-13 02:37:37 阅读次数：372

Stanford 机器学习-clustering

clustering13.2 K-Means Algorithm 输入K和训练集，K代表聚类后的cluster数目。 μi\mu_{i} 是指第i个聚类中心点，首先随机指定k个聚类的中心。第一步：对于每个点，选取离这个点最近的中心为该点的分类。第二步：根据分类后的结果，进行聚类中心μi\mu_{i} 的更新13.3 Optimization Objective 从公式可以看出优化目...

分类：其他好文时间：2016-05-12 20:30:56 阅读次数：300

哈工大深研院数字图像处理第二次大作业：水果自动识别（2）HSV空间聚类及SIFT算法目标识别

老规矩，直接贴报告~ Programe list: Programe was developed in the condition of Windows aswell as Linux server, programming language is Matlab (www.mathworks.com). Classify.m, Kmeans.m: function for K-means...

分类：编程语言时间：2016-05-12 18:22:48 阅读次数：362

使用自带 cluster-reuters.sh 聚类使用

#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re...

分类：其他好文时间：2016-05-12 11:46:20 阅读次数：198

文本挖掘

文本挖掘介绍文本挖掘：“自动化或半自动化处理文本的过程”，包含了文档聚类、文档分类、自然语言处理、文本变化分析及网络挖掘等领域内容。对于文本处理过程首先需要有分析的语料（text corpus），然后根据这些语料建立半结构化的文本库（text database）。最后生成包含语频的结构化的词条—— ...

分类：其他好文时间：2016-05-11 01:26:11 阅读次数：397

轨迹聚类分析问题

一、对于基于密度的dbScan： 1、 dbScan 第一步选粗略划分出来的类是否相交合并问题（1）合并，两两小分类，只要有交集，便合并为一个大类。问题：数据点过多的时候，数据密度大，容易引起大规模数据串联起来，归为一类，轨迹聚类结果，准确性较差（下图所有操作均为针对300条名航轨迹，大约2400 ...

分类：其他好文时间：2016-05-09 00:10:01 阅读次数：415

Science发表的超赞聚类算法

作者(Alex Rodriguez, Alessandro Laio)提出了一种很简洁优美的聚类算法, 可以识别各种形状的类簇, 并且其超参数很容易确定. 算法思想该算法的假设是类簇的中心由一些局部密度比较低的点围绕, 并且这些点距离其他有高局部密度的点的距离都比较大. 首先定义两个值: 局部密度 ...

分类：编程语言时间：2016-05-07 16:39:05 阅读次数：219

二维空间轨迹聚类

一、dbScan 对关键点聚类二、根据轨迹上关键点，对每两条轨迹上点的类别序列进行最长匹配例如：(1-2-3-4 ，0-2-3-4) ——> 2-3-4，得出两两轨迹之间的差异度。两两轨迹之间的差异度矩阵：三、进行层次聚类聚类结果：上图选取 300 条轨迹进行聚类，聚类后，轨迹缩减为 23 ...

分类：其他好文时间：2016-05-06 20:24:52 阅读次数：383

windows下安装python科学计算环境，numpy scipy scikit等

背景：目的：要用Python下的DBSCAN聚类算法。 scikit-learn 是一个基于SciPy和Numpy的开源机器学习模块，包括分类、回归、聚类系列算法，主要算法有SVM、逻辑回归、朴素贝叶斯、Kmeans、DBSCAN等，目前由INRI 资助，偶尔Google也资助一点。 SciPy是 ...

分类：编程语言时间：2016-05-06 20:18:39 阅读次数：284

基于pyspark的对KDD-99数据集的聚类分析实验

官话套话不想讲，介绍也不想打，都知道pyspark和KDD-99是啥吧？不知道的话．．．点这里1 或者这里2转载记得注明出处pyspark本身是用Scala语言编写的，而Scala语言呢又是Java的变形状态，虽说spark也支持Python，但是还是没有Scala支持的好，对于pyspark的书也很少．所以恰好前几天研究了一些，现在跟大家分享交流一下吧．首先我是用替换后的kdd-99-1...

分类：其他好文时间：2016-05-06 12:38:37 阅读次数：505

共1791条上一页 1 ... 115 116 117 118 119 ... 180 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)