最近一直在学习hadoop 一直没有梳理接触到的东西,常见算法分类:
推荐系统(推荐引擎):
基于用户的协同过滤算法UserCF 近邻算法,容易实现
基于物品的协同过滤算法ItemCF 速度快,容易实现分布式计算
SlopeOne算法 @Deprecated at mahout 0.8
KNN Linear interpolation item–based推荐算法 最近邻算法 @Deprecated at mahout 0.8
SVD推荐算法 奇异值分解, 需要降维, 大量预处理
Tree Cluster-based 推荐算法 树形聚类 大量预处理 @Deprecated at mahout 0.8
分类算法:
支持向量机(SVM)
逻辑回归(LR)
梯度下降法(SGD)
神经网络
随机森林(RF) ,天猫推荐算法大战中经常用到(RF + GBDT) 可并行 mapreduce
朴素贝叶斯(Naive Beyes),还有一种补充的贝叶斯算法 cbeyes,效果一般比beyes 要好, 可并行 mapreduce
聚类算法:
canopy clustering
kmeans clustering
层次聚类法
频繁模式挖掘
本文出自 “流浪的脚步” 博客,谢绝转载!
原文地址:http://now51jq.blog.51cto.com/3474143/1548312