聚类算法,不是分类算法。分类算法是给一个数据,然后判断这个数据属于已分好的类中的具体哪一类。聚类算法是给一大堆原始数据,然后通过算法将其中具有相似特征的数据聚为一类。这里的k-means聚类,是事先给出原始数据所含的类数,然后将含有相似特征的数据聚为一个类中。所有资料中还是Andrew Ng介绍的明...
分类:
其他好文 时间:
2015-04-30 10:19:02
阅读次数:
155
前言:如果学习分类算法,最好从线性的入手,线性分类器最简单的就是LDA,它可以看做是简化版的SVM,如果想理解SVM这种分类器,那理解LDA就是很有必要的了。 谈到LDA,就不得不谈谈PCA,PCA是一个和LDA非常相关的算法,从推导、求解、到算法最终的结果,都有着相当的相似。 本次的内容主要是以推...
分类:
其他好文 时间:
2015-04-29 16:52:02
阅读次数:
286
朴素贝叶斯分类(NBC)是机器学习中最基本的分类方法,是其他众多分类算法分类性能的对比基础,其他的算法在评价性能时都在NBC的基础上进行。同时,对于所有机器学习方法,到处都蕴含着Bayes统计的思想。
朴素贝叶斯基于贝叶斯地理和特征条件独立性假设,首先基于条件独立性假设学习输入XX和输出YY的联合分布P(X,Y)P(X,Y),同时利用先验概率P(Y)P(Y),根据贝叶斯定理计算出后验概率P(Y|X...
分类:
其他好文 时间:
2015-04-27 02:06:20
阅读次数:
259
Kaggle搞起来Kaggle比赛多依靠机器来自动处理,机器学习几乎是必须要的技能。开始搞Kaggle需要的机器学习技能并不深入,只是需要对于机器学习的常见几个方法有基本了解即可,比如说对于一个问题,你可以认识到它是个classification的问题啊还是regression的问题啊,为什么机器可以根据你输入的一个矩阵来算出来分类结果啊。
其实有时候真的在于是不是愿意踏出那一步,一旦踏出了那一步...
分类:
编程语言 时间:
2015-04-19 11:37:44
阅读次数:
226
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类
对于分类问题,其实谁都不会陌生,每个人生活中无时不刻的在进行着分类。例如,走在大马路上看到女孩子,你会下意识的将她分为漂亮和不漂亮(漂亮当然就多看几眼啦)。在比如,在路上遇到一只狗,你会根据这只狗的毛发脏不脏,然后想到这是一只流浪狗还是家养的宠物狗。这些其实都是生活中的分类操作。
而贝叶斯分类是在生活中分类的...
分类:
编程语言 时间:
2015-04-17 11:30:47
阅读次数:
257
本系列内容大部分来自Standford公开课machine learning中Andrew老师的讲解,附加自己的一些理解,编程实现和学习笔记。第一章 Logistic regression1.逻辑回归逻辑回归是一种监督学习的分类算法,相比较之前的线性回归算法,差别在于它是一个分类算法,这也意味着y不...
分类:
其他好文 时间:
2015-04-12 11:56:50
阅读次数:
225
牛顿方法本次课程大纲:1、牛顿方法:对Logistic模型进行拟合2、指数分布族3、广义线性模型(GLM):联系Logistic回归和最小二乘模型复习:Logistic回归:分类算法假设给定x以为参数的y=1和y=0的概率:求对数似然性:对其求偏导数,应用梯度上升方法,求得:本次课程介绍的牛顿方法是...
分类:
其他好文 时间:
2015-04-11 14:49:46
阅读次数:
166
欠拟合与过拟合概念本次课程大纲:1、局部加权回归:线性回归的变化版本2、概率解释:另一种可能的对于线性回归的解释3、Logistic回归:基于2的一个分类算法4、感知器算法:对于3的延伸,简要讲复习:–第i个训练样本令,以参数向量为条件,对于输入x,输出为:n为特征数量定义成本函数J,定义为:m为训...
分类:
其他好文 时间:
2015-04-11 14:49:45
阅读次数:
193
生成学习算法本次课程大纲:1、生成学习算法2、高斯判别分析(GDA,Gaussian Discriminant Analysis)-高斯分布(简要)-对比生成学习算法&判别学习算法(简要)3、朴素贝叶斯4、Laplace平滑复习:分类算法:给出一个训练集,若使用logistic回归算法,其工作方式是...
分类:
编程语言 时间:
2015-04-11 14:48:14
阅读次数:
209
在使用mahout之前要安装并启动hadoop集群
将mahout的包上传至linux中并解压即可
mahout下载地址:
点击打开链接
mahout中的算法大致可以分为三大类:
聚类,协同过滤和分类
其中
常用聚类算法有:canopy聚类,k均值算法(kmeans),模糊k均值,层次聚类,LDA聚类等
常用分类算法有:贝叶斯,逻辑回归,支持向量机,感知器,神经网络等
...
分类:
编程语言 时间:
2015-04-11 09:04:31
阅读次数:
328