作为一个推荐系统业余爱好者,在机器学习领域的鄙视链中,我感觉一直地位不高,时常被搞NLP CV语音等高科技技术的朋友鄙视。最近甚至被人问,推荐算法开源包多如牛毛,我们为什么还要专门的推荐算法工程师?(难道想要辞退我!?惊)不得不说,我想吐槽这个观点很久了。事实上搞推荐的工作不等于 import IB...
分类:
编程语言 时间:
2015-01-08 19:46:17
阅读次数:
421
聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类(类别体系是自动构建的)。聚类方法几乎可以应用于所有对象,簇内的对象越相似,聚类的效果越好。本文要介绍一种称为K-均值(K-means)聚类的算法。之所以称之为K-均值是因为它可以发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。...
分类:
编程语言 时间:
2015-01-08 17:58:36
阅读次数:
324
(一)SVM的背景简介 支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10...
分类:
编程语言 时间:
2015-01-08 13:34:07
阅读次数:
294
线性回归描述
线性回归问题就是要找出一个最好超平面使得数据点距离这个平面的误差(residuals)最小。
传统上,最常用的是均方误差来评价这个误差。
求解最小的训练误差
现在我们要做的是如何选择参数w,使得训练误差Ein越小越好。
首先,我们把计算过程用矩阵形式表示出来,使表示更加简洁。
这里xn表示成列向量的形式,然后将加和的形式表示成向量的长度,进而将...
分类:
其他好文 时间:
2015-01-08 09:39:25
阅读次数:
255
http://blog.csdn.net/lsldd/article/details/41223147从这一章开始进入正式的算法学习。首先我们学习经典而有效的分类算法:决策树分类算法。1、决策树算法决策树用树形结构对样本的属性进行分类,是最直观的分类算法,而且也可以用于回归。不过对于一些特殊的逻辑分...
分类:
编程语言 时间:
2015-01-07 20:43:41
阅读次数:
236
http://www.52ml.net/15539.html2014年05月25日? 字号小中大所谓学习问题,是指观察由n个样本组成的集合,并根据这些数据来预测未知数据的性质。学习任务(一个二分类问题):区分一个普通的互联网检索Query是否具有某个垂直领域的意图。假设现在有一个O2O领域的垂直搜索...
分类:
其他好文 时间:
2015-01-07 20:39:12
阅读次数:
205
支持向量机在机器学习和数据挖掘领域应用广泛,因此在传统的支持向量机的基础上引申出了大量变形的支持向量机。其中2007年由Jayadeva提出的孪生支持向量机在性能和速度上表现卓越,本文先通过简单的讲解支持向量机,进一步引出广义特征值支持向量机,最后引出孪生支持向量机,并将孪生支持向量机与传统支持向量机进行对比。...
分类:
Windows程序 时间:
2015-01-07 17:00:36
阅读次数:
2381
聚类是一种无监督的学习(无监督学习不依赖预先定义的类或带类标记的训练实例),它将相似的对象归到同一个簇中,它是观察式学习,而非示例式的学习,有点像全自动分类。说白了,聚类(clustering)是完全可以按字面意思来理解的——将相同、相似、相近、相关的对象实例聚成一类的过程。机器学习中常见的聚类算法包括 k-Means算法、期望最大化算法(Expectation Maximization,EM,参考“EM算法原理”)、谱聚类算法(参考机器学习算法复习-谱聚类)以及人工神经网络算法,本文阐述的是K-均值聚类算...
分类:
编程语言 时间:
2015-01-07 16:49:33
阅读次数:
245