http://www.csdn.net/article/2012-12-28/2813275-Support-Vector-Machine摘要:支持向量机(SVM)已经成为一种非常受欢迎的算法。本文主要阐述了SVM是如何进行工作的,同时也给出了使用Python Scikits库的几个示例。SVM作为...
分类:
编程语言 时间:
2015-01-06 21:18:24
阅读次数:
231
理论和公式请看网易公开课中Andrew Ng的机器学习,或者coursera中Andrew Ng的机器学习对于多元线性回归要拟合最好的直线,要使得误差平方和最小,课本上的方法都是求偏导,并使其为0,然后求解线性方程组。但是还有很多其他方法可以达到上述效果,Andrew在大样本和小样本的情况下给出了两...
分类:
其他好文 时间:
2015-01-06 19:59:23
阅读次数:
746
前言 在前面的文章中,涉及到的机器学习算法均为监督学习算法。 所谓监督学习,就是有训练过程的学习。再确切点,就是有 "分类标签集" 的学习。 现在开始,将进入到非监督学习领域。从经典的聚类问题展开讨论。所谓聚类,就是事先并不知道具体分类方案的分类 (允许知道分类个数)。 本文将介绍一个最为经...
分类:
编程语言 时间:
2015-01-06 17:06:13
阅读次数:
499
几天前,ThoughtWorks China 咨询师团队召开了一次团结的大会,成功的大会。为期三天的会议,分享的内容并不亚于坊间举行的技术大会,包含了敏捷组织转型、C++重构、敏捷测试体系、持续交付整体解决方案、Spark 执行模型、机器学习、Scala 代码操练。课题五花八门,争辩激烈精彩。 .....
分类:
其他好文 时间:
2015-01-06 13:46:01
阅读次数:
246
转自:http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html学习之用本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距离5. 标准化欧氏距离6. 马氏距离7. 夹角余弦8. 汉明距离9. 杰卡德距离 & 杰卡...
分类:
其他好文 时间:
2015-01-06 13:44:15
阅读次数:
129
已经毕业工作快满两年了,从一家垄断国字号企业跳到某电商平台,应该是我的职业生涯第一跳了,也很荣幸地投身入互联网浪潮之中。没过多久就融入了这家朝气蓬勃的大家庭。回汉后,起初打算做机器学习、数据挖掘的相关工作,以能延续研究生的课题。不过作为新东家BI组第一位员工,不得不着手搭建基础数据平台。
工作成果与心得
基础数据平台和报表系统,爬虫
五个月,小半年,我们三兄弟的工作成果也是比较显著,在被...
分类:
其他好文 时间:
2015-01-05 23:29:51
阅读次数:
326
第一眼看到逻辑回归(Logistic Regression)这个词时,脑海中没有任何概念,读了几页后,发现这非常类似于神经网络中单个神经元的分类方法。书中逻辑回归的思想是用一个超平面将数据集分为两部分,这两部分分别位于超平面的两边,且属于两个不同类别(和SVM的想法有些相似),如下图:因此,一般的逻...
分类:
其他好文 时间:
2015-01-05 21:47:02
阅读次数:
553
几个菜鸟程序员在Coursera上免费注册学习了几天“机器学习”课程后,赢下了Kaggle预测模型建模大赛。 企业界在IT业制造的大数据人才恐慌(麦肯锡是始作俑者)中纷纷提高了对大数据和高级分析人才的期待和要求,数据科学家也一夜之间成为最性感的职业,其光环直追体育明星。数据科学家被描绘成神一般的人物...
分类:
其他好文 时间:
2015-01-05 21:39:18
阅读次数:
210
第1章 机器学习基础1)学习分类监督学习——是因为这类算法必须知道预测什么,即目标变量的分类信息。无监督学习——数据没有类别信息,也不会给定目标值。2)开发机器学习应用程序的步骤 收集数据——制作网络爬虫从网站上抽取数据、从RSS反馈或者API中得到信息、设备发送过来的实测数据(风速、血糖等)、公....
分类:
其他好文 时间:
2015-01-05 14:38:09
阅读次数:
170