SparkVSMapReduce时间节约66%,计算节约40%http://mp.weixin.qq.com/s?__biz=MzA3MjY1MTQwNQ==&mid=200820787&idx=1&sn=638a4b16445a5ee7a184b7a9becf4d5d&scene=2&from=timeline&isappinstalled=0#rd数据挖掘十大算法总结--核心思想,算法优缺点,应..
分类:
其他好文 时间:
2015-01-05 07:09:45
阅读次数:
375
背景
上一讲从对偶问题的角度描述了SVM问题,但是始终需要计算原始数据feature转换后的数据。这一讲,通过一个kernel(核函数)技巧,可以省去feature转换计算,但是仍然可以利用feature转换的特性。 什么是kernel
Kernel的其实就是将向量feature转换与点积运算合并后...
分类:
其他好文 时间:
2015-01-05 00:15:09
阅读次数:
244
前言 本文将系统的介绍机器学习中监督学习的回归部分,系统的讲解如何利用回归理论知识来预测出一个分类的连续值。 显然,与监督学习中的分类部分相比,它有很鲜明的特点:输出为连续值,而不仅仅是标称类型的分类结果。基本线性回归解决方案 - 最小二乘法 “给出一堆散点,求出其回归方程。" -> 对于这个...
分类:
其他好文 时间:
2015-01-04 22:58:24
阅读次数:
335
转自http://www.36dsj.com/archives/20135Basis(基础):MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikel...
分类:
其他好文 时间:
2015-01-04 21:19:33
阅读次数:
241
转载自:http://blog.csdn.net/zouxy09/article/details/20319673一、逻辑回归(LogisticRegression) Logistic regression (逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。 还有类似的某...
分类:
编程语言 时间:
2015-01-04 20:58:40
阅读次数:
244
http://biancheng.dnbcw.info/java/341268.htmlCRF简介ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由John Lafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:...
分类:
其他好文 时间:
2015-01-04 18:38:16
阅读次数:
355
R语言:SMOTE - Supersampling Rare Events in R:用R对稀有事件进行超级采样...
分类:
编程语言 时间:
2015-01-04 17:20:29
阅读次数:
3191
背景
上一篇文章总结了linear hard SVM,解法很直观,直接从SVM的定义出发,经过等价变换,转成QP问题求解。这一讲,从另一个角度描述hard SVM的解法,不那么直观,但是可以避免feature转换时的数据计算,这样就可以利用一些很高纬度(甚至是无限维度)的feature转换,得到一些...
分类:
其他好文 时间:
2015-01-03 22:23:05
阅读次数:
347
reference :http://my.oschina.net/u/175377/blog/84420目录[-]Scikit Learn: 在python中机器学习载入示例数据一个改变数据集大小的示例:数码数据集(digits datasets)学习和预测分类K最近邻(KNN)分类器训练集和测试集...
分类:
其他好文 时间:
2015-01-03 17:05:35
阅读次数:
694