1.机器学习的真实含义:利用计算机来彰显数据背后的真实含义。或者说把无序的数据转换成有用的信息。2.数值常用的几种表示形式:十进制、二值型、枚举类型。3.如何选择合适的算法?首先考虑使用机器学习算法的目的。考虑想不想预测目标变量的值?如果想要预测目标变量的值,则可以选择监督学习算法,否则可以选择无监...
分类:
其他好文 时间:
2014-12-11 22:13:11
阅读次数:
269
PAC可学习性很大程度上由所需的训练样本数量决定。随着问题规模的增长所带来的所需训练样本的增长称为学习问题的样本复杂度(sample complexity)。在多数实际问题中,最限制学习器成功的因素是有限的可用的训练数据。...
分类:
其他好文 时间:
2014-12-11 20:54:21
阅读次数:
245
感知器(perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础。感知器是二类分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应于输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。感知机学习旨在求出将训练数据进行线性划分的分离超平面。...
分类:
其他好文 时间:
2014-12-11 20:53:03
阅读次数:
202
上一小节中,“理解为什么机器可以学习——Hoeffding不等式”中,我们介绍了有限假设空间中的概率边界。在这篇文章中,我们将推广至无限假设空间中,进而引入VC理论。...
分类:
其他好文 时间:
2014-12-11 20:53:00
阅读次数:
223
我们要弱化对学习器的要求:
1、我们不要求学习器输出零错误率的假设,只要求错误率被限制在某常数ε范围内,ε可为任意小。
2、不要求学习器对所有任意抽取的数据都能成功预测,只要求其失败的概率被限定在某个常数μ的范围内,μ可取任意小。
简而言之,我们只要求学习器可能学习到一个近似正确的假设,故得到了“可能近似正确学习”或PAC学习...
分类:
其他好文 时间:
2014-12-11 20:52:03
阅读次数:
663
最近从朋友那知道了这么一免费平台,据称是目前中文语境下智能度最高的机器人。已经借助平台自己弄了个聊天机器人玩玩。代码来自图灵机器人官网接入文档,是一款API端口的调用方式,能够调用图灵机器人,用于开发网站客服、微信第三方平台、QQ机器人等,这个API的接入和使用都..
分类:
其他好文 时间:
2014-12-11 16:06:17
阅读次数:
285
第三讲介绍了不同类型的机器学习问题,根据4个方面划分:输出空间,标签,方式,输入空间。1. 根据输出空间y不同划分:通过变换y的种类,可得到不同的机器学习问题 (1)y = {+1, -1}:二元分类问题,类似于做是非题,机器学习的基础。 (2)y = {0, 1, 2, ..., k}:k元分.....
分类:
其他好文 时间:
2014-12-11 15:44:30
阅读次数:
233
第二讲介绍了Perceptron Learning Algorithm (PLA),是以后学习的基础。PLA是二元的线性分类器,类似于神经感受器,用于做是非题。1. PLA的假设函数:h(x) = sign(w'x)。 这里w'是列向量,x是行向量。x代表一个数据点,这个点可能包含了d个维度,即x....
分类:
其他好文 时间:
2014-12-11 13:55:09
阅读次数:
281
最近从朋友那知道了这么一免费平台,据称是目前中文语境下智能度最高的机器人。已经借助平台自己弄了个聊天机器人玩玩。代码来自图灵机器人官网接入文档,是一款API端口的调用方式,能够调用图灵机器人,用于开发网站客服、微信第三方平台、QQ机器人等,这个API的接入和使用都是是免费的,并且不限制次数,只需到....
分类:
其他好文 时间:
2014-12-11 12:18:00
阅读次数:
128
oraclehttp://www.eygle.com/archives/2006/02/the_sun_repays_industriously.html蕃茄土豆:https://pomotodo.com/机器学习http://www.52nlp.com/Ruby 学习http://rubylear...
分类:
Web程序 时间:
2014-12-11 10:06:13
阅读次数:
210