soft binary classification的概念:软二分类,不直接化为-1、1,而是给出一个概率值。 目标函数是一个概率值,但是拿到的data中y只有0、1(或者-1、1),可以看做是有noise的data。 logistic hypothesis 通过 theta 转化为 0、1间的数。 ...
分类:
其他好文 时间:
2017-06-20 16:23:22
阅读次数:
101
为了引出VC维做了很长的铺垫。。VC维:用来描述假设空间的表达能力。 第四节讲到对有限的假设空间,只要N足够大,不管A如何选g,训练数据如何选取,g的训练错误率和真实的错误率都很接近。 现在先解决无限假设空间的问题。 希望找到一个 m_H 来替代无限大的M。 系数M的来源是因为对bad data的概 ...
分类:
其他好文 时间:
2017-06-20 16:22:32
阅读次数:
227
线性回归的任务是对于一个输入,给出输出的实数,保证和真实输出相差越小越好。因为假设空间是线性的,所以最后的g会是直线或者平面。 通常的误差衡量方法是使用平方误差 接下来的问题是如何最小化 Ein 将Ein写成矩阵形式, 注意到Ein是w的函数,是连续的、可微的、凸函数。 对w求偏导使之为0则可以求出 ...
分类:
其他好文 时间:
2017-06-20 16:20:05
阅读次数:
132
hoeffding 不等式 说明了在样本量足够大时,抽样估计能够接近真实值。 类比到ml中,对给定的一个假设空间中的h, 它在整个样本空间中的表现可以由在部分样本点上的表现来近似。也就是说样本足够多的时候,Ein与Eout近似相等。 现在已经知道对任意给定的h,在N足够大时,Ein近似于Eout,如 ...
分类:
其他好文 时间:
2017-06-20 16:19:13
阅读次数:
219
论证了在有noise的情形下,机器依然可以学习。然后介绍了error 的几种衡量方法。 想象在抽取弹珠的过程中,弹珠会不断地变色,那么在抽出来的时刻,它的颜色对应一个概率分布。 类比到有noise的情形,就是 对一个x,本来是确定的,加入noise后, 对应到了一个概率分布。 即便如此,在变色弹珠抽 ...
分类:
其他好文 时间:
2017-06-20 16:17:42
阅读次数:
163
什么时候适合用机器学习来解决问题? 存在潜在的规律用于学习 但是使用编程定义这种规律困难 存在包含这些规律的数据 机器学习的一种描述: 通过数据D,一个假设的集合H以及一种演算法A,找到集合H中的某个假设g,来逼近真实函数f. A takes D and H to get g. 什么时候适合用机器学 ...
分类:
其他好文 时间:
2017-06-20 12:21:44
阅读次数:
141
受国际经济金融形势不确定性增强以及各种影响流动性的因素波动较大影响,近年来我国银行体系短期流动性供求的波动性有所加大,尤其是当多个因素相互叠加或市场预期发生变化时,有可能出现市场短期资金供求缺口难以通过货币市场融资及时解决的情形,不仅加大了金融机构流动性管理难度,而且不利于中央银行调节流动性总量。为 ...
分类:
其他好文 时间:
2017-05-13 18:58:56
阅读次数:
172
摘要 本文主要借助对C++的标准模板库STL中实现的数据结构的学习和使用来加深对数据结构的理解。即联系数据结构的理论分析和详细的应用实现(STL),本文是系列总结的第一篇,主要针对线性表中的顺序表(动态数组)STL vector进行分析和总结。 引言 因为前段时间对台大的机器学习基石和技法课程进行了 ...
分类:
编程语言 时间:
2017-04-30 12:25:24
阅读次数:
305
Office 2016 专业增强版32 位: 文件名:SW_DVD5_Office_Professional_Plus_2016_W32_ChnSimp_MLF_X20-41351.ISO SHA1: 0218F50774AAB63AF7755B0986CDB9972B853E44 下载地址:ed2 ...
分类:
其他好文 时间:
2017-04-16 11:08:19
阅读次数:
790
简单模型揭示了数据的内在规律。而复杂的模型因为表达能力过强,所以无论数据有无规律都能分开数据。 有看影片时间前后的问题(比如看了前7部后过了一段时间又看了3部,这7部和3部不是同一个分布),不能简单的随机取样。 在银行里的资料是经过筛选的资料,没有存储拒绝给客户信用卡的资料。 Scale的时候不能把 ...
分类:
其他好文 时间:
2017-03-09 22:51:02
阅读次数:
210