博客已经迁移至Marcovaldo’s blog (http://marcovaldong.github.io/)机器学习基石第八讲主要介绍噪声和误差度量,笔记整理在下面。Noise and Probabilistic Target现实中的数据很可能含有噪声(noise),例如前面的信用卡发放问题中,有的顾客符合发放标准但没有发给,或者同样情况的顾客有人发了有人没法,再或者顾客的信息不正确等等,VC...
分类:
其他好文 时间:
2016-04-29 18:06:05
阅读次数:
192
[此笔记源于台湾大学林轩田老师《机器学习基石》《机器学习技法》] 机器学习真的可以起作用吗?答案是肯定的。 那为什么这个问题还要拿出来讲一讲呢? 考虑一个问题: 现在知道了5个数据,预测其余3个xn的输出,有如下可能: 我们根本没法预测! 这个问题formally的表示是:对于一个整体,我们随机抽取 ...
分类:
其他好文 时间:
2016-04-27 12:29:34
阅读次数:
138
机器学习基石第六讲继续讨论“学习是否可行的问题”。Restriction of Break Point继续前面的讨论,我们看mH(N)m_H(N)是否会有一个很小的增长速度。回顾前面的四种成长函数及其break point。我们知道k是一个成长函数的break point,那比k大的值全是break point。mH(N)m_H(N)是一个hypothesis在N个数据点上可以产生的dichotom...
分类:
其他好文 时间:
2016-04-26 21:45:14
阅读次数:
102
博客已经迁移至Marcovaldo’s blog (http://marcovaldong.github.io/)机器学习基石第八讲主要介绍噪声和误差度量,笔记整理在下面。Noise and Probabilistic Target现实中的数据很可能含有噪声(noise),例如前面的信用卡发放问题中,有的顾客符合发放标准但没有发给,或者同样情况的顾客有人发了有人没法,再或者顾客的信息不正确等等,VC...
分类:
其他好文 时间:
2016-04-26 20:27:58
阅读次数:
122
刚刚完成机器学习基石的第三讲,这一讲主要介绍了机器学习的分类,对何种问题应该使用何种机器学习方法。将笔记整理在下面。Learning with Different Output Space前面讲的信用卡发放问题是一个是非题,也就是说最后的输出只有两种,是一个二元分类(binary classification)。下图中给出了更多的二元分类问题的例子,对于这类问题我们要做的就是找到一个hypothes...
分类:
其他好文 时间:
2016-04-19 19:42:33
阅读次数:
132
刚刚完成了机器学习基石的第二讲,主要介绍了机器学习的定义,PLA算法和pocket PLA算法。下面将笔记整理在下面。Perceptron Hypothesis Set延续前面的信用卡发放问题。银行已有的用户数据可能包括用户的年龄、年薪、工作时长、债务情况等特征信息,我们分别用x1x_1...
分类:
其他好文 时间:
2016-04-19 00:32:44
阅读次数:
289
3 Types of Learning3.1 Learning with Different Output Space Y 从输出空间类型的角度分类机器学习的方法。 1. 二元分类(Binary Classification):输出标签是离散的,二类的。 2. 多元分类(Multiclass Cla ...
分类:
其他好文 时间:
2016-04-18 17:18:53
阅读次数:
202
大家好,我是Mac Jiang,今天和大家分享Coursera-NTU-機器學習基石(Machine Learning Foundations)-作业四 Q13-20的MATLAB实现。以前的代码都是通过C++实现的,但是发现C++实现这些代码太麻烦,这次作业还要频繁更改参数值,所以选择用MATLAB实现了。与C++相比,MATLAB实现显然轻松很多,在数据导入方面也更加方便。我的代码虽然能够得到...
分类:
系统相关 时间:
2016-04-17 22:35:56
阅读次数:
215
2 Learning to Answer Yes/No 2.1 Perceptron Hypothesis Set 根据信用卡问题引入PLA算法。 有以下特征: 抽象一下,成为特征向量x,根据x和权重的w的内积相对于阈值的大小决定输出标签的正负(正则赋予信用卡,负不赋予信用卡): 具体而言,感知机( ...
分类:
其他好文 时间:
2016-04-17 22:04:08
阅读次数:
168
大家好,我是Mac Jiang,今天和大家分享coursera-NTU-機器學習基石(Machine Learning Foundations)-作业四的习题解答。笔者在做这些题目时遇到很多困难,当我在网上寻找答案时却找不到,而林老师又不提供答案,所以我就想把自己做题时对题目如何思考的写下来,为大家提供一些思路。当然,我对题目的理解不一定是正确的,如果各位博友发现错误请及时留言联系,谢谢!再次提醒...
分类:
系统相关 时间:
2016-04-17 20:51:05
阅读次数:
324