Week6 || Advice for Applying Machine Learning 高方差,选B 出现过拟合问题,选BD 出现欠拟合问题,选BC 选AC 一般用 6 2 2来分,随机打乱数据是很有必要的。 选择BD A、出现高偏差,增加训练数据会增加测试误差 C、明显错的 week6 || ...
分类:
其他好文 时间:
2018-02-09 20:48:31
阅读次数:
837
What is machine learning? 实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么,本课程中给出了两个定义 1:Arthur Samuel (1959). Machine Learning: Field of study that ...
分类:
其他好文 时间:
2018-02-08 19:57:48
阅读次数:
302
顶级的综合会议 ICML NIPS ICML: International Conference on Machine Learning NIPS:Neural Information Processing Systems顶级的理论会议 COLT COLT: Conference on Learni ...
分类:
其他好文 时间:
2018-02-06 14:24:00
阅读次数:
252
梯度下降法 一种无约束的优化算法 1.1梯度 在微积分里面,对多元函数的参数求?偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。 for example . 几何意义: 函数变化增加最快的方向,换句话说,沿梯度向量的方向,容易找到函数的最大值。梯度向量相反的方向,是函数减小最快的方向, ...
分类:
系统相关 时间:
2018-02-04 22:36:26
阅读次数:
249
现在想学机器学习的同学们好幸福。如下所有书,amazon上都有。首先,入门用周志华的《机器学习》,比较系统全面,中文理解快;进阶用Elements Of Statistical Learning 或者 Pattern Recognition and Machine Learning,后者有人做了翻译 ...
分类:
其他好文 时间:
2018-02-02 14:07:27
阅读次数:
142
Model and Cost Function Model Representation | 模型表示 To establish notation for future use, we’ll use $x^{(i)}$ to denote the “input” variables (living ...
分类:
系统相关 时间:
2018-02-01 22:01:01
阅读次数:
278
下图为四种不同算法应用在不同大小数据量时的表现,可以看出,随着数据量的增大,算法的表现趋于接近。即不管多么糟糕的算法,数据量非常大的时候,算法表现也可以很好。 数据量很大时,学习算法表现比较好的原理: 使用比较大的训练集(意味着不可能过拟合),此时方差会比较低;此时,如果在逻辑回归或者线性回归模型中 ...
分类:
编程语言 时间:
2018-01-22 01:20:13
阅读次数:
223
一般来说,召回率和查准率的关系如下:1、如果需要很高的置信度的话,查准率会很高,相应的召回率很低;2、如果需要避免假阴性的话,召回率会很高,查准率会很低。下图右边显示的是召回率和查准率在一个学习算法中的关系。值得注意的是,没有一个学习算法是能同时保证高查准率和召回率的,要高查准率还是高召回率,取决于 ...
分类:
编程语言 时间:
2018-01-21 21:29:16
阅读次数:
271
上篇文章提到了误差分析以及设定误差度量值的重要性。那就是设定某个实数来评估学习算法并衡量它的表现。有了算法的评估和误差度量值,有一件重要的事情要注意,就是使用一个合适的误差度量值,有时会对学习算法造成非常微妙的影响。这类问题就是偏斜类(skewed classes)的问题。什么意思呢。以癌症分类为例 ...
分类:
系统相关 时间:
2018-01-21 19:03:15
阅读次数:
199
1.Gradient Descent 2.Normal euqation 先介绍下什么是normal equation,如果一个数据集X有m个样本,n个特征。则如果函数为: 。数据集X的特征向量表示为: 先介绍下什么是normal equation,如果一个数据集X有m个样本,n个特征。则如果函数为 ...
分类:
系统相关 时间:
2018-01-21 16:31:07
阅读次数:
222