稍微了解有监督机器学习的人都会知道,我们先通过训练集训练出模型,然后在测试集上测试模型效果,最后在未知的数据集上部署算法。然而,我们的目标是希望算法在未知的数据集上有很好的分类效果(即最低的泛化误差),为什么训练误差最小的模型对控制泛化误差也会有效呢?这一节关于学习理论的知识就是让大家知其然也知其所...
分类:
其他好文 时间:
2015-08-26 19:49:35
阅读次数:
272
/* * Java语法上正则化表达式的使用技巧,对于'.'要用'\\.' (2)注意空字符串“”和null的区别,判断一个字符串是不是空字符串用.equals("") * (1,判断是否有三个‘.’;2,判断三个点之间是否不相邻; * 3,判断每个部分是否是数字;4,判断每个数字是否在0到255.....
分类:
其他好文 时间:
2015-08-17 21:07:04
阅读次数:
197
机器学习中非常重要的四个基础概念,总结自台大机器学习基石课程,解释机器为什么能够学习.........
分类:
其他好文 时间:
2015-08-16 18:26:00
阅读次数:
154
我们现在开始训练模型,还输入参数如下:
rank:ALS中因子的个数,通常来说越大越好,但是对内存占用率有直接影响,通常rank在10到200之间。
iterations:迭代次数,每次迭代都会减少ALS的重构误差。在几次迭代之后,ALS模型都会收敛得到一个不错的结果,所以大多情况下不需要太多的迭代(通常是10次)。
lambda:模型的正则化参数,控制着避免过度拟合,值越大,越正则化。我们将...
分类:
系统相关 时间:
2015-08-14 19:21:13
阅读次数:
368
原文地址:http://www.cnblogs.com/liubiqu/archive/2008/08/14/1267867.htmljava.lang.string.splitsplit 方法将一个字符串分割为子字符串,然后将结果作为字符串数组返回。stringObj.split([separat...
分类:
编程语言 时间:
2015-08-09 07:09:44
阅读次数:
172
JAVA 中两种判断输入的是否是数字的方法package t0806;import java.io.*;import java.util.regex.*;public class zhengzehua_test { /** * @param args */ public static void .....
分类:
编程语言 时间:
2015-08-08 11:42:12
阅读次数:
143
当我们使用正则化的线性回归方法预测房价时,发现得到的模型应用于新的数据上时有很大误差,这时,我们可以选择一些解决方案,例如:
上图中的这六种解决方案都有相应的条件,如图中蓝色字体所示。【一、回归模型选择】我们引入一类数据集,叫做cross validation set,即交叉验证数据集。将所有数据按6:2:2
分为training set , cross validation set , t...
分类:
其他好文 时间:
2015-07-27 23:05:00
阅读次数:
389
下面主要总结线性回归与逻辑回归下的过拟合问题。【过拟合问题的定义】【过拟合问题的解决方法】
怎样解决过拟合问题呢?两个方法:
1. 减少feature个数(人工定义留多少个feature、算法选取这些feature)
2. 正则化(留下所有的feature,但对于部分feature定义其parameter非常小)
下面我们将对线性回归与逻辑回归的正则化进行详细的讲解。【一、线性回归的正则化...
分类:
其他好文 时间:
2015-07-26 11:09:25
阅读次数:
191
【多变量线性回归模型】多变量线性回归是指输入为多维特征的情况,例如:
在上图中可看出房子的价格price由四个变量(size、number of bedrooms、number of floors 、age of home)决定,为了能够预测给定条件(四个变量)下的房子的价格(y),我们需要建立相应的线性回归模型。假设有n个变量,则相应的多变量线性回归模型如下:注意上图中的x是指一个训练样本,即每...
分类:
其他好文 时间:
2015-07-23 23:50:38
阅读次数:
337
避免过度拟合之正则化“越少的假设,越好的结果”商业情景:当我们选择一种模式去拟合数据时,过度拟合是常见问题。一般化的模型往往能够避免过度拟合,但在有些情况下需要手动降低模型的复杂度,缩减模型相关属性。让我们来考虑这样一个模型。在课堂中有10个学生。我们试图通过他们过去的成绩预测他们未来的成绩。共有5...
分类:
其他好文 时间:
2015-07-14 20:22:31
阅读次数:
1007