在对数据进行拟合,学习模型的过程中,会出现以下情况:1)high variance, overfitting.过拟合2)high bias, underfiiting.欠拟合过拟合出现的原因1)太多的特征。2)过少的训练数据。如何解决?1)减少特征数2)模型选择算法(model selection ...
分类:
其他好文 时间:
2014-08-26 19:13:56
阅读次数:
310
理论参考文献:但此文没有代码实现,这里自己实现一下,让理解更为深刻
问题:假设在IR中我们建立的文档-词项矩阵中,有两个词项为“learn”和“study”,在传统的向量空间模型中,认为两者独立。然而从语义的角度来讲,两者是相似的,而且两者出现频率也类似,是不是可以合成为一个特征呢?
《模型选择和规则化》谈到的特征选择的问题,就是要剔除的特征主要是和类标签无关的特征。比如...
网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型选择问题,如何来平衡bais和variance来自动选择模型?比如对于多项式分类,如何决定阶数k,对于l...
分类:
其他好文 时间:
2014-06-26 16:31:11
阅读次数:
181
影响输入法体验的有两块,候选命中以及视觉交互,视觉交互就是看到的键盘以及用户的使用的方便程度,尤其是在手机输入法中,键盘布局以及一些默认设置等细节对体验影响很大。候选命中就是指用户输入拼音时,能否把用户的想要的东西放在第一位显示处理。
我们重点关注候选命中,UI是设计师的事情:)
影响候选命中因素很多,比如模型选择、剪枝策略等,其中决定候选命上限,也就是天花板的绝对是 训练预料,没有之...
分类:
其他好文 时间:
2014-06-10 14:22:06
阅读次数:
237
一种方法:清空日志。1.打开查询分析器,输入命令SQL
code?1DUMPTRANSACTION数据库名WITHNO_LOG2.打开企业管理器,在数据库上点右键->属性->选项->故障恢复-模型-选择-简单模型。(也可以直接在查询分析器里执行:SQL
code?1alterdatabase数据库名...
分类:
数据库 时间:
2014-05-24 09:28:23
阅读次数:
446
DataUml Design
(下载)实体建模基于UML类图标准来设计,支持一对一、一对多、多对多关联。模型与开发语言和数据库绑定。
1、新建数据模型
1)、选择“数据模型” 节点,点击鼠标右键,在菜单中点击“新建文件夹”,在“数据模型”节点下会增加个“文件夹”的子节点。如图2-1。
图 2-1
2)、选中新增加的“文件夹”节点,点击鼠标右键,在出现的菜单中点击“重...
分类:
其他好文 时间:
2014-05-22 17:06:16
阅读次数:
348
利用PowerDesigner15在win7系统下对MySQL 进行反向工程
1、打开PowerDesigner,建立新模型,选择Physical Data Model中的Physical Da..
2、DBMS选择“MySQL5.0”,单击“OK”;选择“数据库--》Connect...”
3、选择(一)中配置的数据源,输入用户名和密码,单击“Con...
分类:
数据库 时间:
2014-05-21 07:34:16
阅读次数:
329
在K-fold cross validation 下 比较不同的K的选择对于参数选择(模型参数,CV意义下的估计的泛化误差)以及实际泛化误差的影响。更一般的问题,在实际模型选择问题中,选择几重交叉验证比较合适?
交叉验证的背景知识:
CV是用来验证模型假设(hypothesis)性能的一种统计分析方法,基本思想是在某种意义下将原始数据进行分组,一部分作为训练集,一部分作为验证集,使用训练...
分类:
其他好文 时间:
2014-04-30 22:14:38
阅读次数:
327