码迷,mamicode.com
首页 >  
搜索关键字:log-linear    ( 9个结果
显示从右滑进,隐藏向左滑出效果
显示从右滑进,隐藏向左滑出效果 ...
分类:其他好文   时间:2017-09-22 16:10:24    阅读次数:112
css3过渡动画
transtion:属性简写设置4个过渡属性。 transtion-property:规定过渡css属性名称 transtion-duration:规定过渡花费时间。默认为0 transtion-timing-function:规定过渡时间曲线。默认是ease transtion-delay:规定过 ...
分类:Web程序   时间:2017-01-12 18:20:05    阅读次数:210
Edittext默认无焦点
开发中,发现第一次进入页面时光标就会出现在页面的第一个edittext中,解决思路是: 在edittext的父布局中加入两行代码夺取焦点 另外hint的文字是在用户开始输入的时候才会消失,不是在获取焦点的时候消失,这个细节居然一直没注意到。 ...
分类:其他好文   时间:2016-12-30 13:07:27    阅读次数:137
机器学习 —— 条件随机场模型
1、背景 有了强大的log-linear模型,连水槽都能拿来做分类特征了,当然要想办法用一下试试了。log-linear模型的输入是一系列几乎接近自然语言的特征方程,这种抽象的东西拿来做语义识别自然是再好不过了。语义识别有一个重要的步骤,叫做 ”给句子贴标签“,简而言之,就是给定一个句子,通过识别....
分类:其他好文   时间:2015-12-19 01:28:16    阅读次数:324
机器学习 —— log-linear 模型&条件随机场
昨天刚刚解决了 logistic regression 之后今天又来了个有趣的家伙。 logistic regression 很强大,但是也有它的弱点。它最大的弱点就是只能告诉你是或者不是,而无法告诉你 XX is YY.这对于追求人工智能来说,只能是走出了一小步。在解决 YES/NO 的问题之.....
分类:其他好文   时间:2015-12-11 23:55:17    阅读次数:271
一个用 Cumulative Penalty 培训 L1 正规 Log-linear 型号随机梯度下降
Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之中的一个。其训练常採用最大似然准则。且为防止过拟合,往往在目标函数中增加(能够产生稀疏性的) L1 正则。但对于这样的带 L1 正则的最大熵模型,直接採用标准的随机梯度下降法(SGD)会出现效率不高和...
分类:其他好文   时间:2015-09-30 19:35:31    阅读次数:237
一种利用 Cumulative Penalty 训练 L1 正则 Log-linear 模型的随机梯度下降法
Log-Linear 模型(也叫做最大熵模型)是 NLP 领域中使用最为广泛的模型之一,其训练常采用最大似然准则,且为防止过拟合,往往在目标函数中加入(可以产生稀疏性的) L1 正则。但对于这种带 L1 正则的最大熵模型,直接采用标准的随机梯度下降法(SGD)会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...
分类:其他好文   时间:2014-06-19 12:01:04    阅读次数:286
最小错误率训练(mert)基本原理学习
mert主要运用于机器翻译的参数调节过程中。由于目前主流的机器翻译模型多为log-linear模型,在log-linear模型中,有很多参数weights,对于每一个特征,都有与之对应的weight。如何调节这些weights,才能获取更好的翻译结果呢?Och提出了mert——最小错误率训练的方法用于调节参数。 其实在Och之前就有参数调节的方法,他们优化的目标多为翻译结果的最大翻译概率,采用的方法多为梯度下降、Powell搜索等,由于目标函数的特性,这些方法都能够搜索到最优的结果。 但是这些方法有一个...
分类:其他好文   时间:2014-05-09 01:53:18    阅读次数:459
9条  
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!