搜索关键字：log-linear，搜索到9个结果！码迷,mamicode.com！

显示从右滑进，隐藏向左滑出效果 ...

分类：其他好文时间：2017-09-22 16:10:24 阅读次数：112

transtion:属性简写设置4个过渡属性。 transtion-property:规定过渡css属性名称 transtion-duration:规定过渡花费时间。默认为0 transtion-timing-function:规定过渡时间曲线。默认是ease transtion-delay:规定过 ...

分类：Web程序时间：2017-01-12 18:20:05 阅读次数：210

Edittext默认无焦点

开发中，发现第一次进入页面时光标就会出现在页面的第一个edittext中，解决思路是：在edittext的父布局中加入两行代码夺取焦点另外hint的文字是在用户开始输入的时候才会消失，不是在获取焦点的时候消失，这个细节居然一直没注意到。 ...

分类：其他好文时间：2016-12-30 13:07:27 阅读次数：137

机器学习 —— 条件随机场模型

1、背景有了强大的log-linear模型，连水槽都能拿来做分类特征了，当然要想办法用一下试试了。log-linear模型的输入是一系列几乎接近自然语言的特征方程，这种抽象的东西拿来做语义识别自然是再好不过了。语义识别有一个重要的步骤，叫做 ”给句子贴标签“，简而言之，就是给定一个句子，通过识别....

分类：其他好文时间：2015-12-19 01:28:16 阅读次数：324

机器学习 —— log-linear 模型&条件随机场

昨天刚刚解决了 logistic regression 之后今天又来了个有趣的家伙。 logistic regression 很强大，但是也有它的弱点。它最大的弱点就是只能告诉你是或者不是，而无法告诉你 XX is YY.这对于追求人工智能来说，只能是走出了一小步。在解决 YES/NO 的问题之.....

分类：其他好文时间：2015-12-11 23:55:17 阅读次数：271

一个用 Cumulative Penalty 培训 L1 正规 Log-linear 型号随机梯度下降

Log-Linear 模型（也叫做最大熵模型）是 NLP 领域中使用最为广泛的模型之中的一个。其训练常採用最大似然准则。且为防止过拟合，往往在目标函数中增加（能够产生稀疏性的） L1 正则。但对于这样的带 L1 正则的最大熵模型，直接採用标准的随机梯度下降法（SGD）会出现效率不高和...

分类：其他好文时间：2015-09-30 19:35:31 阅读次数：237

一种利用 Cumulative Penalty 训练 L1 正则 Log-linear 模型的随机梯度下降法

Log-Linear 模型（也叫做最大熵模型）是 NLP 领域中使用最为广泛的模型之一，其训练常采用最大似然准则，且为防止过拟合，往往在目标函数中加入（可以产生稀疏性的） L1 正则。但对于这种带 L1 正则的最大熵模型，直接采用标准的随机梯度下降法（SGD）会出现效率不高和难以真正产生稀疏性等问题。本文为阅读论文 Stochastic Gradient Descent Training for L1-regularized Log-linear Models with Cumulative Penalty...

分类：其他好文时间：2014-06-19 12:01:04 阅读次数：286

最小错误率训练(mert)基本原理学习

mert主要运用于机器翻译的参数调节过程中。由于目前主流的机器翻译模型多为log-linear模型，在log-linear模型中，有很多参数weights，对于每一个特征，都有与之对应的weight。如何调节这些weights，才能获取更好的翻译结果呢？Och提出了mert——最小错误率训练的方法用于调节参数。其实在Och之前就有参数调节的方法，他们优化的目标多为翻译结果的最大翻译概率，采用的方法多为梯度下降、Powell搜索等，由于目标函数的特性，这些方法都能够搜索到最优的结果。但是这些方法有一个...

分类：其他好文时间：2014-05-09 01:53:18 阅读次数：459

共9条

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)