https://blog.csdn.net/guolindonggld/article/details/79626609 统计机器翻译训练工具(mkcls, GIZA++ ...
分类:
其他好文 时间:
2020-02-18 15:09:04
阅读次数:
107
CSS的三种引入方式 一. 行间式 1. 在标签头部的style属性内 2. 属性值满足的是css语法 3. 属性值用key:value形式赋值 value具有单位 4. 属性值之间用;隔开 二. 内联式 1. 在style标签内(style标签一般作为head的子标签) 2. 属性值满足的是css ...
分类:
Web程序 时间:
2019-05-30 01:03:14
阅读次数:
148
0. 背景 因为最近在看平行语料句对齐、词对齐的缘故,想做对齐的话需要先做一个分句。 一开始利用正则和引号开关标志写了一种方法,中间想到一个小技巧,写出来比较简单通用,想把这一小段代码分享一下。 1. 原理 一些情况下,标点也算是比较好的一个特征,这里就想尽量正确的切分。 主要考虑到的问题包括: + ...
分类:
编程语言 时间:
2018-04-27 13:23:24
阅读次数:
193
EM算法)The EM Algorithm EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。 下面主要介绍EM的整个推导过程。 1. Je ...
分类:
编程语言 时间:
2017-03-10 13:17:49
阅读次数:
231
EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f....
分类:
编程语言 时间:
2015-09-13 22:48:35
阅读次数:
236
EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f....
分类:
其他好文 时间:
2015-04-26 21:10:52
阅读次数:
213
EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。 下面主要介绍EM的整个推导过程。
分类:
编程语言 时间:
2015-04-17 23:38:44
阅读次数:
279
RT,蛋疼的MT实验~
伪代码请参见《统计机器翻译》中文版61页。
ps:输入只是参考了书上的例子——三个对齐句对~保证和书上输出的概率相同
该代码还没有经过大规模平行语料的检验。。后续有待优化~
输入:data.e
the house
the book
a book
data.f
das Haus
das Buch
ein Buch
python代码ibmModel1...
分类:
其他好文 时间:
2015-04-01 21:55:58
阅读次数:
335
EM是我一直想深入学习的算法之一,第一次听说是在NLP课中的HMM那一节,为了解决HMM的参数估计问题,使用了EM算法。在之后的MT中的词对齐中也用到了。在Mitchell的书中也提到EM可以用于贝叶斯网络中。下面主要介绍EM的整个推导过程。1. Jensen不等式 回顾优化理论中的一些概念。设f是...
分类:
编程语言 时间:
2014-11-27 12:01:04
阅读次数:
259
题意:格式化代码。每个单词对齐,至少隔开一个空格。思路:模拟。求出每个单词最大长度,然后按行输出。代码:#include #include #include char words[1200][190][90];int maxLen[190];char tmp[200];typedef char * ...
分类:
其他好文 时间:
2014-10-17 20:30:04
阅读次数:
219