软件需求:首先你必须要有Moses(废话哈哈)、然后要有GIZA++用作词对齐(traning-model.perl的时候会用到)、IRSTLM产生语言模型大致步骤:大体的步骤如下:准备Parallerl data(需要句子对齐):对语料进行tokenisation、truecasing和clean...
分类:
其他好文 时间:
2014-08-28 23:56:46
阅读次数:
432
Moses - A beam search decoder for phrase-based statistical machine translation modelsCopyright (C) 2006 University of EdinburghThis library is free so...
分类:
其他好文 时间:
2014-08-25 16:56:34
阅读次数:
392
老师要求看看Moses里都有什么参数,调整了参数又会对翻译结果有什么影响,先将找到的参数列出来首先是权重:[weight]WordPenalty0= 0LM= 1Distortion0= 1PhraseDictionaryMemory0= 1调整方法是可以通过moses.ini手动调(其实我觉得挺好...
分类:
其他好文 时间:
2014-08-25 16:56:04
阅读次数:
221
-l 可以用: weight-l 或者lm (不需要在前面加-) 还是用-weight-overwrite “Distortion0= 0"更保险reording weight is weight-d OR d词语惩罚: weight-w OR w对于不同的翻译任务,我们要采取各种实验各种参数来比较...
分类:
其他好文 时间:
2014-08-25 16:47:04
阅读次数:
194
手册里写到: ~/irstlm/bin/compile-lm \ --text yes \ news-commentary-v8.fr-en.lm.en.gz \ news-commentary-v8.fr-en.arpa.en经过查阅compile-lm的帮助里写到:compile-...
分类:
其他好文 时间:
2014-08-24 16:42:02
阅读次数:
209
发现居然没有输入文本和输出文本,折腾了一晚上,到了半夜终于搞懂了:官方的Manual上这么写的:The tokenisation can be run as follows: ~/mosesdecoder/scripts/tokenizer/tokenizer.perl -l en \ ~/...
分类:
其他好文 时间:
2014-08-24 01:39:01
阅读次数:
298
说明:本系列文章是本人在阅读统计机器翻译后所做的个人读书笔记,会按照每一章的顺序来按章详细叙述内容总结和习题解答。系列0:全书概述与个人总结本书是大牛Philipp Koehn的作品,他是开源项目Moses项目的领导者,具体可以去www.statmt.org/moses/查看,我也会在未来的半个月写...
分类:
其他好文 时间:
2014-08-21 22:33:04
阅读次数:
251