本题地址:http://www.luogu.org/problem/show?pid=1540【题目背景】小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。【题目描述】这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内...
分类:
其他好文 时间:
2015-08-15 09:04:25
阅读次数:
125
自然语言从产生开始,逐渐演变为一种基于上下文相关的信息表达和传递方式,在计算机处理自然语言时,一个最基本的问题就是为自然语言上下文相关的特性建立数学模型,叫做统计语言模型(Statistical Language Model),它是自然语言处理的基础,广泛应用于机器翻译、语音识别、印刷体或手写体识别、拼音纠错、汉字输入和文献查询等。
对于一句通顺的话,如果改变一些词的顺序,或替换掉一些词,它的意...
分类:
编程语言 时间:
2015-08-06 22:26:55
阅读次数:
282
Overview传统语言模型RNNsRNN 语言模型一些训练时重要的策略和技巧梯度消失和梯度爆炸的问题双向RNNs其他序列问题中的RNNsLanguage Models语言模型计算的是一连串词的概率:P(w1,w2…wT);其中的w1,w2…wT都是词向量。这种语言模型有利于机器翻译,例如:1.词序:p(the cat is small) > p(small the is cat)2.词的选取:p(...
分类:
其他好文 时间:
2015-07-31 18:24:53
阅读次数:
227
句法分析是自然语言处理领域的一个关键问题,如能将其有效解决,一方面,可对相应树库构建体系的正确性和完善性进行验证;另一方面,也可直接服务于各种上层应用,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。 短语结构和依存结构是目前句法分析中研究最...
分类:
其他好文 时间:
2015-07-28 12:44:38
阅读次数:
1291
作者:Mingxuan Wang,李航,刘群
单位:华为、中科院
时间:2015
发表于:acl 2015
文章下载:http://pan.baidu.com/s/1bnBBVuJ主要内容:
用deep learning设计了一种语言模型,能够根据之前“所有”的历史来预测当前词的条件概率。用语言模型迷惑度衡量、用机器翻译衡量,该模型都比baseline(5-gram、RNN、等)好具体内容...
分类:
其他好文 时间:
2015-06-29 22:21:28
阅读次数:
244
在机器翻译中,有时候要做句子的相似度比对,其中要用到编辑距离的计算。而网络上搜索到的资料大部分都将字符作为编辑距离计算的最小单位。事实上,对于句子来说,词语作为编辑距离的最小计算单位往往更加合理。通过动态规划的方法,我们能轻松实现编辑距离的计算。这里要注意的是递推边界的问题。就是当待译句子移动完之后,会出现0-0,0-1,…,0-n的情况(n为候选句子包含词语的个数),这种情况下需要修改的次数我们可...
分类:
其他好文 时间:
2015-06-24 19:13:41
阅读次数:
133
隐含马尔可夫模型是一个数学模型,它被认为是解决大多数自然语言处理问题最为快速、有效的方法。它成功的解决了复杂的语音识别、机器翻译等问题。 ? ? 人类信息交流的发展贯穿了人类的进化和文明的全过程...
分类:
其他好文 时间:
2015-06-03 23:39:22
阅读次数:
367
统计语言模型(Statistical Language Model)是一个数学模型,它是所有自然语言处理的基础,广泛应用于机器翻译、语音识别等领域,它产生的初衷是为了解决语言识别问题。 ? ? 自然语言处理中,对于如何判...
分类:
编程语言 时间:
2015-05-29 16:05:07
阅读次数:
189
在世界范围内,机器翻译的研究与开发已经走过了50年的历史。我国机器翻译的研究开始于1956年。1959年,中国的机器翻译研究者成功地进行了中国首次 机器翻译试验表演。中国是世界上第五个进行这种实验的国家。...
分类:
其他好文 时间:
2015-05-25 14:59:55
阅读次数:
212
该轮到我祭出我当年研究生期间在实验室里参与或旁观的各种有用或者有趣的课题了:1. 建立机器翻译的语料库。这是我研究生期间的核心课题,我先来介绍下背景。大家其实都用过谷歌翻译、百度翻译,虽然确实槽点很多,但不妨碍机器翻译相较过去已经达到基本可用的程度了。我大概说下机器翻译的原理。在几十年前,计算机学家...
分类:
移动开发 时间:
2015-05-24 11:28:49
阅读次数:
998