标签:
数学、文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系。语言和数学的产生都是为了同一个目的——记录和传播信息。
翻译这件事之所以能达成,仅仅是因为不同的文字系统在记录信息的能力上是等价的。
文字本身的载体是石头还是纸张并不重要,它所承载的信息才是最重要的。
罗塞塔石碑的启示:
(1) 信息的冗余是信息安全的保障,这对于信道编码有指导意义。
(2) 语言的数据(即语料),尤其是双语或者多语的对照对翻译至关重要,这是我们从事机器翻译研究的基础。、
数字是计数系统的基础。数字和其他文字一样,在早期都是承载信息的工具,并不具有任何抽象的含义。
从象形文字到拼音文字是一个飞跃,因为人类在描述物体的方式上,从物体的外表到抽象的概念,同时不自觉的采用了对信息的编码。
常用字短,生僻字长,完全符合信息论中的最短编码原理。
在蔡伦发明纸张前,书写文字不是件容易的事。因此古代的书面文字非常简洁,但是非常难懂,而同时期的口语语句较长但是易懂。这种现象符合今天信息科学和工程的一些基本原理,就是在通信时,如果信道较宽,信息不必压缩就可以直接传递;而如果信道较窄,信息在传递前尽可能的压缩,而在接收端进行解压缩。
标签:
原文地址:http://my.oschina.net/u/1398794/blog/382595