码迷,mamicode.com
首页 > 其他好文 > 详细

层叠隐马模型下的音译人名和日本人名识别

时间:2014-11-13 00:28:16      阅读:286      评论:0      收藏:0      [点我收藏+]

标签:style   http   io   color   ar   使用   sp   strong   on   

bubuko.com,布布扣
命名实体中的人名识别包括中国人名,音译人名和日本人名。比如“北川景子参演了林诣彬导演,克里斯·摩根编剧的《速度与激情3》”“林志玲亮相网友:确定不是波多野结衣?”。以前用三层HMM做过中国人名的识别,取得了满意的效果。这次来实现另外两种人名的自动识别。音译人名常用字法音译人名按照地域又可以分为欧美人名和俄罗斯人名,两者的常用字差别较大。不过,由于翻译人名中使用的汉字相对固定,所以只需整理一个常用字库就可以实现基本的识别,比如:欧美人名常用字——·-—阿埃艾爱安昂敖奥澳笆芭巴白拜班邦保堡鲍北贝本比毕彼别波玻博...

继续阅读码农场 » 层叠隐马模型下的音译人名和日本人名识别

原文链接http://www.hankcs.com/nlp/name-transliteration-cascaded-hidden-markov-model-and-japanese-personal-names-recognition.html

层叠隐马模型下的音译人名和日本人名识别

标签:style   http   io   color   ar   使用   sp   strong   on   

原文地址:http://www.cnblogs.com/hankcs/p/4093864.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!