码迷,mamicode.com
首页 > 编程语言 > 详细

跨语言论文阅读笔记———第一篇

时间:2017-04-12 21:27:05      阅读:224      评论:0      收藏:0      [点我收藏+]

标签:net   精确   out   笔记   想法   alt   oss   parallel   编码   

Cross-lingual Transfer of Named Entity Recognizers
without Parallel Corpora

1.布朗聚类:

布朗聚类是一种针对词汇的聚类方法,Input是一系列的文章或者句子,Output有两种:
      第一种是:一系列的词组,具体多少个类看你之前的设定:技术分享
     第二种是:每个词都有一长串的二进制码,用类似霍夫曼编码的方式对每个词进行编码技术分享
    
 可以显而易见的是,前缀相似度更高的词就越相近
        什么样的词汇相似呢?一个直觉的想法就是:相似的词出现在相似的位置。
        更精确的说法就是:相似词的前驱词和后继词的分布相似,也就是它前面的词和后面的词出现得是相似的。

跨语言论文阅读笔记———第一篇

标签:net   精确   out   笔记   想法   alt   oss   parallel   编码   

原文地址:http://www.cnblogs.com/maowuyu-xb/p/6701345.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!