码迷,mamicode.com
首页 > 其他好文 > 详细

word2vec----hierarchical softmax

时间:2018-05-12 13:16:36      阅读:166      评论:0      收藏:0      [点我收藏+]

标签:问题   word   分类概率   上下文   技术   不同   man   网络   png   

一、输出层结构

技术分享图片

注意到,huffman树的每一层,都有参数和激活函数sigmoid存在,实际上是一个神经网络。影响该节点的二分类走向。这和一般的多分类问题中,各种分类是同处于平等的最后一层,是不同的。

二、模型推导

我们重点关注输出层huffman树过程的模型推导。对于每个走到huffman树根节点的x,它要经过l次二分类,最终到达对应的标签,也是是根据上下文得到的词。因此,概率为多个二分类概率的连乘形式:

技术分享图片

 

对该概率值取对数,即得到损失函数。输出层含有大量参数,而且不同词因为分类时走的路径不同,所以对应的参数不完全相同。

 

word2vec----hierarchical softmax

标签:问题   word   分类概率   上下文   技术   不同   man   网络   png   

原文地址:https://www.cnblogs.com/mimandehuanxue/p/9024164.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!