本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。
Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec
输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov 在[1]...
分类:
其他好文 时间:
2014-11-13 16:47:26
阅读次数:
192
最近学习BoW模型,将自己网上看到的资料及对论文的理解,将BoW模型总结如下!
BoW模型
Bag-of-words model (BoW model) 最早出现在自然语言处理(Natural Language Processing)和信息检索(Information
Retrieval)领域.。该模型忽略掉文本的语法和语序等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词...
分类:
其他好文 时间:
2014-11-10 23:27:42
阅读次数:
1675
本章主要讲的是我们在说话和倾听的时候发生了什么,具体的过程是怎样实现的。明确这个目标后,心里应该有个底了。 在正式开始之前,我想分享一个事情:今天去图书馆借书,清华大学出版的《统计自然语言处理》,本以为它会安静地躺在9楼或10楼这些计算机、数学专业书籍所在楼层的某个角落,结果却躺在一大堆商务英...
分类:
其他好文 时间:
2014-11-08 22:05:56
阅读次数:
358
为了舒适地学习,我把背景颜色调成了浅绿色(色调:85,饱和度:123,亮度:205)。好了,现在进入正题——令人兴奋的自然语言处理之旅。 首先,非常感谢那些在Spoken Language Processing(以下简称为SLP)领域做出伟大贡献的科学家们,本书的前言部分提到了众多在该领域杰出...
分类:
其他好文 时间:
2014-11-08 20:51:17
阅读次数:
241
Machine Learning:Linear Regression With One Variable
机器学习可以应用于计算机视觉,自然语言处理,数据挖掘等领域,可以分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)等。
首先我们从一个简单...
分类:
系统相关 时间:
2014-11-05 00:30:58
阅读次数:
256
微信公众平台语义理解接口正式对外开放。通过语义接口,接收用户发送的自然语言请求,让系统理解用户的说话内容。微信语义理解接口提供从用户自然语言输入到结构化解析的技术实现,使用先进的自然语言处理技术给开发者提供一站式的语义解析方案。该平台覆盖多个垂直领域的语义场景,部分领域还可以支持取得最终的展示结果。...
分类:
微信 时间:
2014-11-04 23:59:28
阅读次数:
482
昨晚看了下微信公共账号的资料,做了个小东西,以下是第一时间的感受。估计好多看法是错的,逐渐纠正吧。...
分类:
微信 时间:
2014-10-27 23:11:20
阅读次数:
469
自动摘要生成技术,尤其是多文档摘要的研究目前来说一直深受关注。从定义上来说,多文档摘要就是将同一主题下的多个文本描述的主要信息按压缩比提炼出一个文本的自然语言处理技术。从应用上来说,一方面,在互联网上使用搜索引擎时候,搜索同一主题的文档往往会返回成千上万的网页,如果将这些网页形成一个统一的、精炼.....
分类:
其他好文 时间:
2014-10-27 22:46:16
阅读次数:
248
李航:http://research.microsoft.com/en-us/people/hangli/,是MSRA Web Search and Mining Group高级研究员和主管,主要研究领域是信息检索,自然语言处理和统计学习。近年来,主要与人合作使用机器学习方法对信息检索中排序,相关性...
分类:
编程语言 时间:
2014-10-26 18:19:05
阅读次数:
208
LDA(LatentDirichletAllocation)主题模型算法(初略讲了下,可以对LDA有个大概认识)建议的程序员学习LDA算法的步骤(作者的切身体会,赞)“眼泪”与“门外汉”——向自然语言处理的大牛们学习
分类:
其他好文 时间:
2014-10-26 16:49:32
阅读次数:
142