自然语言从它产生开始,逐渐演变成一种上下文相关的信息表达和传递的方式,因此让计算机处理自然语言,一个基本的问题就是为自然语言这种上下文相关特性建立数学模型。这个数学模型就是自然语言处理中常说的统计语言模型,它是今天所有自然语言处理的基础,并且广泛应用与机器翻译、语音识别、印刷体和手写体识别、拼写纠错、汉字输入和文献查询。...
分类:
编程语言 时间:
2014-11-19 01:39:42
阅读次数:
306
命名实体识别(Named Entity Recognition)也是自然语言处理中的一个难关,特别是中文这样没有大小写等固定形态的语言。上次介绍过《实战HMM-Viterbi角色标注中国人名识别》,这次基于类似的原理,为HanLP实现中文地址地名(NS)的自动识别。原理训练对熟语料自动角色标注,统计...
分类:
其他好文 时间:
2014-11-17 22:42:38
阅读次数:
197
自动摘要(利用计算机自动地从原始文献中提取文摘)指代消解语篇分析机器翻译形态学分割命名实体识别自然语言生成自然语言理解光学字符识别标注词性解析问答关系提取破句(又称句界歧义)情感分析语音识别语音分割主题分割与识别分词词义消歧信息检索信息抽取语音处理
分类:
其他好文 时间:
2014-11-16 22:51:19
阅读次数:
202
第十章 类、对象与实现
万物都是容器,容器的符号是U;对象就是单个容器的别名。一切皆对象,具有某些相同属性特征的对象归纳成类。对象(Object)是类(Class)的一个实例(Instance);类是对象的模板。如果将对象比作房子,那么类就是房子的蓝图。我们以自然语言去描述世界,而计算机是用各种数据结构去描述世界;数据可以用x个二进制位的位容器BUx来表示。对象具有状态...
分类:
其他好文 时间:
2014-11-13 22:31:38
阅读次数:
319
本人还没有做过自然语言处理,但是基于Deep Learning 的关注,自然也了解了一些Word2vec的强大。
Word2vec 是google 在2013年提供的一款将词表征为实数值向量的高效工具。而Word2vec
输出的词向量可用于做NLP 相关的工作,比如聚类、找同义词、词性分析等。Word2vec 大受欢迎的一个原因是其高效性, Tomas Mikolov 在[1]...
分类:
其他好文 时间:
2014-11-13 16:47:26
阅读次数:
192
最近学习BoW模型,将自己网上看到的资料及对论文的理解,将BoW模型总结如下!
BoW模型
Bag-of-words model (BoW model) 最早出现在自然语言处理(Natural Language Processing)和信息检索(Information
Retrieval)领域.。该模型忽略掉文本的语法和语序等要素,将其仅仅看作是若干个词汇的集合,文档中每个单词...
分类:
其他好文 时间:
2014-11-10 23:27:42
阅读次数:
1675
智能助理(基于XE7+paxCompiler的助理软件,支持自然语言输入及语音识别) 一是直接键盘输入指令后点击右侧图标(快捷键是alt+s、alt+回车);二是鼠标右键点击一下右侧图标,便会切到语音输入模式,此时按住语音按钮并说话,松开按钮即开始识别。智能助理支持类似下列的指令及查询命令:计算、....
分类:
编程语言 时间:
2014-11-09 20:47:30
阅读次数:
334
本章主要讲的是我们在说话和倾听的时候发生了什么,具体的过程是怎样实现的。明确这个目标后,心里应该有个底了。 在正式开始之前,我想分享一个事情:今天去图书馆借书,清华大学出版的《统计自然语言处理》,本以为它会安静地躺在9楼或10楼这些计算机、数学专业书籍所在楼层的某个角落,结果却躺在一大堆商务英...
分类:
其他好文 时间:
2014-11-08 22:05:56
阅读次数:
358
为了舒适地学习,我把背景颜色调成了浅绿色(色调:85,饱和度:123,亮度:205)。好了,现在进入正题——令人兴奋的自然语言处理之旅。 首先,非常感谢那些在Spoken Language Processing(以下简称为SLP)领域做出伟大贡献的科学家们,本书的前言部分提到了众多在该领域杰出...
分类:
其他好文 时间:
2014-11-08 20:51:17
阅读次数:
241
Machine Learning:Linear Regression With One Variable
机器学习可以应用于计算机视觉,自然语言处理,数据挖掘等领域,可以分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)等。
首先我们从一个简单...
分类:
系统相关 时间:
2014-11-05 00:30:58
阅读次数:
256