(一)语言分析的必要性: 假如你的公司发布了一款全新的手机产品。 新产品的发布带来了来自不同媒体的相关报道、用户反馈。 面对这些数据,你可能希望了解 大家关注的是这款手机的哪些特性大家对这款手机的评价如何有哪些用户表达了购买的意愿在面对海量数据的情况下,使用人力分析这些数据显然是不切实际的。 这种场 ...
分类:
编程语言 时间:
2018-05-03 01:02:28
阅读次数:
1031
1. 概况 1.1 任务 口语理解(Spoken Language Understanding, SLU) 作为语音识别与自然语言处理之间的一个新兴领域,其目的是为了让计算机从用户的讲话中理解他们的意图。SLU是口语对话系统( "Spoken Dialog Systems" )的一个非常关键的环节。 ...
分类:
其他好文 时间:
2018-05-02 02:55:43
阅读次数:
194
真正掌握一种算法,最实际的方法,完全手写出来。 LSTM(Long Short Tem Memory)特殊递归神经网络,神经元保存历史记忆,解决自然语言处理统计方法只能考虑最近n个词语而忽略更久前词语的问题。用途:word representation(embedding)(词语向量)、sequen ...
分类:
其他好文 时间:
2018-05-01 15:27:29
阅读次数:
318
本文简单介绍了利用Python的NLTK库进行自然语言处理。 ...
分类:
编程语言 时间:
2018-04-30 18:07:01
阅读次数:
663
主要的应用:机器翻译,自然语言处理,文本处理,语音识别, 图像描述生成 (Generating Image Descriptions), 图像问答QA.... 循环神经网络(RNN)原理通俗解释 循环神经网络(RNN)原理通俗解释 1. RNN怎么来的? 2. RNN的网络结构及原理 3. RNN的 ...
分类:
其他好文 时间:
2018-04-26 23:26:21
阅读次数:
233
参考链接: 卷积神经网络(CNN)在句子建模上的应用, 卷积神经网络CNN在自然语言处理中的应用, CNN在NLP中的应用。 ...
分类:
其他好文 时间:
2018-04-26 18:22:46
阅读次数:
101
第二章 自然语言处理——从规则到统计 这一章开头这句话:字母,文字,数字是信息编码的不同单位。任何一种语言都是一种编码的方式,而语言的语法规则是编解码的算法。我们表达一个意思要通过语言表达出来,就是用这种语言的编码方式表示出来,结果就输出一串文字。别人懂这门语言的编码方式,就会理解。这里说的输出一串 ...
分类:
其他好文 时间:
2018-04-24 20:23:06
阅读次数:
157
中文分词主要分为三个流派:机械式分词法(基于词典):简单来说就是建立一个巨大的词典,然后将词典中的词语和文章中的词语相匹配,找到这个词语就算匹配成功,但是词典的完备性得不到保证。也就是文章中的有的词语在词典中找不到。基于语法和规则的分词法:分词的同时在句法语义方面进行分析,利用句法信息和语义信息进行词性标注,解决分词的歧义。因为现在的语法句法还十分复杂,所以精度还不高。基于统计的分词法根据字符串在
分类:
其他好文 时间:
2018-04-24 11:50:25
阅读次数:
166
关于词语小工具的描述快戳下面链接~~~https://forum.huaweicloud.com/thread-8391-1-1.html不想看文章,想立即试用小工具的,请戳下面~~~http://fe2e6fd859034d40a3269f7b541e31de.apigw.cn-north-1.huaweicloud.com/
分类:
其他好文 时间:
2018-04-24 11:50:19
阅读次数:
140
隐马尔科夫模型定义隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状态的序列,称为状态序列(statesequence);每个状态生成一个观测,而由此产生的观测的随机序列,称为观测序列(observationsequence)。序列的每一个位置又可以看作是一个时刻。下面我们引入
分类:
其他好文 时间:
2018-04-24 11:47:36
阅读次数:
164