Cucumber是一个能够理解用普通语言描述的测试用例的支持行为驱动开发(BDD)的自动化测试工具,用Ruby编写,支持Java和.Net等多种开发语言。Cucumber 三大组成:FeaturesStep_definitionsCucumber commandFeature是用简单的自然语言描述的...
分类:
其他好文 时间:
2014-10-19 15:40:16
阅读次数:
281
指的是多种成分均匀分布的情况,如果成分分布越均匀,则熵越高,相反则熵越低物理学比如某个物体由多个事物组成,如果各事物所占质量比重均匀,则质量熵就高概率学比如掷色子有6种结果,如果各结果的概率是一样的,则概率熵就高自然语言比如一个term和多个term都有搭配在一起出现的记录,如果各term出现的次数...
分类:
其他好文 时间:
2014-10-19 14:17:12
阅读次数:
185
隐马模型是一个不复杂但在NLP上最有效、快速的方法。1.通信模型 自然语言和通信的联系是天然的,当自然语言处理问题回归到通信系统中的解码问题时,很多难题就迎刃而解了。 前面已经说了,我们把说话看作是一种编码方式,然后通过喉咙、空气传播,听到话的人的耳朵接收,再理解说的话,也就是语音识别。如果...
分类:
其他好文 时间:
2014-10-18 20:58:19
阅读次数:
194
1.用数学方法描述规律由于自然语言具有上下文相关性,所以我们要依此建模,这就是我们常说的统计语言模型(statisticalLanguageModel)。比如一句话:国家主席习近ping昨天宣布将给非洲提供100亿美元的资金,帮助他们发展。这句话很容易理解。但是如果换成:习近ping国家主席将宣布1...
分类:
编程语言 时间:
2014-10-18 20:53:49
阅读次数:
297
转自:http://blog.csdn.net/stdcoutzyx/article/details/8522078学习概率的时候,大家一定都学过马尔科夫模型吧,当时就觉得很有意思,后来看了数学之美之隐马模型在自然语言处理中的应用后,看到隐马尔科夫模型竟然能有这么多的应用,并且取得了很好的成果,更觉...
分类:
其他好文 时间:
2014-10-18 16:44:18
阅读次数:
297
一 NLP相关资源站点 Rouchester大学NLP/CL会议列表 一个非常好的会议时间信息网站,将自然语言处理和计算语言学领域的会议,按照时间月份顺序列出。 NLPerJP 一个日本友好人士维护的网站,经常对NLP近来热点进行评论,可以受到启发。 初学者如何查阅自然语言处理(NLP)领域学术资料...
分类:
其他好文 时间:
2014-10-15 23:16:51
阅读次数:
296
1.1.1随着Internet技术的迅速发展,使得用户要想在信息海洋里查找目标信息,就如大海捞针一样,搜索引擎技术恰好解决了这一难题。搜索引擎是人们获取网络资源的主要工具,然而搜索引擎在给网络用户带来巨大便捷的同时, 由于其信息检索技术智能水平的限制以及对自然语言理解的制约,在网络信息的检索中存在许...
分类:
其他好文 时间:
2014-10-13 03:44:48
阅读次数:
186
python自然语言处理包 NLTK 环境搭建...
分类:
编程语言 时间:
2014-09-30 11:52:19
阅读次数:
209