Python网络爬虫简明教程 通过本教程可以快速了解网络爬虫过程,对一般性数据抓取有启发意义。...
分类:
编程语言 时间:
2015-01-06 23:09:10
阅读次数:
484
http://blog.csdn.net/heavendai/article/details/7228621CRF(Conditional Random Field) 条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析、命名实体识别、词性标注等。在我看来,CRF就像一个反向的隐马尔可夫...
分类:
其他好文 时间:
2015-01-04 15:13:57
阅读次数:
162
Mallet是Umass大牛开发的一个关于统计自然语言处理的l的开源库,很好的一个东西。可以用来学topic model,训练ME模型等。对于开发者来说,其官网的技术文档是非常有效的。mallet下载地址,浏览开发者文档,只需点击相应的“Developer's Guide”。下面以开发一个简单的最大...
分类:
系统相关 时间:
2014-12-24 17:46:21
阅读次数:
321
东北大学出品 ,纯C++编写,学术免费,开源 。系统特色1. 全部代码采用C++语言编写2. 达到了业内最好的分析性能3. 支持七大语言分析技术4. 可以被应用于研制基于深度计算的文本分析和文本挖掘等应用系统地址:http://www.niuparser.com/
分类:
编程语言 时间:
2014-12-19 00:32:13
阅读次数:
375
1.Google在研究博客中总结了他们2011年的精彩论文《Excellent Papers for 2011》,包括社会网络、机器学习、人机交互、信息检索、自然语言处理、多媒体、系统等各个领域,很精彩的论文集锦。http://googleresearch.blogspot.com/2012/03/...
分类:
其他好文 时间:
2014-12-17 16:10:15
阅读次数:
323
http://blog.csdn.net/ice110956/article/details/17090061整理至11月中旬在重庆参加的自然语言处理与机器学习会议,第一讲为自然语言处理。由基本理论到实际运用,整理了基本的框架。1.自然语言处理基础词性标注(POS):为句子中的每个词语标注词性,可看...
分类:
编程语言 时间:
2014-12-16 13:18:08
阅读次数:
303
之前拜读过吴军老师的《数学之美》。虽然这是一本科普性质的读物,但还是能从中获益匪浅。下面根据记忆以及之前做过的简要的书面笔记,做一个概括。1.信息的作用在于消除不确定性,自然语言处理的大量问题都是找相关的信息。 2.关于搜索:技术分为术和道两种。具体的做事方法是术,做事的原理和原则是道。只有掌握了....
分类:
其他好文 时间:
2014-12-14 17:11:21
阅读次数:
215
1 我爱自然语言处理 http://www.52nlp.cn/2 统计之都 http://cos.name/机器学习会议及期刊1 http://machinelearning.wustl.edu/mlpapers/venues
分类:
Web程序 时间:
2014-12-07 13:47:54
阅读次数:
139
条件随机场模型是Lafferty于2001年,在最大熵模型和隐马尔科夫模型的基础上,提出的一种判别式概率无向图学习模型,是一种用于标注和切分有序数据的条件概率模型。
CRF最早是针对序列数据分析提出的,现已成功应用于自然语言处理(Natural Language Processing,NLP) 、生物信息学、机器视觉及网络智能等领域。
1.序列标注的例子
标注(实体命名识别):任命...
分类:
其他好文 时间:
2014-12-03 15:46:28
阅读次数:
242