什么是标注?在自然语言处理中有一个常见的任务,即标注。常见的有:1)词性标注(Part-Of-Speech Tagging),将句子中的每一个词标注词性,比如名词、动词等;2)实体标注(Name Entity Tagging),将句子中的特殊词标注,比如地址、日期、人物姓名等。下图所看到的的是词性标...
分类:
编程语言 时间:
2016-01-22 14:09:00
阅读次数:
198
支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析)。提供Lucene插件,兼容L...
分类:
编程语言 时间:
2016-01-06 18:03:58
阅读次数:
4341
NLPIR(ICTCLAS),参见java实现NLPIR(ICTCLAS)分词:http://www.bubuko.com/infodetail-665665.html,词性标注使用北大词性标注集。在Linux系统中的使用方法:http://jingyan.baidu.com/article/915...
分类:
其他好文 时间:
2015-10-24 00:09:55
阅读次数:
744
分词、词性标注和关键词提取是jieba中文分词的三个主要功能,jieba.NET实现了与jieba一致的功能和接口。jieba.NET的开发刚刚开始,还有很多细节需要完善。非常欢迎大家的试用和反馈,也希望能和大家一起讨论,共同实现更好的中文分词库。
分类:
Web程序 时间:
2015-09-08 21:57:40
阅读次数:
277
在项目里用到C#对英文句子进行词性标注,比较成熟的英文词性标注软件是stanford-parser。它个C#版本,也是借助于IKVM完成JAVA-C#的转换。具体配置步骤如下:
1、下载stanford-parser的jar包
http://nlp.stanford.edu/software/lex-parser.shtml
2、下载C#版本的工程
https://github.com/...
Maven引用坐标:12345org.tinygroupchinese0.0.12Tiny中文分词是本人一开始做的一个验证性开发,结果开发出来效果还非常不错,因此就加入到Tiny框架中。Tiny中文分词支持下面的功能:1.中文分词2.中文转化拼音3.词性标注中文分词,就是把中文句子分解成一个一个的词...
分类:
其他好文 时间:
2015-07-01 11:40:47
阅读次数:
113
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;官方网址:http://ictclas.nlpir.org(地址一直在变,要是不能用直接搜NLPIR).....
分类:
其他好文 时间:
2015-05-10 12:45:23
阅读次数:
254
近期有同学问我有哪些较好的nlp工具。之前我们都知道中科院的ictclas,能够实现分词、词性标注功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面ictclas有java,c++,python版本。另外,从去年开始我一直在用哈工大的ltp,它的基础性功能比ictcla...
分类:
其他好文 时间:
2015-05-05 21:21:18
阅读次数:
148
(一)国家语委1国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。2古代汉语语料库http://www...
分类:
其他好文 时间:
2015-04-21 17:48:54
阅读次数:
128
结巴分词标注兼容_ICTCLAS2008汉语词性标注集2014-01-20 | ouyang78... download计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类...
分类:
其他好文 时间:
2015-04-11 08:51:57
阅读次数:
17203