码迷,mamicode.com
首页 >  
搜索关键字:词性标注    ( 116个结果
NLP | 自然语言处理 - 标注问题与隐马尔科夫模型(Tagging Problems, and Hidden Markov Models)
什么是标注?在自然语言处理中有一个常见的任务,即标注。常见的有:1)词性标注(Part-Of-Speech Tagging),将句子中的每一个词标注词性,比如名词、动词等;2)实体标注(Name Entity Tagging),将句子中的特殊词标注,比如地址、日期、人物姓名等。下图所看到的的是词性标...
分类:编程语言   时间:2016-01-22 14:09:00    阅读次数:198
HanLP自然语言处理包开源(包含源码)
支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、CRF依存句法分析)。提供Lucene插件,兼容L...
分类:编程语言   时间:2016-01-06 18:03:58    阅读次数:4341
ictclas,ansj,结巴分词,StanfordNLP中文分词以及所用词性标注集
NLPIR(ICTCLAS),参见java实现NLPIR(ICTCLAS)分词:http://www.bubuko.com/infodetail-665665.html,词性标注使用北大词性标注集。在Linux系统中的使用方法:http://jingyan.baidu.com/article/915...
分类:其他好文   时间:2015-10-24 00:09:55    阅读次数:744
jieba中文分词的.NET版本:jieba.NET
分词、词性标注和关键词提取是jieba中文分词的三个主要功能,jieba.NET实现了与jieba一致的功能和接口。jieba.NET的开发刚刚开始,还有很多细节需要完善。非常欢迎大家的试用和反馈,也希望能和大家一起讨论,共同实现更好的中文分词库。
分类:Web程序   时间:2015-09-08 21:57:40    阅读次数:277
stanford-parser for C#
在项目里用到C#对英文句子进行词性标注,比较成熟的英文词性标注软件是stanford-parser。它个C#版本,也是借助于IKVM完成JAVA-C#的转换。具体配置步骤如下: 1、下载stanford-parser的jar包 http://nlp.stanford.edu/software/lex-parser.shtml 2、下载C#版本的工程 https://github.com/...
分类:Windows程序   时间:2015-07-18 17:09:34    阅读次数:459
Tiny中文分词
Maven引用坐标:12345org.tinygroupchinese0.0.12Tiny中文分词是本人一开始做的一个验证性开发,结果开发出来效果还非常不错,因此就加入到Tiny框架中。Tiny中文分词支持下面的功能:1.中文分词2.中文转化拼音3.词性标注中文分词,就是把中文句子分解成一个一个的词...
分类:其他好文   时间:2015-07-01 11:40:47    阅读次数:113
NLPIR简介及使用配置
NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;官方网址:http://ictclas.nlpir.org(地址一直在变,要是不能用直接搜NLPIR).....
分类:其他好文   时间:2015-05-10 12:45:23    阅读次数:254
NLP
近期有同学问我有哪些较好的nlp工具。之前我们都知道中科院的ictclas,能够实现分词、词性标注功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面ictclas有java,c++,python版本。另外,从去年开始我一直在用哈工大的ltp,它的基础性功能比ictcla...
分类:其他好文   时间:2015-05-05 21:21:18    阅读次数:148
【转】国内可用免费语料库
(一)国家语委1国家语委现代汉语语料库http://www.cncorpus.org/现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语语料库在线提供免费检索的语料约2000万字,为分词和词性标注语料。2古代汉语语料库http://www...
分类:其他好文   时间:2015-04-21 17:48:54    阅读次数:128
结巴分词中的词性对照
结巴分词标注兼容_ICTCLAS2008汉语词性标注集2014-01-20 | ouyang78... download计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类...
分类:其他好文   时间:2015-04-11 08:51:57    阅读次数:17203
116条   上一页 1 ... 7 8 9 10 11 12 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!