码迷,mamicode.com
首页 >  
搜索关键字:ictclas 2015 nlpir    ( 86个结果
使用NLPIR-ICTCLAS2014分词系统
0、使用NLPIR-ICTCLAS2014分词系统之前的准备 下载NLPIR-ICTCLAS2014的下载包。高速传送门: http://ictclas.nlpir.org/upload/20140618094605_ICTCLAS2014.zip 须要有自己的词库(事实上没有都没问题,词库仅仅是我 ...
分类:其他好文   时间:2017-06-06 20:52:18    阅读次数:337
python 读写txt文件并用jieba库进行中文分词
python用来批量处理一些数据的第一步吧。 对于我这样的的萌新。这是第一步。 在控制台输出txt文档的内容,注意中文会在这里乱码。因为和脚本文件放在同一个地方,我就没写路径了。 还有一些别的操作。 这是文件open()函数的打开mode,在第二个参数中设置。特别需要注意一下。具体还有一些别的细节操 ...
分类:编程语言   时间:2017-05-14 23:37:38    阅读次数:498
汉语分词工具的研发-----
当时打酱油做的大创,除了看源代码之外,什么数学原理,始终没有动手实践过,站在巨人的肩上,就这么完成了大创。。 想不到时隔两年还要被迫回来学习,所以呀 出来混 还是要脚踏实地 亲力亲为 当时偷的懒 早晚都还要还回来的。 说到分词: 一:ICTCLAS 研制出了汉语词法分析系统ICTCLAS(Insti ...
分类:其他好文   时间:2017-05-13 14:52:55    阅读次数:153
Nlpir Parser敏感词搜索灵玖语义技术应用
近年来随着网络技术的飞速发展和用户的剧烈增长,网络传输数据量越来越大,网络用语越来越趋于多样化。如何快速的屏蔽用户的不当言论、过滤用户发表内容中的非法词汇已成为关键词匹配领域的一项重大难题。 目前主要过滤技术,即数据库过滤、关键字过滤。由于数据库过滤方法对许多寄生在综合性网站内的不良信息无法过滤,对 ...
分类:其他好文   时间:2017-05-05 16:19:53    阅读次数:141
NLPIR_Init文本分词-总是初始化失败,false,Init ICTCLAS failed!
前段时间用这个分词用的好好的,突然间就总是初始化失败了; 网上搜了很多,但是不是我想要的答案,最终去了官网看了下;官网链接 发现哇,版本更新了啊,下载页面链接 麻利的下载好了最新的文档,一看压缩包名字:20161115173728_ICTCLAS2016分词系统下载包 现在是2016-11-17 1 ...
分类:其他好文   时间:2016-11-17 12:52:15    阅读次数:324
NLPIR使用(1)
今天研究的是nlpir的语义分词 首先 安装pynlpir库: 下面写一个测试小程序: 运行结果: 下面我们在试一下关键词提取效果: 运行结果: 从这个小程序看,分词和关键词提取效果非常好 在程序segments 加上一个参数segments = pynlpir.segment(s,pos_engl ...
分类:其他好文   时间:2016-10-20 07:47:35    阅读次数:832
NLPIR(ICTCLAS)分析包的使用记录
前段时间使用了HanLP一个纯JAVA分词工具包,后来老大说分词效果不是很好,需要换一个分词工具。于是推荐了一个分词工具——NLPIR,它是中科院XXX研发的一个分词工具。这个分词工具只用C/C++写的,但是它提供了JAVA,C#等调用接口。于是我希望是的通过java来调用。使用java调用C/C+ ...
分类:其他好文   时间:2016-09-30 01:06:10    阅读次数:294
java中科院分词配置(ICTCLAS)
之前零零散散用过几次,配置好了就没管过。后来再用的时候就忘了怎么配置,又找了很多资料(太麻烦了)。现总结一下当作笔记: 首先,下载中科院分词项目。 github网址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/NLPIR-I ...
分类:编程语言   时间:2016-07-13 15:39:32    阅读次数:262
关于NLPIR应用在KETTLE中的探索
一:什么是NLPIR? NLPIR汉语分词系统(自然语言处理与信息检索共享平台),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。 全球用户突破20万,先后获得了 ...
分类:其他好文   时间:2016-05-09 15:50:35    阅读次数:170
ICTCLAS20160405分词系统调试过程
一、前期准备: 1、下载最新版本的资源包:CTCLAS20160405171043_ICTCLAS2016分词系统下载包 2、下载最新版本的licence:https://github.com/NLPIR-team/NLPIR/tree/master/License 二、调试程序 1、将JnaTes ...
分类:其他好文   时间:2016-04-19 19:01:43    阅读次数:310
86条   上一页 1 2 3 4 5 6 ... 9 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!