码迷,mamicode.com
首页 >  
搜索关键字:分词    ( 2158个结果
【NLP】干货!Python NLTK结合stanford NLP工具包进行文本处理
摘要:NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包,其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER... ...
分类:编程语言   时间:2016-11-07 01:12:27    阅读次数:377
Atiti  attilax主要成果与解决方案与案例rsm版 v2
Atiti attilax主要成果与解决方案与案例rsm版 v2 1. ## 主要成果与解决方案与 参与项目1 ###开发流程与培训系列1 # 组织运营与文化建设系列1 ###编程语言系列与架构系列(au1 ###爬虫与发帖机,数据挖掘采集器系列 (au2 ###文字文本处理 自然语言处理 日历处理 ...
分类:其他好文   时间:2016-11-06 03:04:09    阅读次数:331
11大Java开源中文分词器的使用方法和分词效果对比
本文的目标有两个: 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果 本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码,至于效果哪个好,那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器,不同的分词器有不同的用法,定义 ...
分类:编程语言   时间:2016-10-31 22:01:44    阅读次数:358
Atitit attilax在自然语言处理领域的成果
Atitit attilax在自然语言处理领域的成果 1.1. 完整的自然语言架构方案(词汇,语法,文字的选型与搭配)1 1.2. 中文分词1 1.3. 全文检索1 1.4. 中文 阿拉伯文 英文的简化方案1 1.5. 自动摘要2 1.6. 文本分类 聚类2 1.7. 自然语言 语义解析2 1.8. ...
分类:编程语言   时间:2016-10-31 07:25:19    阅读次数:198
gcc 4.8.5安装
在利用张乐博士的最大熵模型工具包(Maximum Entropy Modeling Toolkit for Python and C++)和条件随机场的经典工具包CRF++(CRF++: Yet Another CRF toolkit)进行分词的时候,发现工具包不能正常安装,从报出的错误推测是gcc ...
分类:其他好文   时间:2016-10-29 07:39:07    阅读次数:179
龙威零式_团队项目例会记录_8
每日任务内容: 每日任务内容: 姓名 今日任务 明日安排 金豪 文件规格说明以及架构规划 完善软件设计架构 敲定细节 谷大鑫 编写数据处理完成后上传到solr服务区上的程序 编写数据处理程序,阅读上一届代码并整合以适应我们的接口 杨金键 效果并不理想,实现麻烦,经过知道计划改用现成的库 尝试用现成的 ...
分类:其他好文   时间:2016-10-28 02:25:45    阅读次数:127
常用英语
1.Autowired:自动装配 2.qualifies v.:(使)具有资格( qualify的第三人称单数 );有权;达标;使所说的话语气减弱(或更具体等) 3.annotation:注释 4.dependency:属国,属地;从属,从属物 5.description:描述 6.componen ...
分类:其他好文   时间:2016-10-26 13:15:11    阅读次数:223
分布式搜索引擎Elasticsearch的简单使用
官方网址:https://www.elastic.co/products/elasticsearch/ 一、特性 1、支持中文分词 2、支持多种数据源的全文检索引擎 3、分布式 4、基于lucene的开源搜索引擎 5、Restful api 二、资源 smartcn, 默认的中文分词 :https: ...
分类:其他好文   时间:2016-10-24 02:02:06    阅读次数:216
(solr系列:四)将mysql数据库中的数据导入到solr中
在前面的博文中,已完成了在tomcat中对solr的部署,为solr添加了一个自定义的core,并且引入了ik分词器。那么该如何将本地的mysql的数据导入到solr中呢?准备工作:1、mysql数据源:myuser库中的user表(8条数据)/* NavicatMySQLDataTransfer SourceServer:localhost SourceSe..
分类:数据库   时间:2016-10-21 17:06:41    阅读次数:299
如何在solr中添加ik分词器
分词技术是搜索技术里面的一块基石。很多人用过,如果你只是为了简单快速地搭一个搜索引擎,你确实不用了解太深。但一旦涉及效果问题,分词器上就可以做很多文章。例如,在我们实际用作电商领域的搜索的工作中,类目预判的实现就极须依赖分词,至少需要做到可以对分词器动态加..
分类:其他好文   时间:2016-10-21 08:16:40    阅读次数:274
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!