码迷,mamicode.com
首页 >  
搜索关键字:分词    ( 2158个结果
中文分词算法-百度面试题
题目: 给定一个字符串, 一个数组,判断这个字符串能否被分隔成字典里的一个个单词。用动态规划算法 我面试时写的是下面的代码 public static boolean divied2(String s,String[] dict){ boolean result=false; if(s.length()==0) return true...
分类:编程语言   时间:2015-06-15 23:57:51    阅读次数:195
实验二-3 Hadoop&Paoding 中文词频统计
参考教程在Hadoop上使用庖丁解牛(较复杂,并未采用,可以之后试试)http://zhaolinjnu.blog.sohu.com/264905210.htmlLucene3.3、Lucene3.4中文分词——庖丁解牛分词实例(屈:注意版本)http://www.360doc.com/conten...
分类:其他好文   时间:2015-06-15 23:38:44    阅读次数:610
Elasticsearch 集成IK分词器
Elasticsearch中文分词...
分类:其他好文   时间:2015-06-15 18:55:38    阅读次数:169
IKAnalyzer词典扩充
IKAnalyzer词典扩充最近工作使用到lucene,需要对中文分词,分词器是IKAnalyzer,自带的词典包含了27万词条,能满足一般的分词要求,但是如果应用到特定的专业领域,还需要扩展专业词库,以达到更好的分词效果:IKAnalyzer词典扩充 IKAnalyzer分词API 智能分词 最细粒度切分 词库扩展 通过配置文件扩展词典 通过API扩展词典IKAnalyzer分词API...
分类:其他好文   时间:2015-06-15 11:20:57    阅读次数:272
[LeetCode] Word Break II 拆分词句之二
Given a string s and a dictionary of words dict, add spaces in s to construct a sentence where each word is a valid dictionary word.Return all such po...
分类:其他好文   时间:2015-06-15 06:54:37    阅读次数:210
中科院NLPIR中文分词java版
摘要:为解决中文搜索的问题,最开始使用PHP版开源的SCWS,但是处理人名和地名时,会出现截断人名地名出现错误。开始使用NLPIR分词,在分词准确性上效果要比SCWS好。本文介绍如何在windows系统下编译JAVA,生成可以执行的jar文件。NLPIR的下载地址:http://ictclas.nl...
分类:编程语言   时间:2015-06-12 23:47:26    阅读次数:314
唐诗三百首分词词频分析
发现本博客的文章也有随意转载了,而且排名还比原文高。所以加上申明,本文不得转载。 http://www.cnblogs.com/cartler 下面是正文,看到微博上词频分析很火,自己也试了下。 过程很简单,但结果很有趣,所以先上结果。 成果基本可以由下面这首"唐诗"概括,o(≧v≦)o~~好棒~ ...
分类:其他好文   时间:2015-06-09 06:07:02    阅读次数:185
总结第八届R语言大会百度分会场
早早爬起来赶到北大光华听百度分会场的报告,把听到的简要记述一下。李鹏 自然语言理解中的深度学习首先梳理自然语言理解这个问题,提出基本问题是: Tagging:例如命名实体识别 Generation:翻译,问答->多轮对话 然后是具体的例子: Tagging问题的例子:语义角色标注 解决Who do what at where…等等句子逻辑成分划分的问题 分词...
分类:编程语言   时间:2015-06-07 14:37:30    阅读次数:464
ecstore小记
主要appbase 基础MVCdbeav 数据库扩展pam 登录认证setup 系统安装工具image 图片存取site 站点desktop 后台操作ectools 电商基础工具b2c 订单,商品,会员search 分词+索引目录结构--项目目录结构ecstore 文件夹app 应...
分类:其他好文   时间:2015-06-06 21:53:23    阅读次数:149
几种开源分词工具的比較
搜集了一些资料,与同学一起进行了简单的測试,总结例如以下。分词工具特点支持语言原理词典及扩展性StandardAnalyzer中文、英文(unicode)中文:单字符切分英文:依据空格切分ChineseAnalyzer中文,不支持中文和英文及数字混合的文本分词按字分词,与StandardAnalyz...
分类:其他好文   时间:2015-06-04 13:38:56    阅读次数:91
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!