以前一直在用statdict,突然发现了一个好用的东西Goldendict.转载丁香园上一篇文章:http://www.dxy.cn/bbs/topic/20455142Goldendict话说国内的lingoes一直以来是我的最爱,然而几次升级之后,出现强制升级和广告的问题实在让人恼火,加上词库是...
分类:
系统相关 时间:
2015-04-11 19:09:56
阅读次数:
151
下面给大家介绍一下如何打造自己的coreseek分词词库。 coreseek自身带的词库不是很大,直接使用它分词可能会返回大量没用结果。要想搜索结果准确打造一个专门的分词 词库必不可少。 i. 首先到搜狗http://piny...
分类:
其他好文 时间:
2015-04-09 12:19:20
阅读次数:
158
----------------------------------------------------------
lucene的分词_中文分词介绍
----------------------------------------------------------
Paoding:庖丁解牛分词器。已经没有更新了
mmseg:使用搜狗的词库
1.导入包(有两个包:1.带dic的,2...
分类:
Web程序 时间:
2015-04-08 10:59:40
阅读次数:
191
下面给大家介绍一下如何打造自己的coreseek分词词库。coreseek自身带的词库不是很大,直接使用它分词可能会返回大量没用结果。要想搜索结果准确打造一个专门的分词词库必不可少。
i.首先到搜狗http://pinyin#sogou#com/dict/下载你要的词库
ii.因为下载回来的词库不是文本文..
分类:
其他好文 时间:
2015-03-18 18:33:14
阅读次数:
130
承接上文。现在来进行response模块的开发。这一模块所完成的任务是,如果本地的词库中没有用户需要查询的词汇,那么就去网络上寻找到相应的词条作为结果返回,并存入本地数据库。我选择的网上的源是iciba,理由很简单,不需要复杂的cookie管理,所查词汇的内容基本集成在返回的html源文件中。值得注...
分类:
Web程序 时间:
2015-03-13 20:31:30
阅读次数:
210
Mac下Sublime Text 2正则批量替换目的文件:wubi86.dict.yaml匹配格式:汉字 + 一个制表符 + 编码 + 一个制表符 + 数字0
分类:
其他好文 时间:
2015-02-25 16:49:13
阅读次数:
139
现在使用Kali Linux 1.1.0, UEFI启动,使用Fcitx的拼音输入法,词库实在不爽,将就写一写。本文地址: http://www.cnblogs.com/go2bed/p/4295466.html硬件概要: ThinkPad, intel, 500G机械硬盘,Linux分区分别挂载:...
分类:
系统相关 时间:
2015-02-17 22:13:50
阅读次数:
275
在配置IKAnalyzer 同义词时,遇到一些麻烦,配置了半天终于成功,在此做个记录,方便以后参考
其实配置也简单,主要是jar包,IKAnalyzer貌似已经没人更新了……本人也是从别人那下载的才可用,我也将jar包上传至本人资源,
路径为:http://download.csdn.net/download/tjcyjd/8430613
在solr的配置文件schema.xml中添加:...
分类:
其他好文 时间:
2015-02-10 11:16:03
阅读次数:
373