码迷,mamicode.com
首页 >  
搜索关键字:词库    ( 312个结果
简评QQ拼音输入法
用户界面: 这款输入法的用户界面还是比较多样化,有多种界面可以在设置中选择,简单的,可爱的,简约的种种类型都有,也可以在界面中选择使用小键盘,双拼模式 界面的颜色,界面上可以显示的字符数量,界面的大小等等,都可以进行设置,设计的还是较为人性化的。 记住用户选择: 导入用户词库功能,选择后即可按照提示 ...
分类:其他好文   时间:2017-05-12 23:16:05    阅读次数:221
Elasticsearch之中文分词器插件es-ik的热更新词库
参考:http://www.mamicode.com/info-detail-1705113.html 先声明,热更新词库,需要用到,web项目和Tomcat。不会的,请移步 Eclipse下Maven新建项目、自动打依赖jar包(包含普通项目和Web项目) Tomcat *的安装和运行(绿色版和安 ...
分类:其他好文   时间:2017-05-11 12:50:47    阅读次数:279
lucene构建同义词分词器
lucene4.0版本号以后 已经用TokenStreamComponents 代替了TokenStream流。里面包含了filter和tokenizer 在较复杂的lucene搜索业务场景下,直接网上下载一个作为项目的分词器,是不够的。那么怎么去评定一个中文分词器的好与差:一般来讲。有两个点。词库 ...
分类:Web程序   时间:2017-04-30 12:35:14    阅读次数:152
SNS团队第六次站立会议(2017.04.28)
一、当天站立式会议照片 本次会议主要内容:汇报工作进度,根据完成情况调整进度 二、每个人的工作 导入相关词库数据 三、燃尽图 横坐标:工作日,以天为单位,一共七天,代表着Alpha冲刺阶段的时间一共为7天 纵坐标:剩余卡片数,以卡片数为单位,代表着每一个任务。 橙线:代表设置的卡片数在规定的工作日内 ...
分类:其他好文   时间:2017-04-29 01:13:45    阅读次数:279
Android使用sqlliteOpenhelper更改数据库的存储路径放到SD卡上
假设使用默认的系统管理,默认放在包以下。比較省心。并且在卸载app后不会造成数据残留。可是这样也有一个问题。比方我做一个背单词的软件,那么当用户卸载掉这个app时,他辛辛苦苦下载的单词库也没了... 所以我想到的解决方式。就是把数据库路径改下。不放到包以下,放到SD卡上。细致看看。还真不easy做, ...
分类:移动开发   时间:2017-04-21 18:01:29    阅读次数:1011
elasticsearch 拼音搜索
现在很多公司都开始使用es来做搜索,我们公司目前也有好几个业务部门在用,我主要做商户搜索,为业务部门提供基础支持。上周把呼叫中心的搜索重新整理了下,在新增几个字段后,全量同步发现通过拼音首字母搜索无法搜索出来了,最后发现是词库地址变更,导致分词出现了问题。 我整理了下es的搜索分词插件和流程,如下: ...
分类:其他好文   时间:2017-04-11 12:07:23    阅读次数:244
变位词的查找(下)
本文也同步发表在我的公众号“我的天空” 实现方案优劣的思考 之前我们的实现方案的优点是一旦目标词库的签名建立后,则变位词的查找会变得简单而快速;缺点是由于在生成目标词库时,要为每个词都生成签名,导致生成词库的时间会变慢,同时会消耗空间。对于那些没有被查找到的字符串的签名实际上是浪费的。 测试结果:在 ...
分类:其他好文   时间:2017-04-08 17:19:58    阅读次数:174
极点五笔词库DIY
2004年没啥好的拼音输入法,试了清华紫光输入法一段时间,也相当不满意, 于是在2005年开始学五笔,很快就选定极点五笔了, 使用过程中没啥不满意的,反而还有惊喜,主要就是快捷码表吧,很爽。 一直就这么用着,期间发现有些重码,还有编码设定的不合理, 但是一直没太上心,2016年开始留意了下,想DIY ...
分类:其他好文   时间:2017-04-04 20:02:59    阅读次数:438
使用朴素贝叶斯分类器过滤垃圾邮件
1.从文本中构建词向量 将每个文本用python分割成单词,构建成词向量,这里首先需要一个语料库,为了简化我们直接从所给文本中抽出所有出现的单词构成一个词库。 2.利用词向量计算概率p(x|y) When we attempt to classify a document, we multiply ...
分类:其他好文   时间:2017-03-28 20:46:16    阅读次数:287
屏蔽功能
KeyTree类 这个类的功能是 : 读取硬盘上的key.txt(里面存放的是敏感关键词),将之读入Set中,再讲Set中的元素传入到Map中(通过Map来生成敏感词的树状结构),并传出这个Map(敏感词树) public Map createKeyWord():创建一个Map类型的词库(敏感词树) ...
分类:其他好文   时间:2017-03-24 12:09:03    阅读次数:255
312条   上一页 1 ... 13 14 15 16 17 ... 32 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!