--- 之前项目里客户提出一个需求,需要对系统中使用文本转化成语音发送的功能进行敏感词检测,禁止用户提交有敏感词的语音。通过查询各方面资料,整理了大概几种方案: 1. 项目启动时对载入敏感词库作为缓存(一个...
分类:
编程语言 时间:
2014-09-02 00:28:14
阅读次数:
472
今天我们要部分实现背单词功能,在开始正题之前,还是附上背单词软件的下载链接:http://apk.91.com/Soft/Android/com.carlos.yueci-4.html最近实验室有了任务,时间会紧些,因此这个项目要加快进度了。 首先把我在系列二中的功能分析拷贝过来: 功能2、...
分类:
移动开发 时间:
2014-08-31 00:20:50
阅读次数:
380
Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史 全文检索的实现:Luene全文索引和数据库索引的比较 中文切分词机制简介:基于词库和自动切分词算法的比较 具...
分类:
编程语言 时间:
2014-08-21 19:46:35
阅读次数:
445
发现了一个很好的分词类库phpanalysis2.0。 原文连接地址:http://www.phpbone.com/phpanalysis/ 分 词系统简介:PHPAnalysis分词程序使用居于unicode的词库,使用反向匹配模式分词,理论上兼容编码更广泛,并且对utf-8编码尤为方 ...
分类:
Web程序 时间:
2014-08-19 18:49:15
阅读次数:
494
第六天小帅帅周五休息后,精神估计太旺盛了,周末两天就狂欢去了,酒喝高了,把一件重要的事儿给忘记了。周一重新整装 刺骨上战场.一来公司,小帅帅终于记得他要做的事情,就迫不及待的整理会议报告(工作总结)。1.上周工作任务: 1) 页面提交关键词到关键词词库 2) 文件导入到关键词词库 3) ...
分类:
其他好文 时间:
2014-08-08 12:11:15
阅读次数:
200
第一天收到需求,需求如下: 1. 收集关键词,构建关键词词库。收到这个任务,第一想法,这还不简单吗? 马上动手创建一个关键词录入界面,保存到数据库。 第一步完成了,哈哈大笑了一天,没想到事情原来如此的简单。$keywords = $_POST["keywords"];foreach($keyword...
分类:
其他好文 时间:
2014-08-06 18:50:01
阅读次数:
202
基于控制台的简单版的聊天机器人,词库可以自己添加。源码如下:using System;using System.Collections.Generic;using System.Text;namespace 面向对象聊天机器人1{ class Program { stati...
分类:
其他好文 时间:
2014-08-02 12:38:13
阅读次数:
236
设计一款英汉语词典程序, 输入单词,然后输出具体的汉语含义
本题目是UI阶段英汉词典项目所需要的OC代码
单词词库格式如下:
#abidance
Trans:n. 遵守;持续;居住
#abide
Trans:vi. 遵守;忍受;居留;坚持@vt. 忍受
单词占用一行,以#开头
汉语含义占用一行 以Trans:开头,并且按照n, vi. 随后, 然后一个空格,然后是具体汉语含义,...
分类:
其他好文 时间:
2014-07-29 14:46:38
阅读次数:
262
汉文博士是绿色软件,解压即可使用。下载及安装方法如下所述。 点击本网志左上角的汉文博士及字词库下载连接,进入百度网盘空间。 点击上图下方所示的“汉文博士”连接,打开目录。 在文件列表中找到“汉文博士”后跟版本号,后缀为“.7z”的文件(如上图所示)。 点击该文件对应的复选框,使之呈选中状态,然后点击...
分类:
其他好文 时间:
2014-07-21 08:21:23
阅读次数:
323
公司的solr线上服务器,分成差不多是个core给不同的部门不同的业务需求来使用。我接手以来,问题多多,烦扰多多。有不少问题亟待解决,首当其冲的是搜索准确度、数据同步。搜索准确度已经通过改用ansj分词器和不断优化的个人词库和停用词库来解决,这是个不断优化的过程,需要长时间的跟进才有明显效果。第二个...
分类:
其他好文 时间:
2014-07-19 15:19:33
阅读次数:
846