<?php /** * 敏感词过滤工具类 * 使用方法 * echo FilterTools::filterContent("你妈的我操一色狼杂种二山食物","*",DIR."config/word.txt",$GLOBALS["p_memcache"]["bad_words"]); */ clas ...
分类:
Web程序 时间:
2016-06-15 15:43:06
阅读次数:
277
敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来一看,整个过程如下:读取敏感词库、如果HashSet集合中,获取页面上传文字,然后进行匹配。我就想这 ...
分类:
编程语言 时间:
2016-05-19 23:05:40
阅读次数:
307
1、两种方式创建正则表达式
JS风格:
var re = /ab+c/;
Perl风格:/ab+c/;
2、字符串与正则配合
-->search:返回出现的位置,对大小写敏感(使用/i(忽略大小写));
-->match:返回获取的项目,匹配不到则返回null;
-->replace:替换所有的匹配(敏感词过滤)(str.replace(/mic),"t...
分类:
编程语言 时间:
2016-05-13 01:54:57
阅读次数:
286
转自:http://www.infoq.com/cn/articles/alibaba-broadcast-platform-technology-challenges 鏖战双十一-阿里直播平台面临的技术挑战 转自:http://www.infoq.com/cn/articles/alibaba-b ...
分类:
Web程序 时间:
2016-05-05 19:20:17
阅读次数:
436
在写之前,小Alan给大家推荐一篇来自http://cmsblogs.com/?p=1031的博文,也会参考部分内容来描述博文。 敏感词过滤应该是不用给大家过多的解释吧?讲白了就是你在项目中输入某些字(比如输入xxoo相关的文字时)时要能检测出来,很多项目中都会有一个敏感词管理模块,在敏感词管理模块 ...
分类:
编程语言 时间:
2016-03-28 16:49:44
阅读次数:
868
敏感词过滤是很多网站、论坛常用的功能,一下为相关文章: 1、关于java中敏感词检测的一些总结 2、Java 利用DFA算法 屏蔽敏感词 3、Java实现敏感词过滤--DFA算法
分类:
其他好文 时间:
2015-11-11 22:12:14
阅读次数:
150
今天的项目是与完成python开展,需要使用做关键词检查,筛选分类,使用前c语言做这种事情。有了线索,非常高效,内存小了,检查快。到达python在,第一个想法是pip基于外观的c语言python特里模块。不幸的是,我们没有找到一个合适的,假设我会用c书写python模块的话。就自己写一个了,可惜我...
分类:
编程语言 时间:
2015-10-15 08:45:26
阅读次数:
273
1、正则表达式---效率低2、双数组trie算法3、多级hash表4、其他开源算法
分类:
其他好文 时间:
2015-09-30 18:22:59
阅读次数:
141
1、文本匹配,敏感词过滤(正则表达式,及其他各种算法)2、分类算法3、黑名单(布隆过滤算法等)
分类:
其他好文 时间:
2015-09-30 18:19:52
阅读次数:
156
由于app中有论坛 模块,用户发帖,为了禁止用户发不文明的帖子,所以对文字进行过滤,我的方法是:1 、新建一张敏感词表。导入敏感词,数据不多,大概500 左右。2、代码比较。查询出所有的敏感词,和输入的文字比较(由于我们 的用户量不多。几千,所以这个方案可行。不会太影响速度。)粘贴代码:这样就会把那...
分类:
其他好文 时间:
2015-09-08 15:06:23
阅读次数:
177