敏感词、文字过滤是一个网站必不可少的功能,如何设计一个好的、高效的过滤算法是非常有必要的。前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢。我把它程序拿过来一看,整个过程如下:读取敏感词库、如果HashSet集合中,获取页面上传文字,然后进行匹配。我就想这 ...
分类:
编程语言 时间:
2016-05-19 23:05:40
阅读次数:
307
1、两种方式创建正则表达式
JS风格:
var re = /ab+c/;
Perl风格:/ab+c/;
2、字符串与正则配合
-->search:返回出现的位置,对大小写敏感(使用/i(忽略大小写));
-->match:返回获取的项目,匹配不到则返回null;
-->replace:替换所有的匹配(敏感词过滤)(str.replace(/mic),"t...
分类:
编程语言 时间:
2016-05-13 01:54:57
阅读次数:
286
本文为博主原创,允许转载,但请声明原文地址:http://www.coselding.cn/blog/8/8-141.html
(1)大量分页查询时,及时session.clear(),可能导致内存溢出;
大集合遍历:如寻找敏感词汇;
注:内存泄漏,Java本身不会内存泄漏,但是Java调用的底层C会内存泄漏。
(2)1+N问题:(典型面试题)
一个实体A关联着另一个实体B,查询...
分类:
Web程序 时间:
2016-05-12 18:15:22
阅读次数:
193
过滤器FilterFilter也称之为过滤器,它是Servlet技术中最实用的技术,WEB开发人员通过Filter技术,对web服务器管理的所有web资源:例如Jsp,Servlet,静态图片文件或静态html文件等进行拦截,从而实现一些特殊的功能。例如实现URL级别的权限访问控制、过滤敏感词汇、压缩响应信息..
分类:
其他好文 时间:
2016-05-11 11:33:29
阅读次数:
263
转自:http://www.infoq.com/cn/articles/alibaba-broadcast-platform-technology-challenges 鏖战双十一-阿里直播平台面临的技术挑战 转自:http://www.infoq.com/cn/articles/alibaba-b ...
分类:
Web程序 时间:
2016-05-05 19:20:17
阅读次数:
436
之前发表的时候一直有敏感词汇很久没找出来,后来就忘了发,现补上,望谅解。 设计思想:在原来最大子数组的基础之上,将输入的数组复制一个粘贴到原来的后面。每次循环都扫描起点后输入数字个数个数字。计算数组和,并不断更新最大数组合 程序源代码: 截图: ...
分类:
编程语言 时间:
2016-04-20 11:10:50
阅读次数:
146
一、Filter简介 Web开发人员通过Filter技术,对Web服务器管理的所有Web资源:JSP、Servlet、静态文件、静态HTML等进行拦截,从而实现一些特殊的功能。例如实现URL级别的权限访问控制、过滤敏感词汇、压缩响应信息等一些高级功能。 Servlet API提供了一个Filter接... ...
分类:
编程语言 时间:
2016-04-16 21:08:18
阅读次数:
225
第 0012 题: 敏感词文本文件 filtered_words.txt,里面的内容 和 0011题一样,当用户输入敏感词语,则用 星号 * 替换,例如当用户输入「北京是个好城市」,则变成「**是个好城市」。 把上一题的代码改一下就可以咯。 Code: 结果: ...
分类:
编程语言 时间:
2016-04-08 14:59:08
阅读次数:
176
在写之前,小Alan给大家推荐一篇来自http://cmsblogs.com/?p=1031的博文,也会参考部分内容来描述博文。 敏感词过滤应该是不用给大家过多的解释吧?讲白了就是你在项目中输入某些字(比如输入xxoo相关的文字时)时要能检测出来,很多项目中都会有一个敏感词管理模块,在敏感词管理模块 ...
分类:
编程语言 时间:
2016-03-28 16:49:44
阅读次数:
868