KeyTree类 这个类的功能是 : 读取硬盘上的key.txt(里面存放的是敏感关键词),将之读入Set中,再讲Set中的元素传入到Map中(通过Map来生成敏感词的树状结构),并传出这个Map(敏感词树) public Map createKeyWord():创建一个Map类型的词库(敏感词树) ...
分类:
其他好文 时间:
2017-03-24 12:09:03
阅读次数:
255
什么叫正则表达式 到底正则表达式是个啥呢?实际上就是一些通配符。 正则给我们一些元字符,这些元字符可以理解成一些已经定义好的通配符,使用它们在字符串中找到我们想要的匹配。 那么正在等用处很多,像采集器、敏感词过滤、URLRewite、Validator中都会用到 正则表达式语法 一个正则表达式就是由 ...
分类:
其他好文 时间:
2017-03-12 13:24:18
阅读次数:
176
过滤器可以简单的理解为“取你所想取”,过滤器关注的是web请求;拦截器可以简单的理解为“拒你所想拒”,拦截器关注的是方法调用,比如拦截敏感词汇。4.1,拦截器是基于java反射机制来实现的,而过滤器是基于函数回调来实现的。(有人说,拦截器是基于动态代理来实现的)4.2,拦截器不依赖servlet容器 ...
分类:
其他好文 时间:
2017-02-12 14:39:44
阅读次数:
243
一、简介 Filter也称之为过滤器,它是Servlet技术中最激动人心的技术,WEB开发人员通过Filter技术,对web服务器管理的所有web资源:例如Jsp, Servlet, 静态图片文件或静态 html 文件等进行拦截,从而实现一些特殊的功能。例如实现URL级别的权限访问控制、过滤敏感词汇 ...
分类:
编程语言 时间:
2017-01-31 23:33:40
阅读次数:
384
直播平台,内容,聊天网站对用户输入的敏感词进行屏蔽。 例如,写两个文本域和一个btn按钮。当按钮按下时。将用户输入的敏感词转化为“**”,再把文本变成转化后的文本。 例子如下: ...
分类:
其他好文 时间:
2017-01-25 18:45:20
阅读次数:
193
除剔除那些含有敏感词的文本,由于有大量的敏感词,所以通过简单的正则表达式和字符串查找的方式效率太低,每次都有遍历一次字符串。而AC算法的核心思想就是避免不必要的回溯使搜索一直沿着向前的方向,最大可能的减小了时间复杂度,时间复杂度O(N),N为所有的字符串的长度,而且关键字的字数和长度无关。 基本思路 ...
分类:
编程语言 时间:
2017-01-20 11:02:09
阅读次数:
169
邮件应用协议包括: 搭建企业级的电子邮件系统,请考虑下面几点: 反垃圾与反病毒模块:阻止垃圾邮件或病毒邮件对企业邮箱的干扰。 邮件加密:保证邮件内容不被嗅探、篡改。 邮件监控审核:监控全体职员邮件中有无敏感词,透露企业资料等。 稳定性:有较好的防DDOS攻击的能力,保证系统在线率等。 单独的使用Po ...
分类:
其他好文 时间:
2017-01-19 19:46:48
阅读次数:
393
原文:http://blog.csdn.net/u011698346/article/details/46350461 三步工作 一:敏感词过滤核心算法,参考这篇文章的DFA算法,http://blog.csdn.net/chenssy/article/details/26961957 实现两个类 ...
分类:
其他好文 时间:
2017-01-17 18:51:28
阅读次数:
315
在一些博客或者论坛中,文章中的敏感词需要显示出来和高亮显示起到提示用户的作用。这个功能实现的方法有很多,下面是js的实现方式。 ...
分类:
Web程序 时间:
2016-12-25 01:21:04
阅读次数:
377