grep及正则表达式 正则表达式 (REGular EXPression,REGEXP)是对字符串和特殊字符(元字符)操作的一种逻辑公式,使用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。通常被用来 检索、替换 那些符合某个 ...
分类:
其他好文 时间:
2018-07-20 20:32:48
阅读次数:
187
反向解析;根据ip地址解析为相对应的域名。域名的反向解析不是很常见,只在一些特殊场合使用,如垃圾邮件的验证。配置文件:主配置文件:作用于服务器本身/etc/named.conf区域配置文件:作用于相关的域名/etc/named.rfc1912.zones区域数据配置文件:作用于相关域名的解析/var/named/named.localhostbind软件包的安装,bind软件包安装完成之后,会增加
分类:
其他好文 时间:
2018-07-15 17:39:16
阅读次数:
202
贝叶斯公式 p(A|D)=p(A)*p(D|A)/p(D); 可以应用于垃圾邮件的过滤和拼写检查 例如:对于拼写检查,写出一个单词D,判断该单词为正确单词A的概率。为上述条件概率的描述。 其中p(A)为先验概率,可以根据现有的数据库中的单词,来获得A单词的概率p(A)。由于正确的单词不仅仅有A,还有 ...
分类:
其他好文 时间:
2018-06-29 21:44:55
阅读次数:
194
1.欢迎参加《机器学习》 当我们使用谷歌或者必应搜索网页的时候,当我们搜索相册中老友的照片的时候,当我们的电子邮箱收到许多邮件,而垃圾邮件被自动的过滤的时候,都有机器学习在起作用。 但最值得我们兴奋的是,我们可以梦想有一天,我们可以通过机器学习制造出像我们一样智能的AI,虽然这个目标距离我们还很远, ...
分类:
其他好文 时间:
2018-06-29 14:21:36
阅读次数:
151
设想一下,一个上班族一天要接到多少垃圾邮件?据媒体报道,目前来往的邮件中,高达95%以上的是垃圾邮件,而且有些垃圾邮件还会故意占据着邮箱的最前列。同时,随着人们接受资讯越来越快捷便利,渠道越来越多,也一定程度上分流了注意力,导致打开邮箱的间隔期变长,对一封邮件的关注度下降。所以在邮件泛滥的情况下,U ...
分类:
其他好文 时间:
2018-06-28 14:07:29
阅读次数:
168
这个很久就解决了,一直没有写随笔,写下来作个记录,也方便其它人搜索查看。 阿里云为了安全考虑,封掉了25端口,因为通常edm发送垃圾邮件给很多用户产生困扰,但不能一封了之,所以一般使用465端口替代25端口,但需要使用ssl协议。 所以将$g_smtp_connection_mod='ssl'或SM ...
分类:
其他好文 时间:
2018-06-23 13:10:15
阅读次数:
187
mystr = 'xxxSPAMxxx' mystr.find('SPAM') # 返回收个匹配的位置偏移(3) mystr = 'xxxaaxxaa' mystr.replace('aa', 'SPAM') # 全局替换 ...
分类:
其他好文 时间:
2018-06-17 21:49:07
阅读次数:
168
分类模型的评价指标Fscore小书匠 深度学习 分类方法常用的评估模型好坏的方法. 0.预设问题假设我现在有一个二分类任务,是分析100封邮件是否是垃圾邮件,其中不是垃圾邮件有65封,是垃圾邮件有35封.模型最终给邮件的结论只有两个:是垃圾邮件与 不是垃圾邮件.经过自己的努力,自己设计了模型,得到了... ...
分类:
其他好文 时间:
2018-06-06 18:22:49
阅读次数:
916
Lync 项目经验-48-去死吧,天天让人烦垃圾邮件
分类:
其他好文 时间:
2018-05-24 21:51:37
阅读次数:
306
分类问题,主要介绍决策树算法、朴素贝叶斯、支持向量机、BP神经网络、懒惰学习算法、随机森林与自适应增强算法、分类模型选择和结果评价。 一、分类基本介绍 物以类聚,人以群分,分类问题只古以来就出现我们的生活中。分类是数据挖掘中一个重要的分支,在各方面都有着广泛的应用,如医学疾病判别、垃圾邮件过滤、垃圾 ...
分类:
编程语言 时间:
2018-05-23 17:06:05
阅读次数:
236