机器学习week7 ex6 review 这周使用支持向量机(supprot vector machine)来做一个简单的垃圾邮件分类。 Support vector machine 1.1 Example dataset 1 ex6.m首先载入ex6data1.mat中的数据绘图: %% Part ...
分类:
其他好文 时间:
2017-11-15 23:40:16
阅读次数:
403
用于网页黑名单系统,垃圾邮件过滤系统,爬虫的网址判重系统。一般的意思是在大量数据集合中,判断一个新数据是否存在于这个集合中。数据量少还可以使用hashmap和位图bitmap。数据一大占用内存不理想。布隆的做饭法是,开辟一个长度为m的位图数组,对于每一个集合的元素使用多个hash函数计算得值%m,落 ...
分类:
其他好文 时间:
2017-11-15 21:58:14
阅读次数:
152
有关贝叶斯原理的讲解, 请查看这里。这里讲述的是通过贝叶斯推断如何过滤垃圾邮件。贝叶斯推断及其互联网应用 (接上文)七、什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有“关键词法”和“校验码法”等。前者的过 ...
分类:
其他好文 时间:
2017-11-08 17:55:39
阅读次数:
246
一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。 那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题 如何使用贝叶斯推断过滤垃圾邮件(英文版)? 说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把 ...
分类:
其他好文 时间:
2017-11-08 17:29:05
阅读次数:
194
dig 命令主要用来从 DNS 域名服务器查询主机地址信息。 查询单个域名的 DNS 信息 dig 命令最典型的用法就是查询单个主机的信息。 dig 命令默认的输出信息比较丰富,大概可以分为 5 个部分。第一部分显示 dig 命令的版本和输入的参数。第二部分显示服务返回的一些技术详情,比较重要的是 ...
分类:
系统相关 时间:
2017-11-06 11:34:19
阅读次数:
294
1 贝叶斯定理的引入 概率论中的经典条件概率公式: 公式的理解为,P(X ,Y)= P(Y,X)<=> P(X | Y)P(Y)= P(Y | X)P (X),即 X 和 Y 同时发生的概率与 Y 和 X 同时发生的概率一样。 2 朴素贝叶斯定理 朴素贝叶斯的经典应用是对垃圾邮件的过滤,是对文本格式 ...
分类:
编程语言 时间:
2017-11-04 16:23:24
阅读次数:
226
前言贝叶斯决策可能在相关机器学习或数据挖掘或专家系统中有着广泛的应用,故其地位也相当重要;比如在垃圾邮件的过滤、钓鱼邮件的判定、垃圾(钓鱼)短信过滤等场合的应用就相当多(因为笔者较多地从事这些工作),或者可以说上述这些应用其实其主要方法就是使用了贝叶斯方法..
分类:
其他好文 时间:
2017-10-24 16:03:50
阅读次数:
195
本来是计划对postfix做一个全系列的安装文档的,不过在查某个知识点的时候,偶然找到一个已经写好的postfix全系列文章,在全部看完之后惊为天人,我认为:总体上会比我要写的要好,所以我准备借用一下拿来主义的案例,直接总结一个链接的目录连接给大家参考。 我之前几篇写好的已经构建了一个基本的邮件系统 ...
分类:
其他好文 时间:
2017-10-23 21:42:53
阅读次数:
150
问题描述:客户使用了思科邮件网关,邮件网关会根据规则自动识别一些垃圾邮件,并进行隔离,邮件隔离后会以邮件形式通知到邮箱,收件人可根据需要选择是否放行,放行后邮件会到收件人邮箱。反正,则存在邮件网关的垃圾邮件隔离区中。有部分收件人点击放行,无法执行操作,并提..
分类:
其他好文 时间:
2017-10-17 12:42:45
阅读次数:
202
安装新版的submin2.2.2后,由于需要通过本机发送admin的密码,但是本机没有sendmail或者是发送后被邮箱当成垃圾邮件拦截掉了,因此导致无法收到admin的密码,这个可以通过程序进行修改/usr/lib/python2.7/site-packages/submin/plugins/storage/sql
vipasswd.py输入脚本如下imp..
分类:
其他好文 时间:
2017-10-16 22:08:40
阅读次数:
196