logistic回归一般用于二分类问题,比如判断一封邮件是否为垃圾邮件,判断照片中的人是男是女,预测一场比赛输还是赢......当然也可以用于多分类问题,比如k类别,就进行k次logistic回归。logistic回归算法之所以称作“logistic”,是因为它运用了logistic函数,即sigmoid函数。
logistic回归算法一般用于二分类问题(当然也可以多类别,后面会讲)。
logistic回归的算法思想:
重点在于怎么根据训练数据求得最佳拟合参数Θ?这可以用最优化算法来求解,比如常用的梯度上升...
分类:
编程语言 时间:
2014-12-10 14:18:25
阅读次数:
502
惰性学习法:简单的存储数据,一直等待,直到给定一个测试元组时才进行泛化,根据对存储的元组的相似性进行分类。kNN(k近邻)分类方法于20世纪50年代提出,由于计算密集型算法,因此到60年代之后随着计算能力增强后才逐步应用。
kNN基于类比学习,将给定的测试元组表示为n维空间中的一个点,n代表属性数目。然后使用某种距离度量方式来寻找与给定测试元组最近的k个训练元组,对这个k个训练元组的类别进行统计...
分类:
其他好文 时间:
2014-12-08 17:47:16
阅读次数:
262
昨天和邮件组的同事调试邮件relay功能,提供了测试smtp邮件服务器命令:黑体是输入的命令,yourmailname@ABC.com是你的邮件地址.若你收到一封测试邮件,可能在垃圾邮件目录中,说明smtp邮件服务器正常SEAMXRelay.ABC.com(10.52.124.25):relaymailserver25:smptportnumber在你的电脑..
分类:
其他好文 时间:
2014-12-03 14:33:20
阅读次数:
408
退信代码说明:? ?421 HL:REP 该IP发送行为异常,存在接收者大量不存在情况,被临时禁止连接。请检查是否有用户发送病毒或者垃圾邮件,并核对发送列表有效性; ?421 HL:ICC 该IP同时并发连接数过大,超...
分类:
其他好文 时间:
2014-12-02 15:30:13
阅读次数:
204
搞了anti-spam之后,发现原来杀毒软件的原理也是类似的,浏览器的AdBlock插件原理也是类似的.
目的
垃圾是不可能根绝的,就跟犯罪不可能根绝一样.所以anti-spam的目的,就是提高攻击成本,降低防御成本.攻击者的目的无非就是牟利,当他们成本太高的时候,就会降低攻击力度.
攻击者的智慧
人肉打码:绕过验证码
淘宝"注册账号交易"
代收短信业务/代收邮件业务:...
分类:
其他好文 时间:
2014-11-27 00:17:38
阅读次数:
298
IDC评述网(idcps.com)11月25日报道:近日,工业和信息化12321网络不良与垃圾信息举报受理中心发布了《2014年10月举报受理情况月报》。根据报告显示,10月份,12321举报中心共收到不良与垃圾信息举报312,395件次,环比上月减少50,088件次。其中,垃圾邮件举报5,010件次;互联..
分类:
Web程序 时间:
2014-11-25 19:02:07
阅读次数:
201
auto-ban之后会在
Settings-Advanced-IP Ranges
处出现一个ban规则
一般只要删掉就可以了
另外还有说将权限改为25也能解决
还有个其他方法就是添加白名单,这是官方建议的方法,
在Settings-Anti-Spam-White listing处添加自己主机的信息即可...
分类:
其他好文 时间:
2014-11-25 10:54:30
阅读次数:
905
贝叶斯的应用过滤垃圾邮件贝叶斯分类器的著名的应用就是垃圾邮件过滤了,这方面推荐想详细了解的可以去看看《黑客与画家》或是《数学之美》中对应的章节,贝叶斯的基础实现看这里数据集两个文件夹,分别是正常邮件和垃圾邮件,其中各有25封邮件测试方法从50封邮件中随机选取10封做为测试数据实现细节1.首先我们需要...
分类:
编程语言 时间:
2014-11-19 07:10:16
阅读次数:
371
朴素贝叶斯算法优缺点优点:在数据较少的情况下依然有效,可以处理多类别问题缺点:对输入数据的准备方式敏感适用数据类型:标称型数据算法思想:朴素贝叶斯比如我们想判断一个邮件是不是垃圾邮件,那么我们知道的是这个邮件中的词的分布,那么我们还要知道:垃圾邮件中某些词的出现是多少,就可以利用贝叶斯定理得到。朴素...
分类:
编程语言 时间:
2014-11-17 01:43:33
阅读次数:
456
题目地址:1133. SPAM思路: 题目意思是说在‘@’的前后出现题目给定的合法字符或者不连续出现‘.’字符的话,这个就是合理的输出。 那么以@为中心,向前,向后扫描,当扫描到不符合字符时,记录此时位置,以前后为区间,输出字符。 具体代码如下: 1 #include 2 #include ...
分类:
其他好文 时间:
2014-11-15 01:26:49
阅读次数:
159