1.贝叶斯分类器: 用途:分类,举例:垃圾邮件过滤。 是一种典型的监督算法。需要经过训练才能后续进行分类。 进行贝叶斯分类的时候,最重要的环节是特征的提取,这个将训练或者分类的数据转化成一个特征列表。 优点:速度快。对分类器实际学习状况的解释相对简单。 缺陷:无法处理基于特征组合所产生的变化结果。 ...
分类:
编程语言 时间:
2014-12-28 23:28:54
阅读次数:
234
IDC评述网(idcps.com)12月25日报道:近日,工业和信息化12321网络不良与垃圾信息举报受理中心发布了《2014年11月举报受理情况月报》。根据报告显示,11月份,12321举报中心共收到不良与垃圾信息举报219,921件次,较上月减少92,474件次。其中,垃圾邮件举报7,976件次;互联网..
分类:
其他好文 时间:
2014-12-25 11:30:20
阅读次数:
151
PEP8:line too long #>120
字符串赋值太长解决:
字符串
Python除处理数字外还可以处理字符串,字符串用单撇号或双撇号包裹:
>>> 'spam eggs'
'spam eggs'
>>> 'doesn/'t'
"doesn't"
>>> "doesn't"
"doesn't"
>>> '"Yes," he said.'
'"Yes," he said...
分类:
编程语言 时间:
2014-12-22 21:19:08
阅读次数:
197
[root@localhost/]#mail-s"Message"xxxxx@163.com</tmp/info.message系统默认以“root@主机名”发送邮件,收到邮件直接被过虑成垃圾邮件了,那可不可以自定义邮箱发送邮件呢?答案肯定可以的。下载mailx包mailx官方站点http://heirloom.sourceforge.net/下载最新版本mailx-1..
分类:
系统相关 时间:
2014-12-20 18:25:16
阅读次数:
243
现在网络上有很多爬虫,专门四处搜集网站代码中出现的邮箱,搜集到了之后就批量出售或者发送垃圾邮件。很多人都把邮箱中的 “@” 换成 “#”,但这样对用户不太方便,而且这种方法很多机器人都可以识破,同样被搜集走。本文中,我将演示如果通过编码邮箱的方式防止搜集邮箱的机器人。首先把下边的代码放到当前主题的f...
分类:
其他好文 时间:
2014-12-20 15:28:51
阅读次数:
298
小明在学习采集,弄了个dedecms作为发布平台,几个小时后跑来报喜说好简单,但又不想制造那么多spam,每个分类只保留几条就好。在后台删除这些文章,每页只显示30个,看了下有100多页,立马沮丧了,数据库批量删除又不会。问我要怎么修改“文档列表”每一页显示的文档条数。 打开这个文件dede/...
分类:
其他好文 时间:
2014-12-19 15:47:38
阅读次数:
183
说明:SpamLocker是一款开放源代码,并以GPL授权发布,起源于APF技术,以SMTP行为识别为核心的反垃圾邮件系统。使用Perl语言撰写;SpamLocker使用了多种目前反垃圾邮件领域的领先技术,比如本地黑白名单、灰名单技术,多RBL查询技术等等;这些众多厂商引以为豪的反垃圾邮件技术..
分类:
其他好文 时间:
2014-12-19 10:09:43
阅读次数:
1323
urllib官方文档地址 :https://docs.python.org/2/library/urllib.html
官网提供了 四个 访问的例子
GET 请求
import urllib
params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
f = urllib.urlopen("http://www.mus...
分类:
编程语言 时间:
2014-12-18 15:20:29
阅读次数:
187
公司新弄了服务器,建了exchange server,通知全公司试用时发现给客户群发邮件会被拒绝,返回的错误信息是550 Mail content denied出错原因:该邮件内容涉嫌大量群发,并且被多数用户投诉为垃圾邮件。 对于具有群发性质的邮件,如果出现用户普遍表示反感或集中投诉...
分类:
其他好文 时间:
2014-12-16 18:55:12
阅读次数:
237
朴素贝叶斯分类是贝叶斯分类器的一种,贝叶斯分类算法是统计学的一种分类方法,利用概率统计知识进行分类,其分类原理就是利用贝叶斯公式根据某对象的先验概率计算出其后验概率(即该对象属于某一类的概率),然后选择具有最大后验概率的类作为该对象所属的类。总的来说:当样本特征个数较多或者特征之间相关性较大时,朴素贝叶斯分类效率比不上决策树模型;当各特征相关性较小时,朴素贝叶斯分类性能最为良好。另外朴素贝叶斯的计算过程类条件概率等计算彼此是独立的,因此特别适于分布式计算。本文详述了朴素贝叶斯分类的统计学原理,并在文本分类中...
分类:
编程语言 时间:
2014-12-12 20:56:48
阅读次数:
1004