分类问题和线性回归问题问题很像,只是在分类问题中,我们预测的y值包含在一个小的离散数据集里。首先,认识一下二元分类(binary classification),在二元分类中,y的取值只能是0和1.例如,我们要做一个垃圾邮件分类器,则为邮件的特征,而对于y,当它1则为垃圾邮件,取0表示邮件为正常邮件 ...
分类:
其他好文 时间:
2016-08-13 18:20:55
阅读次数:
267
查看邮件头对于分析邮件被拒收或是查找垃圾邮件来源都很有帮助。下面是Office365下的Outlook2013内查看一封具体邮件的邮件头的方法。下图是一张典型的exchangeserver的架构图(Ilync)
分类:
其他好文 时间:
2016-08-10 14:42:31
阅读次数:
187
C#编程实现 这篇文章做了什么 朴素贝叶斯算法是机器学习中非常重要的分类算法,用途十分广泛,如垃圾邮件处理等。而情感分析(Sentiment Analysis)是自然语言处理(Natural Language Progressing)中的重要问题,用以对文本进行正负面的判断,以及情感度评分和意见挖掘 ...
分类:
编程语言 时间:
2016-08-08 00:56:04
阅读次数:
390
目前,我们在邮件群发的过程中,很困扰的一个问题就是自己发送的邮件进入垃圾箱,成为垃圾邮件。下面博主为大家分析一下这个原因,希望大家能够规避这些因素。邮件发送频率太快导致被判为垃圾邮件;EDM营销邮件主题和内容千篇一律,主题过长、特殊符号一堆、包含敏感词、文本格..
分类:
其他好文 时间:
2016-08-01 07:00:43
阅读次数:
222
很多人在使用邮件过程中习焉不察,把邮件写好点“发送”刷的一下瞬间即达对方收件箱,殊不知,邮件的传送有时是很不容易的一件事,正因为大多数商业资讯甚至机密文件都通过邮件传输,所以被恶意软件、网络钓鱼攻击和垃圾邮件、病毒侵扰的情况很常见。稍有不慎中了圈套还浑然不..
分类:
其他好文 时间:
2016-07-19 11:33:30
阅读次数:
193
观测: 用来学习训练的实体或者项,比如:邮件 特征:用来描述一个观测的属性,比如,长度、日期、单词出现的频率等待 标签:观测的类别,比如对于邮件来说,分为垃圾邮件和非垃圾邮件 训练集和测试集:训练集就是用来训练和估计一个学习算法的观测的集合。比如:一个带有标签的邮件集合 训练集:用来训练学习算法的数 ...
分类:
其他好文 时间:
2016-07-12 15:15:55
阅读次数:
119
逻辑回归常用于分类问题,最简单诸如二分类问题:是否是垃圾邮件?比赛是赢是输? 对于线性回归问题, z = w0*x0+w1*x1+w2*x2+... 一般的通过最小二乘法学习参数w来预测给定一个x值时z的大小,其值域在(-∞,+∞),而对于分类问题,显然预测值是离散的,通过引入S函数先将值域y缩小到 ...
分类:
其他好文 时间:
2016-07-07 19:16:56
阅读次数:
921
可运用于 网页黑名单系统 垃圾邮件过滤系统 爬虫的网址判重系统等数据量很大的问题 --好的哈希函数能将很多输入均匀地分布在bit array上,将所有值%m,可以分布到0~m-1上。处理过程如上图所示,一个对象经过k个哈希函数处理后,得到k个值,根据这k个值将对应的bit做标记。处理完所有输入之后, ...
分类:
其他好文 时间:
2016-07-06 14:51:25
阅读次数:
116
使用SHELL脚本进行检查服务开启情况 调用python发送QQ邮件的邮件(可以防止垃圾邮件屏蔽) 测试用例: [root@199 huanghai]# python mail.py 10402852@qq.com 黄海的测试标题 黄海的测试内容发送成功 ...
分类:
系统相关 时间:
2016-07-02 16:05:48
阅读次数:
252
如果希望实现基于发件人邮件地址,或者需要拒绝某个域的邮件,可以通过ExchangeOnline提供的垃圾邮件筛选器策略来解决。垃圾邮件筛选器策略除了能够实现上述的黑名单筛选外,还支持白名单筛选,基于国别来进行筛选,比如阻止某岛国语言的邮件,从某小人国发来的邮件等。此外,..
分类:
其他好文 时间:
2016-06-29 23:52:23
阅读次数:
520