运用贝叶斯公式(朴素贝叶斯假设每个特征每个特征都是独立的)可以解决的问题有,已知某些特征,用来判断某情况发生的可能性大小,设置可能性最大的情况作为预测值。 是一种监督算法。 广泛应用于垃圾邮件检测等等。 ...
分类:
其他好文 时间:
2017-06-22 23:56:13
阅读次数:
387
本文选取了25封垃圾邮件和25封正常邮件,随机产生了10组测试集和40组训练集,使用朴素贝叶斯方法实现了垃圾邮件的分类。 Bayes公式 遍历每篇文档向量,扫描所有文档的单词,合并集合去重 ,并生成最终的词汇表 # 创建词汇表 # 输入:dataSet已经经过切分处理 # 输出:包含所有文档中出现的 ...
分类:
其他好文 时间:
2017-06-18 10:31:47
阅读次数:
170
本讲内容 1. Naive Bayes(朴素贝叶斯) 2.Event models(朴素贝叶斯的事件模型) 3.Neural network (神经网络) 4.Support vector machines(支持向量机) 1.朴素贝叶斯 上讲中的垃圾邮件问题有几个需要注意的地方: (1) 一个单词只 ...
分类:
其他好文 时间:
2017-06-07 20:58:28
阅读次数:
222
Coursera上数据分析实例 --R语言如何对垃圾邮件进行分类 Structure of a Data Analysis l Define the question l Define the ideal data set l Determine what data you can access l ...
分类:
编程语言 时间:
2017-06-04 12:56:38
阅读次数:
1375
一、python的基础语法和规则 1.变量 ①.变量的命名规则 语法: (下划线或字母)+(任意数目的字母、数字或下划线) 变量名必须以下划线或字母开头,而后面接任意数目的字母、数字或下划线。下划线分割。 区分大小写: SPAM和spam不同 不能使用python内置关键字,以下关键字不能声明为变量 ...
分类:
编程语言 时间:
2017-06-03 12:40:48
阅读次数:
172
双11购物狂欢虽已过去。但购物热潮却并未退却。而这也带来了每年都会在这段时候出现的网络犯罪活动: 趋势科技已经看到大量伪造的银行电子邮件。也看到其它类型的垃圾邮件威胁,包含KELIHOS,VAWTRACK,甚至某些形式的419骗局。 趋势科技也目睹了银行恶意软件的添加。这个恶意软件家族变种试图窃取敏 ...
分类:
其他好文 时间:
2017-05-28 17:28:30
阅读次数:
233
R 代码积累不定期更新 1.阶乘、递归、reduce、sprintf 2.MD5加密卡号 3.时间函数 https://cran.r-project.org/web/packages/lubridate/vignettes/lubridate.html ...
分类:
其他好文 时间:
2017-05-28 10:54:38
阅读次数:
301
现实生活中有很多分类问题,比如正常邮件/垃圾邮件,良性肿瘤/恶性肿瘤,识别手写字等等,这些可以用逻辑回归算法来解决。 一、二分类问题 所谓二分类问题,即结果只有两类,Yes or No,这样结果{0,1}集合来表示y的取值范围。 前面说到过,线性回归的模型是 h(x)=θ0+θ1x1+θ2x2+.. ...
分类:
系统相关 时间:
2017-05-20 17:15:13
阅读次数:
300
1 关于机器学习 机器学习是实现人工智能的手段, 其主要研究内容是如何利用数据或经验进行学习, 改善具体算法的性能 多领域交叉, 涉及概率论、统计学, 算法复杂度理论等多门学科 广泛应用于网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺诈检测、股票交易和医疗诊断等应用 机器学习的分类 监督学 ...
分类:
其他好文 时间:
2017-05-18 18:39:27
阅读次数:
279
最近致力于深度学习,希望在移动领域能够找出更多的应用点.其中TensorFlow作为目前的一个热点值得我们重点关注.
分类:
其他好文 时间:
2017-05-14 00:59:57
阅读次数:
305