系列文章:《机器学习实战》学习笔记 决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。 缺点:可能会产生过度匹配问题。 适用数据类型:离散型和连续型 我们经常使用决策树处理分类问题,它的过程类似二十个问题的游戏:参与游戏的一方在脑海里想某个事物,其他参与者...
分类:
其他好文 时间:
2015-11-13 06:14:05
阅读次数:
238
机器学习和数据挖掘推荐书单机器学习和数据挖掘推荐书单有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Log...
分类:
其他好文 时间:
2015-10-27 15:03:48
阅读次数:
201
机器学习和数据挖掘推荐书单有了这些书,再也不愁下了班没妹纸该咋办了。慢慢来,认真学,揭开机器学习和数据挖掘这一神秘的面纱吧!《机器学习实战》:本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向...
分类:
其他好文 时间:
2015-10-24 18:59:08
阅读次数:
248
线性回归
用线性回归找到最佳拟合直线回归的目的是预测数值型数据,根据输入写出一个目标值的计算公式,这个公式就是回归方程(regression equation),变量前的系数(比如一元一次方程)称为回归系数(regression weights)。求这些回归系数的过程就是回归。假设输入数据存放在矩阵X X中,回归系数存放在向量w w中,那么对于数据X 1 X_1的预测结果可以用Y 1 =X T...
分类:
其他好文 时间:
2015-10-18 10:04:10
阅读次数:
836
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器,比起弱分类器,这个“强”分类器的错误率会低很多。...
分类:
编程语言 时间:
2015-10-08 23:17:44
阅读次数:
1000
支持向量机,就是通过最大化支持向量到分类超平面之间的分类间隔。分类超平面就是我们想要得到的决策曲面;支持向量就是离分类超平面最近的点,而间隔即为支持向量到分类超平面的距离。...
分类:
其他好文 时间:
2015-10-02 01:29:21
阅读次数:
193
新近到手一本《机器学习实战》(Peter Harringtom),兴奋之余,本着好记性不如烂笔头的真理,打算将读书的过程记录下来,形成读书笔记,重点记录自己所理解的算法思想与应用示例。本人野生猿一枚,贻笑大方之处,敬请谅解。机器学习可以揭示数据背后的真实含义,而数据以及基于数据做出的决策是非常重要的...
分类:
其他好文 时间:
2015-09-27 12:28:45
阅读次数:
139
摘自:《机器学习实战》,用python编写的(需要matplotlib和numpy库) 海伦一直使用在线约会网站寻找合适自己的约会对象。尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人。经过一番总结,她发现曾交往过三种类型的人: 1.不喜欢的人(以下简称1 ); 2.魅力一般的人(以下简...
分类:
编程语言 时间:
2015-09-22 22:00:26
阅读次数:
617
生活中,人们经常会遇到各种最优化问题,比如如何在最短时间从一个地点到另外一个地点?如何在投入最少的资金而却能得到最高的受益?如何设计一款芯片使其功耗最低而性能最好?这一节就要学习一种最优化算法——Logistic回归......
分类:
其他好文 时间:
2015-09-20 20:50:00
阅读次数:
790
概率是许多机器学习算法的基础,在前面生成决策树的过程中使用了一小部分关于概率的知识,即统计特征在数据集中取某个特定值的次数,然后除以数据集的实例总数,得到特征取该值的概率。之前的基础实验中简单实现了朴素贝叶斯分类器,并正确执行了文本分类,这一节将贝叶斯运用到实际场景,垃圾邮件过滤这一实际应用。...
分类:
其他好文 时间:
2015-09-15 00:18:48
阅读次数:
232