1、混淆矩阵 下图是一个二类问题的混淆矩阵,其中的输出采用了不同的类别标签 常用的衡量分类性能的指标有: 正确率(Precision),它等于 TP/(TP+FP) ,给出的是预测为正例的样本中的真正正例的比例。 召回率(Recall),他等于 TP/(TP+FN),给出的是预测为正例的真实正例占所 ...
分类:
编程语言 时间:
2017-01-03 17:02:35
阅读次数:
297
本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、基于数据集多重抽样的分类器 1.1 bagging 自举汇聚法(boots ...
分类:
编程语言 时间:
2016-12-30 18:25:14
阅读次数:
631
参考这篇文章:http://blog.csdn.net/dongtingzhizi/article/details/15962797 这篇文章写的真好,把我之前那篇文章的困惑都解释了 http://www.cnblogs.com/charlesblc/p/6208688.html 对《机器学习实战》 ...
分类:
其他好文 时间:
2016-12-25 01:21:36
阅读次数:
186
《机器学习系统设计》是一本不错的机器学习实战入门的书籍。第一章介绍了用于机器学习的Python相关工具,接下来分别用实战型例子讲解聚类、分类、回归、模式识别、降维等机器学习的主要的几种方法。 机器学习就是教机器自己来完成任务,机器学习的目标就是通过若干示例让机器学会完成任务。 像其他工程一样,设计一 ...
分类:
其他好文 时间:
2016-12-21 02:09:37
阅读次数:
138
首次接触信息熵,信息增益的概念是在阅读《机器学习实战》这本书的时候了解到的,那个时候对这几个概念还是一知半解,虽然当时可以理解,但是记忆却保持不了太久,几个月后,再次阅读一个数据专家的代码时发现人家对...
分类:
其他好文 时间:
2016-12-19 11:44:06
阅读次数:
164
本系列文章为《机器学习实战》学习笔记,内容整理自书本,网络以及自己的理解,如有错误欢迎指正。 源码在Python3.5上测试均通过,代码及数据 --> https://github.com/Wellat/MLaction 1、算法概述 1.1 朴素贝叶斯 朴素贝叶斯是使用概率论来分类的算法。其中朴素 ...
分类:
编程语言 时间:
2016-12-18 23:44:04
阅读次数:
413
这两本放在一起看吧。当然了,我觉得Spark上面的实践其实是非常棒的。有另一个系列文章讨论了Spark。 /Users/baidu/Documents/Data/Interview/机器学习-数据挖掘/《机器学习_周志华.pdf》 一共442页。能不能这个周末先囫囵吞枣看完呢。哈哈哈。 P1 一般用 ...
分类:
编程语言 时间:
2016-12-16 23:16:13
阅读次数:
391
属原创文章,欢迎转载,但请注明出处:http://www.cnblogs.com/hemiy/p/6165759.html 谢谢! 代码及数据-->https://github.com/Wellat/MLaction 1、算法概述及实现 1.1 算法特点 优点:计算复杂度不高,输出结果易于理解,对中 ...
分类:
编程语言 时间:
2016-12-15 17:44:31
阅读次数:
780
这是记录自学的过程,目前的理论基础就是:大学高等数学+线性代数+概率论。编程基础:C/C++,python
在观看机器学习实战这本书,慢慢介入。相信有读过以上三门课的人完全可以开始自学机器学习了,当...
分类:
其他好文 时间:
2016-12-15 12:14:11
阅读次数:
399