在和刘同学长谈之后,我再次对前一段时间的想法进行了反思,结合聊天中的新感受,整理在这里。(注:标题里的算法,指机器学习算法,或者说“算法工程师”这个职位名称里的“算法”,不是“算法与数据结构”里的那个算法。谁能告诉我有没有什么更好的名字来区别这它们,或许是“机器学习算法”与“传统算法”?)算法与算法...
分类:
编程语言 时间:
2015-08-09 00:19:06
阅读次数:
118
c4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 。c4.5对ID3算法做了相对的改进。如下 1 采用信息增益率代替信息增益。因为使用信息增益时会偏向选取取值更多的属性。 2 在树的构造过程中进行剪枝 3 能够完成对连续属性的离散化处理 4 对不完整数据进行处理c...
分类:
编程语言 时间:
2015-08-08 11:56:25
阅读次数:
130
本笔记为Coursera在线课程《Machine Learning》中的神经网络章节的笔记。八、神经网络:表述(Neural Networks: Representation) 本节主要讨论一种叫做神经网络的机器学习算法。首先讨论神经网络的表层结构,在后续的课程中再讨论具体的学习算法。神经网络其实是...
分类:
系统相关 时间:
2015-08-06 21:55:00
阅读次数:
196
这篇是计算机类的优质预售推荐>>>>《机器学习实践
测试驱动的开发方法》
用测试驱动方法开发出可靠、稳定的机器学习算法。
编辑推荐
本书介绍在开发机器学习算法时如何运用测试驱动的方法,捕捉可能扰乱正常分析的错误。这本实践指南从测试驱动开发和机器学习的基本原理讲起,展示了如何将测试驱动开发运用于若干机器学习算法,包括朴素贝叶斯分类器和神经网络。
任何机器学习算法都有...
分类:
其他好文 时间:
2015-08-06 16:58:01
阅读次数:
137
假设现在要构建一个网络图书馆,我们可以给新进来的书贴上若干个标签,没有机器学习算法的情况下,我们需要给这些书手动分类,是计算机类的呀,还是非计算机类的呀,是小说类的呀,还是非小说类的云云。
那么,我们可以通过让程序自己学习如何通过一本书上的若干标签来进行图书类别的区分,这样就可以节省很多人力,这也是机器学习的魅力体现。
机器学习的基本原理是通过开发者给出这个程序一个学习集进行学习,再通过用户给的...
分类:
其他好文 时间:
2015-08-02 20:10:29
阅读次数:
170
该节主要是把《机器学习实战》书上第三章关于决策树的相关代码照样子实现了一遍。对其中一些内容作了些补充,对比ID3与C45区别,同时下载了一个大样本集实验决策树的准确率。首先,对于决策树的原理,很多很好的博客值得一看:从决策树学习谈到贝叶斯分类算法、EM、HMM决策树算法总结这两个已经详解了关于决策树的所有,慢慢品读吧。下面是书上外加添加的部分程序,首先是tree.py里面的程序:import ope...
分类:
编程语言 时间:
2015-07-31 22:01:49
阅读次数:
282
对于机器学习的实际运用,光停留在知道了解的层面还不够,我们需要对实际中容易遇到的一些问题进行深入的挖掘理解。我打算将一些琐碎的知识点做一个整理。1 数据不平衡问题这个问题是经常遇到的。就拿有监督的学习的二分类问题来说吧,我们需要正例和负例样本的标注。如果我们拿到的训练数据正例很少负例很多,那么直接拿来做分类肯定是不行的。通常需要做以下方案处理:1.1 数据集角度通过调整数据集中正负样本的比例来解决数...
分类:
编程语言 时间:
2015-07-28 21:17:17
阅读次数:
180
由于最近对机器学习算法感兴趣,一直知道python有一个包collections封装了一些比dict,list之类高级点的类,所以抽空研究下,为接下来的工作准备。 主要参考是https://docs.python.org/2/library/collections.html#defaultdi...
分类:
其他好文 时间:
2015-07-27 13:03:43
阅读次数:
133
算算时间,从开始到现在,做机器学习算法也将近八个月了。虽然还没有达到融会贯通的地步,但至少在熟悉了算法的流程后,我在算法的选择和创造能力上有了不小的提升。实话说,机器学习很难,非常难,要做到完全了解算法的流程、特点、实现方法,并在正确的数据面前选择正确的方法再进行优化得到最优效果,我觉得没有个...
分类:
其他好文 时间:
2015-07-26 22:26:54
阅读次数:
164
一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。二、The k-...
分类:
编程语言 时间:
2015-07-26 20:31:24
阅读次数:
144