英文原文:4 Self-Study Machine Learning Projects
学习机器学习有很多方法,大多数人选择从理论开始。
如果你是个程序员,那么你已经掌握了把问题拆分成相应组成部分及设计小项目原型的能力,这些能力能帮助你学习新的技术、类库和方法。这些对任何一个职业程序员来说都是重要的能力,现在它们也能用在初学机器学习上。
要想有效地学习机器学习你必须学习相关理论,...
分类:
其他好文 时间:
2014-06-05 11:44:35
阅读次数:
208
神经网络常用于机器学习中的分类,常用的分类算法有:朴素贝叶斯,遗传算法,神经网络,支持向量机等。
在互联网发达的今天,有很多东西需要进行分类,在分类之前,我们常常是有一些数据,找出这些数据符合什么样的
模型,然后根据这些已有数据来预测将来,神经网络就是用来进行这种数据建模的。
神经网络一般情况是有个输入,有个输出,在输入层和输出层之间通常还有若干个隐含层。实际上,在1989年...
分类:
其他好文 时间:
2014-06-05 02:40:25
阅读次数:
261
(转载请注明出处:http://blog.csdn.net/buptgshengod)1.背景
接着上一节说,没看到请先看一下上一节关于数据集的划分数据集划分。如今我们得到了每一个特征值得信息熵增益,我们依照信息熵增益的从大到校的顺序,安排排列为二叉树的节点。数据集和二叉树的图见下。(二叉树的图是....
分类:
编程语言 时间:
2014-06-03 07:23:48
阅读次数:
325
原创博客,转载请:http://blog.csdn.net/zhjm07054115/article/details/27577181...
分类:
其他好文 时间:
2014-06-03 04:53:59
阅读次数:
276
一、Mahout简单介绍查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...附logo:(就是他,骑在象头上的那个Mahout)步入正文啦:
Mahout是一个非常强大的数据挖掘工具,是一个分布式机器学习算法的集.....
分类:
其他好文 时间:
2014-06-02 08:14:03
阅读次数:
273
机器学习算法中经常碰到非线性优化问题,如 Sparse Filtering
算法,其主要工作在于求解一个非线性极小化问题。在具体实现中,大多调用的是成熟的软件包做支撑,其中最常用的一个算法是
L-BFGS。为了解这个算法的数学机理,这几天做了一些调研,现把学习过程中理解的一些东西整理出来。目录...
分类:
其他好文 时间:
2014-06-02 07:31:21
阅读次数:
227
二叉树的层序遍历(要求区分层,例如每层遍历完输出换行)
单单层序遍历非常简单,一个队列就搞定了,但是区分层则要麻烦些。总的思路无非就是在每次print的时候,要能通过某个东西
区分出当前节点是否是一层最后一个节点,或者下一层的最后一个节点,感觉有点类似于机器学习中找个区分度明显的特征:
1.自己的解法,在单队列基础上,输入队列的数据添加一个标志 ,LevelHeaded,同时...
分类:
其他好文 时间:
2014-06-01 10:49:44
阅读次数:
267
Active LearningTwo Faces of Active Learning,
Dasgupta, 2011Active Learning Literature Survey, Settles, 2010ApplicationsA
Survey of Emerging Approaches...
分类:
其他好文 时间:
2014-05-31 07:37:19
阅读次数:
277
Harvard机器学习资料(video)http://cm.dce.harvard.edu/2011/02/23101/publicationListing.shtml1.
ml-class.org级别相当于S校的CS229A,注重Application,适合大二的学生学习,产生兴趣。但这个理论性差...
分类:
其他好文 时间:
2014-05-31 01:48:54
阅读次数:
366
参考:《机器学习实战》 优点:计算复杂度不高,
输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特 征数据。 缺点:可能会产生过度匹配问题。 适用数据类型:数值型和标称型。
创建分支的伪代码(createBranch): 图1 1、信息...
分类:
其他好文 时间:
2014-05-29 16:59:42
阅读次数:
401