机器学习有着丰富的理论,分为有监督学习和无监督学习,有监督学习包括分类和回归,无监督学习包括聚类等。各种机器学习算法的基本思想都不难理解(这里的基本思想我的理解是各个算法的模型建立),而难点在于对于模型的求解,这里边有着优美的理论还有一些技巧,如SVM,EM,CA..
分类:
编程语言 时间:
2014-10-17 05:25:44
阅读次数:
619
Self-taught 自我学习器实验报告1.Self-taught 自我学习实验描述 自我学习是无监督特征学习算法,自我学习意味着算法能够从未标注数据中学习,从而使机器学习算法能够获得更大数量的数据,因而更有可能取得更好的性能。在本实验中,我们将按照自我学习的步骤,使用稀疏自编码器和softmax...
分类:
其他好文 时间:
2014-10-17 00:23:43
阅读次数:
371
在机器学习或者是模式识别当中有一种重要的分类器叫做:SVM 。这个被广泛的应用于各个领域。但是其计算的复杂度以及训练的速度是制约其在实时的计算机应用的主要原因。因此也很很多的算法被提出来,如SMO,Kernel的方法。
但是这里要提到的 Regularized
least-squares classification 是一个和他有着同样的效果的分类器。比较而言计算却比较的简单(We ...
分类:
其他好文 时间:
2014-10-16 16:55:33
阅读次数:
268
回归: 在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归,回归还有很多的变种,如locally weighted回归,logistic回归,等等。训练集(training set)或者训练数据(traini...
分类:
其他好文 时间:
2014-10-16 00:42:01
阅读次数:
165
昨天开始看Ng教授的机器学习课,发现果然是不错的课程,一口气看到第二课。 第一课 没有什么新知识,就是机器学习的概况吧。 第二课 出现了一些听不太懂的概念。其实这堂课主要就讲了一个算法,梯度下降算法。到了教授推导公式的时候感觉有点蒙,不过后来仔细想想,也大概理解了,这个算法并没有...
分类:
编程语言 时间:
2014-10-15 21:56:21
阅读次数:
179
logistic回归与python实现,理论与实际结合。...
分类:
编程语言 时间:
2014-10-14 17:29:58
阅读次数:
290
当今这个大数据时代,数据就等于金钱。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,百分之八十的数据是非结构化的,因此它需要一个程序和方法来从中提取有用信息,并且将其转换为可理解、可用的结构化形式。在数据挖掘过程中,有大量的工具可供使用,比如采用人工智能、机器学习,以及其他技术等来.....
分类:
其他好文 时间:
2014-10-14 13:00:28
阅读次数:
205
Weka算法Clusterers-DBSCAN源码分析...
分类:
数据库 时间:
2014-10-12 23:50:58
阅读次数:
371
1、k-近邻算法算法原理:存在一个样本数据集(训练样本集),并且我们知道样本集中的每个数据与其所属分类的对应关系。输入未知类别的数据后将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似(最近邻)的k组数据。然后将k组数据中出现次数最多的分类,来作为新数据的分类。算法步...
分类:
其他好文 时间:
2014-10-12 20:39:28
阅读次数:
199