AdaBoost算法(AdaptiveBoost)的核心思想是:如果一个弱分类器的分类效果不好,那么就构建多个弱分类器,综合考虑它们的分类结果和权重来决定最终的分类结果。很多人认为AdaBoost是监督学习中最强大的两种算法之一(另一个是支持向量机SVM)。AdaBoost的训练过程如下:为每个..
分类:
编程语言 时间:
2014-11-06 15:09:33
阅读次数:
225
之前写k-近邻算法(http://boytnt.blog.51cto.com/966121/1569629)的时候,没附上测试数据,这回找了一个,测试一下算法的效果。数据来源于http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data,关于乳腺癌的样..
分类:
编程语言 时间:
2014-11-05 17:36:00
阅读次数:
230
本文内容源自GitHub《Awesome C/C++》。 关于 C++ 框架、库和资源的一些汇总列表,由 fffaraz 发起和维护。 内容包括:标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。强大的C/C++标准库框架人工智能异步事件循环音频生态学压缩并发性...
分类:
编程语言 时间:
2014-11-05 17:07:08
阅读次数:
417
简介: Weka的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),是一款免费的,非商业化的,基于JAVA环境下开源的机器学习(machine learning)以及数据挖掘(data minining)软件。 Weka存储数据的...
分类:
其他好文 时间:
2014-11-05 14:18:28
阅读次数:
209
Machine Learning:Linear Regression With One Variable
机器学习可以应用于计算机视觉,自然语言处理,数据挖掘等领域,可以分为监督学习(Supervised Learning),无监督学习(Unsupervised Learning),强化学习(Reinforcement Learning)等。
首先我们从一个简单...
分类:
系统相关 时间:
2014-11-05 00:30:58
阅读次数:
256
阅读导读:
1.R语言如何检查文件或目录是否存在?如何重命名一个文件?
2.R语言如何查看和修改目录的权限?
3.R语言如何删除一个文件?
4.用R语言管理一个文件系统时,都有哪些特殊的目录?
5.如何查看R软件指定包所在目录?
1.
文件系统介绍
计算机的文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易,文件系统使用文件和树形目录的抽象...
分类:
编程语言 时间:
2014-11-05 00:28:34
阅读次数:
323
概率 理解概率最简单的方式就是把它们想像成韦恩图中的元素。首先你有一个包含全部可能输出(比如一个实验的)的全集,如今你对当中的一些子集感兴趣,即一些事件。如果我们在研究癌症,所以我们观察人们看他们是否患有癌症。在研究中,如果我们把全部參与者当成我们的全集,然后对不论什么一个个体来说都有两种可能的结论...
分类:
其他好文 时间:
2014-11-04 17:02:23
阅读次数:
225
机器学习算法 原理、实践与实战 —— 感知机感知机(perceptron)是二分类的线性分类模型,输入为特征向量,输出为实例的类别,取值+1和-1。感知机学习旨在求出将训练数据进行线性划分的分离超平面,为此,引入了基于误分类的损失函数,利用梯度下降法对损失函数进行极小化,求得感知机模型。1. 感知机...
分类:
其他好文 时间:
2014-11-03 14:26:40
阅读次数:
270
朴素贝叶斯(NaiveBayesian)算法的核心思想是:分别计算给定样本属于每个分类的概率,然后挑选概率最高的作为猜测结果。假定样本有2个特征x和y,则其属于分类1的概率记作p(C1|x,y),它的值无法直接分析训练样本得出,需要利用公式间接求得。其中p(Ci)表示训练样本中分类为Ci的..
分类:
编程语言 时间:
2014-11-03 10:22:12
阅读次数:
246