前言 有人认为 AdaBoost 是最好的监督学习的方式。 某种程度上因为它是元算法,也就是说它会是几种分类器的组合。这就好比对于一个问题能够咨询多个 "专家" 的意见了。 组合的方式有多种,可能是不同分类算法的分类器,可能是同一算法在不同设置下的集成,还可以是数据集在不同部分分配给不同分类器...
分类:
编程语言 时间:
2015-01-02 16:01:58
阅读次数:
188
ylbtech-Microsoft-CSharpSamples:ylbtech-LanguageSamples-OLEDB1.A,示例(Sample) 返回顶部“OLE DB”示例本示例演示了如何在 C# 中使用 Microsoft Access 数据库。它演示了如何创建数据集并从数据库向该数据集添...
分类:
数据库 时间:
2015-01-02 01:12:10
阅读次数:
302
KDD杯的中心,所有的数据,任务和结果。UCI机器学习和知识发现研究中使用的大型数据集KDD数据库存储库。UCI机器学习数据库。AWS(亚马逊网络服务)公共数据集,提供了一个集中的资料库,可以无缝集成到基于AWS的云应用程序的公共数据集。生物测定数据,在虚拟筛选,生物测定数据,对化学信息学,J.由阿...
分类:
数据库 时间:
2015-01-01 22:22:14
阅读次数:
234
1.搜狗实验室数据集:http://www.sogou.com/labs/dl/p.html互联网图片库来自sogou图片搜索所索引的部分数据。其中收集了包括人物、动物、建筑、机械、风景、运动等类别,总数高达2,836,535张图片。对于每张图片,数据集中给出了图片的原图、缩略图、所在网页以及所在网...
分类:
其他好文 时间:
2015-01-01 21:15:44
阅读次数:
2352
10.2.3 处理数组
数组相似于简单的计算机内存模型,本质上,就是一组有编号的盒子,只要知道的编号,就可以轻松地读取或更改在任何盒子中的值。数组形成连续的内存块,所以,开销非常小,能用于存储大型数据集;数组[的代间]是提前分配的:一旦创建,其大小就固定了,因此,不能把新的值添加已有的数组中。
数组是可变的数据结构,因此,很容易修改。这在有些情况下是有用的,但对于函数式程序员来说,在有关...
分类:
编程语言 时间:
2015-01-01 17:22:50
阅读次数:
154
Hadoop二次排序的其他写法
二次排序原理
在map阶段,使用job.setInputFormatClass定义的InputFormat将输入的数据集分割成小数据块splites,同时InputFormat提供一个RecordReder的实现。
本例子中使用的是TextInputFormat,他提供的RecordReader会将文本的字节偏移量作为key,这一行的文本作为value。
这...
分类:
编程语言 时间:
2014-12-31 18:34:28
阅读次数:
316
聚类模型属于飞溅读式挖掘模型,以用户属性、行为、消费等特征数据为输入,将用户自动聚类为若干类,通常用来挖掘潜在目标客户群体,也可以用在大数据营销工具、CRM工具和防欺诈解决方案上。
分类预测模型分析学习历史数据经验,预测分析未来数据发展方向。模型输出是离散数据或类别的称为分类模型,模型输出是数值类型数据的模型称为数值预测模型。分类模型根据训练数据集的类别号属性,学习现有分类数据的分类规...
分类:
其他好文 时间:
2014-12-31 16:22:19
阅读次数:
161
前言 支持向量机,也即SVM,号称分类算法,甚至机器学习界老大哥。其理论优美,发展相对完善,是非常受到推崇的算法。 本文将讲解的SVM基于一种最流行的实现 - 序列最小优化,也即SMO。 另外还将讲解将SVM扩展到非线性可分的数据集上的大致方法。预备术语 1. 分割超平面:就是决策边界 2...
分类:
其他好文 时间:
2014-12-31 16:11:28
阅读次数:
459
k-近邻算法(kNN):测量不同特征值之间的距离方法进行分类。 kNN的工作原理:存在一个样本数据集合(训练样本集),并且样本集中每个数据都存在标签,输入没有标签的新数据后,将新数据的每个特征与样本集数据对应的特征进行比较,然后算法提取样本集中特征最相似数据的分类标签。一般来说,只选择样本数据...
分类:
其他好文 时间:
2014-12-30 16:48:27
阅读次数:
209
IBM Cognos Data Manager 数据集市的构建利器 本文详细的介绍了 Cognos 最新版本 10.2 的数据集市构建器 Data Manager 的使用,对于希望系统了解 Cognos Data Manager,以及 IBM 数据集市构建方法,并且掌握 Cognos 最新版本安全性...
分类:
其他好文 时间:
2014-12-30 14:47:56
阅读次数:
256