码迷,mamicode.com
首页 >  
搜索关键字:mahout hadoop canopy 聚类 大数据    ( 26726个结果
基于ARMA模型的ECG聚类算法研究
摘要: 对心电信号( ECG) 这种高维的时间序列进行聚类,最重要的方面之一即进行特征提取!本研究提出利用自回归和移动平均( ARMA)模型拟合?ZK 信号,以拟合系数的欧氏距离为结构不相似测度征进行聚类!但此方法没有考虑样本数据的各维特征对聚类的不同贡献率,所以本文提出可以把首次聚类每维特征在聚类...
分类:其他好文   时间:2014-05-23 05:45:57    阅读次数:196
hadoop 中对Vlong 和 Vint的压缩方法
hadoop 中对java的基本类型进行了writeable的封装,并且所有这些writeable都是继承自WritableComparable的,都是可比较的;并且,它们都有对应的get() 和 set()方法,其中对整型(int 和 long)进行编码的时候,有固定长度格式(intWritabl...
分类:其他好文   时间:2014-05-23 03:10:15    阅读次数:207
2.1 Hadoop Eclipse Plugin 配置及安装
Hadoop Eclipse 开发工具 主要分为1、根据Hadoop版本生成插件2、安装Hadoop Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考:http://bl...
分类:系统相关   时间:2014-05-23 02:44:30    阅读次数:354
Hadoop学习笔记目录
Hadoop 运行环境准备运行环境部署结构介绍Linux CentOS6.5安装(Hadoop环境配置)Linux 常用远程管理工具介绍SSH免密码登录配置Hadoop安装及配置Hadoop验证-WordCount执行Hadoop开发工具准备Hadoop Eclipse Plugin配置安装及验证H...
分类:其他好文   时间:2014-05-23 02:41:15    阅读次数:211
大数据时代的用户信息安全三原则
几年前,雷·库兹韦尔写过一本书叫做《奇点临近》。他说,人类文明经过这么多年发展,在本世纪的中叶会经过一个点,这个点,就是奇点。奇点是一个拐点,也就是说人类文明可能会进入一个分岔,可能会进入一个新的文明高度,也可能会急转直下,人类就此灭亡。所以奇点有双重的含义,有可能变得更好,也有可能变得更糟糕。 进入微软、亚马逊,谷歌等美国IT企业工作人才项目,起薪40万,百度搜索(MUMCS) ...
分类:其他好文   时间:2014-05-23 01:01:56    阅读次数:256
网络天然是大数据的,大数据天然是网络的
The network is naturally bigdataing, while bigdata is inherently networking. --yeasy@blog 用英文表达似乎更加准确一些。 计算机科学发展了半个世纪,而网络的出现极大推动了计算机相关技术的爆发式进步。 计算机或网络领域所研究的典型问题,往往都是追求高性能、精确、准确,而大数据技术则往往提供一...
分类:其他好文   时间:2014-05-23 00:25:05    阅读次数:285
Hadoop-2.2.0中文文档——Common-Hadoop HTTP web控制台认证
简介 此文档描述了如何配置Hadoop HTTP web控制台,去要求用户认证。 默认地,Hadoop HTTP web控制台(JobTracker, NameNode, TaskTrackers 和 DataNodes)不需要任何认证就允许访问。 与Hadoop RPC相似, Hadoop HTTP web控制台可以被配置为需要使用HTTP SPNEGO协议认证(由FireFo...
分类:Web程序   时间:2014-05-22 23:40:12    阅读次数:347
大数据读书汇
第六届中国云计算大会(大数据读书汇)...
分类:其他好文   时间:2014-05-22 23:24:23    阅读次数:343
MapReduce 气象数据集
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1 & Centos 6.5 x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:其他好文   时间:2014-05-22 15:39:14    阅读次数:361
2.2 Hadoop Studio 使用 [Hadoop学习笔记]
Hadoop Studio 是一个 map-reduce 结构的集成开发环境,基于NetBeans。你可以利用它来方便快速的创建基于Hadoop的 map-reduce 应用。该工具提供了一个实时的map-reduce任务的工作流视图,可以显示任务之间独立的输入输出和交互,而且该视图在代码修改时会实...
分类:其他好文   时间:2014-05-22 15:06:10    阅读次数:302
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!