码迷,mamicode.com
首页 >  
搜索关键字:hadoop webseven 安装部署    ( 16178个结果
Hadoop专业解决方案-第3章:MapReduce处理数据
Hadoop的核心处理模块是MapReduce,也是当前最流行的大数据处理架构之一。它能够将Hadoop数据存储无缝的融入到数据处理当中,使得它在操作上足够简单,功能上足够强大。MapReduce已经解决很多实际问题(从日志分析,到数据排序,到文本操作,到基于模式的搜索,到图像处理,到机器学习等等)...
分类:其他好文   时间:2014-05-27 00:14:28    阅读次数:449
hbase使用SQL查询
因为需要统计hbase中某个特定列不为空的行数,我寻思有没有支持直接用SQL查询的,查找了下,发现有两个可以支持:一个是apache phoenix,一个是Cloudera的Impala。如果用Impala,需要使用Cloudera的hadoop发行版。
分类:数据库   时间:2014-05-26 22:02:35    阅读次数:322
MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath
在Mahout中出现错误:MAHOUT_LOCAL is not set;adding HADOOP_CONF_DIR to classpath MAHOUT_LOCAL与HADOOP_CONF_DIR 以上的两个参数是控制Mahout是在本地运行还是在Hadoop上运行的关键。 $MAHOUT_HOME/bin/mahout文件指出,只要设置MAHOUT_LOCAL的值为一个非空(...
分类:其他好文   时间:2014-05-23 00:40:35    阅读次数:365
关系型数据库与HBase的数据储存方式区别
如今Bigtable型(列族)数据库应用越来越广,功能也很强大。但是很多人还是把它当做关系型数据库在使用,用原来关系型数据库的思维建表、存储、查询。本文以hbase举例讲述数据模式的变化。 传统关系型数据库(mysql,oracle)数据存储方式主要如下: 图一 上图是个很典型的数据储存方式,我把每条记录分成3部分:主键、记录属性、索引字段。我们会对索引字段建立索引,达到二级索引...
分类:数据库   时间:2014-05-23 00:19:11    阅读次数:301
windows下eclipse调试hadoop详解
1)下载Eclipse http://www.eclipse.org/downloads/ Eclipse Standard 4.3.2 64位   2) 下载hadoop版本对应的eclipse插件 我的hadoop是1.0.4,因此下载hadoop-eclipse-plugin-1.0.4.jar 下载地址:http://download.csdn.net/detail/m_sta...
分类:Windows程序   时间:2014-05-22 23:48:33    阅读次数:607
Hadoop-2.2.0中文文档——Common-Hadoop HTTP web控制台认证
简介 此文档描述了如何配置Hadoop HTTP web控制台,去要求用户认证。 默认地,Hadoop HTTP web控制台(JobTracker, NameNode, TaskTrackers 和 DataNodes)不需要任何认证就允许访问。 与Hadoop RPC相似, Hadoop HTTP web控制台可以被配置为需要使用HTTP SPNEGO协议认证(由FireFo...
分类:Web程序   时间:2014-05-22 23:40:12    阅读次数:347
Cloudera CDH 5集群搭建(yum 方式)
Hadoop CDH YUM Spark...
分类:其他好文   时间:2014-05-22 22:56:05    阅读次数:521
hadoop学习;hadoop伪分布搭建
先前已经做了准备工作安装jdk什么的 接下来开始...
分类:其他好文   时间:2014-05-22 18:28:38    阅读次数:296
MapReduce 气象数据集
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1 & Centos 6.5 x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:其他好文   时间:2014-05-22 15:39:14    阅读次数:361
2.2 Hadoop Studio 使用 [Hadoop学习笔记]
Hadoop Studio 是一个 map-reduce 结构的集成开发环境,基于NetBeans。你可以利用它来方便快速的创建基于Hadoop的 map-reduce 应用。该工具提供了一个实时的map-reduce任务的工作流视图,可以显示任务之间独立的输入输出和交互,而且该视图在代码修改时会实...
分类:其他好文   时间:2014-05-22 15:06:10    阅读次数:302
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!