之前介绍过关于HBase 0.9.8版本的部署及使用,本篇介绍下最新版本HBase1.2.4的部署及使用,有部分区别,详见如下: 1. 环境准备: 1.需要在Hadoop[hadoop-2.7.3] 启动正常情况下安装,hadoop安装可参考LZ的文章 大数据系列之Hadoop分布式集群部署 2. ...
分类:
数据库 时间:
2017-03-19 11:42:27
阅读次数:
313
对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。 Hive是什么? Apache Hive是一个构建于Hadoop(分布式系统基础架构)顶层的数据仓库,注意这里不是数据库。Hive可以看作是用户 ...
分类:
其他好文 时间:
2017-03-17 14:36:35
阅读次数:
179
一、HDFSSinkFlumeSink是将事件写入到Hadoop分布式文件系统(HDFS)中。主要是Flume在Hadoop环境中的应用,即Flume采集数据输出到HDFS,适用大数据日志场景。目前,它支持HDFS的文本和序列文件格式,以及支持两个文件类型的压缩。支持将所用的时间、数据大孝事件的数量为操作参..
分类:
Web程序 时间:
2017-03-15 19:23:05
阅读次数:
304
本节目的:搭建Hadoop分布式集群环境 检测主机名是否修改成功命令如下,在操作之前需要关闭当前终端,重新打开一个终端:即可看到终端命令前是[user@hostname] 添加内容(LZ master Ip是10.211.55.3,Salve Ip 是10.211.55.4) 如图表示修改成功 复制 ...
分类:
其他好文 时间:
2017-03-10 23:37:37
阅读次数:
270
安装完全分布式Hadoop1安装准备工作本安装示例将使用三台主机(RHEL5.832bit)来实现,其规划如下所示: IP地址 主机名 运行的进程或扮演的角色172.16.100.11 master.magedu.com NameNode,JobTracker172.16.100.12 datanode.magedu.com DataNode,TaskTracker172.16.100.13..
分类:
其他好文 时间:
2017-02-20 23:17:01
阅读次数:
231
转自:http://blog.csdn.net/lifuxiangcaohui/article/details/40588929 转自:http://blog.csdn.net/lifuxiangcaohui/article/details/40588929 Hive是基于Hadoop分布式文件系统 ...
分类:
移动开发 时间:
2017-02-01 00:45:30
阅读次数:
559
HDFS是Hadoop Distribute File System 的简称,也就是Hadoop的一个分布式文件系统。 一、HDFS的优缺点 1.HDFS优点: a.高容错性 .数据保存多个副本 .数据丢的失后自动恢复 b.适合批处理 .移动计算而非移动数据 .数据位置暴露给计算框架 c.适合大数据 ...
分类:
其他好文 时间:
2017-01-17 21:17:02
阅读次数:
316
hadoop是一种用于海量数据存储、管理、分析的分布式系统。需要hadoop需要储备一定的基础知识:1、掌握一定的linux操作命令 2、会java编程。因此hadoop必须安装在有jdk的linux环境中。 linux环境可以用以下方式获取:1、安装linux操作系统 2、安装linux虚拟机 3 ...
分类:
其他好文 时间:
2016-12-11 20:38:32
阅读次数:
369
所有的数据库数据一般是保存在Hadoop分布式系统上面的,用户通过一系列HRegion服务器获取这些数据。一台机器上一般只运行一个HRegion服务器,而且每一分区段的HRegion也只会被一个HRegion服务器维护。 HRegion服务器包含两大部分:HLog部分和HRegion部分。 HBas ...
分类:
其他好文 时间:
2016-12-06 13:57:04
阅读次数:
418