kettle 进阶教程 非常实用的etl学习教程...
分类:
其他好文 时间:
2014-09-04 08:27:37
阅读次数:
249
HBaseHbase是一个分布式的、面向列的开源数据库,该技术来源于Changetal所写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(FileSystem)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bittable的能力。HBase是Apa..
分类:
其他好文 时间:
2014-09-04 02:58:08
阅读次数:
325
hbase-env.sh中添加了一句:export JAVA_HOME=/usr/java/jdk1.7.0_651、仅设置了JDK地址之后,HBase的启动日志:(注意标红的信息,系统信息,JDK信息,hbase信息(默认存储位置显示),zookeeper信息等) 1 2014年 09月 03日....
分类:
其他好文 时间:
2014-09-03 12:59:16
阅读次数:
405
Hbase 是一个分布式的、面向列的开源数据库,其实现是建立在google 的bigTable 理论之上,并基于hadoop HDFS文件系统。 Hbase不同于一般的关系型数据库(RDBMS)。是一种适用于非结构化数据存储的数据库,且Hbase是基于列的数据库。 下面的内容基于我们已经安装好h.....
分类:
其他好文 时间:
2014-09-02 19:37:55
阅读次数:
217
HBase扩展和负载均衡的基本单位是Region。Region从本质上说是行的集合。当Region的大小达到一定的阈值,该Region会自动分裂(split),当然也可能是合并(merge),合并可以减少Region和相应存储文件的数量(请注意目前HBase[0.94版]不支持在线的Region合并...
分类:
其他好文 时间:
2014-09-02 17:19:54
阅读次数:
227
简介环境:window7 x64Eclipse Java EE IDE for Web Developers.(Version: Kepler Service Release 1)(Build id: 20130919-0819)HBase (hbase-0.98.3-hadoop2-bin.tar...
分类:
编程语言 时间:
2014-09-02 17:16:45
阅读次数:
496
HBase是Google Bigtable的开源实现,它利用Hadoop HDFS作为其文件存储系统,利用Hadoop MapReduce来处理HBase中的海量数据,利用Zookeeper作为协同服务。1. 简介HBase是一个分布式的、面向列的开源数据库,源于google的一篇论文《bigtab...
分类:
其他好文 时间:
2014-09-02 01:34:43
阅读次数:
342
webpage字段解释webpage各阶段的字段值变化ROW com.2345.www:http/COL f : fi //fetchIntervalCOL f : ts //fetchTimeid主键,根据网页url生成(格式:reversed domain name...
分类:
其他好文 时间:
2014-09-01 19:07:13
阅读次数:
213