组件如下:对计算类型的说明如下:The table below contains
descriptions associated with the calculator step:FunctionDescriptionRequired
fieldsSet field to constant ACre...
分类:
其他好文 时间:
2014-05-28 04:19:05
阅读次数:
1256
概括1.
创建、删除及启用禁用表、添加列等都需用到HBaseAdmin,另外需要注意删除,添加列等操作都需要禁用表2.
表中添加数据,查询等都是和HTable相关,如果是多线程的情况下注意用HTablePool3. 插入数据使用Put,可以单行添加也可批量添加4.
查询数据需使用Get,Result...
分类:
编程语言 时间:
2014-05-28 02:19:21
阅读次数:
327
组件:值映射如下如所示:首先,给出官方给出的文档:个人理解:Target field
name:可以理解为将source column的字段复制为另一个target column的名字。Default upon
non-matching:就是将target column的所有值(除去null),都替...
分类:
其他好文 时间:
2014-05-27 16:28:38
阅读次数:
767
这一章讲hbase的缓存机制,这里面涉及的内容也是比较多,呵呵,我理解中的缓存是保存在内存中的特定的便于检索的数据结构就是缓存。之前在讲put的时候,put是被添加到Store里面,这个Store是个接口,实现是在HStore里面,MemStore其实是它底下的小子。那它和Region
Server...
分类:
其他好文 时间:
2014-05-27 00:16:07
阅读次数:
376
因为需要统计hbase中某个特定列不为空的行数,我寻思有没有支持直接用SQL查询的,查找了下,发现有两个可以支持:一个是apache
phoenix,一个是Cloudera的Impala。如果用Impala,需要使用Cloudera的hadoop发行版。
分类:
数据库 时间:
2014-05-26 22:02:35
阅读次数:
322
这是这个系列的最后一篇了,实在没精力写了,本来还想写一下hbck的,这个东西很常用,当hbase的Meta表出现错误的时候,它能够帮助我们进行修复,无奈看到3000多行的代码时,退却了,原谅我这点自私的想法吧。在讲《Get、Scan在服务端是如何处理?》当中的nextInternal流程,它的第一步...
分类:
其他好文 时间:
2014-05-26 19:44:29
阅读次数:
254
一、使用Sqoop将MySQL中的数据导入到HDFS/Hive/HBase
二、使用Sqoop将HDFS/Hive/HBase中的数据导出到MySQL
2.3 HBase中的数据导出到mysql
目前没有直接的命令将HBase中的数据导出到MySQL,但可以先将HBase中的数据导出到HDFS中,再将数据导出到MySQL。
三、使用Sqoop将Orac...
分类:
数据库 时间:
2014-05-26 05:48:46
阅读次数:
304
先上一张图讲一下Compaction和Split的关系,这样会比较直观一些。Compaction把多个MemStore
flush出来的StoreFile合并成一个文件,而Split则是把过大的文件Split成两个。之前在Delete的时候,我们知道它其实并没有真正删除数据的,那总不能一直不删吧,下...
分类:
其他好文 时间:
2014-05-25 18:41:37
阅读次数:
415
如今Bigtable型(列族)数据库应用越来越广,功能也很强大。但是很多人还是把它当做关系型数据库在使用,用原来关系型数据库的思维建表、存储、查询。本文以hbase举例讲述数据模式的变化。
传统关系型数据库(mysql,oracle)数据存储方式主要如下:
图一
上图是个很典型的数据储存方式,我把每条记录分成3部分:主键、记录属性、索引字段。我们会对索引字段建立索引,达到二级索引...
分类:
数据库 时间:
2014-05-23 00:19:11
阅读次数:
301
继上一篇讲了Put和Delete之后,这一篇我们讲Get和Scan,
因为我发现这两个操作几乎是一样的过程,就像之前的Put和Delete一样,上一篇我本来只打算写Put的,结果发现Delete也可以走这个过程,所以就一起写了。Get我们打开HRegionServer找到get方法。Get的方法处理...
分类:
其他好文 时间:
2014-05-21 17:58:53
阅读次数:
344