本文来自于NoSQLFan联合作者@koven2049,他在淘宝从事Hadoop及HBase相关的应用和优化。对Hadoop、HBase都有深入的了解,本文就是其在工作中对HBase的应用优化小结,分享给大家。
目 录 [ - ]
前言原因应用情况部署、运维和监控测试与发布改进和优化将来计划
前言
hbase是从 hadoop中分离出来的apache顶级开源项目。由...
分类:
其他好文 时间:
2014-06-05 08:43:04
阅读次数:
275
说明:类似于RDBMS中触发器,允许用户在region服务器上运行自己的代码,在客户端用户不用关心操作具体在哪进行使用场景:权限控制,回调函数(钩子函数)、扫描统计等主要类:observer和endpointobserver:类似触发器,回调函数在特定事件发生时执行endpoint:类似数据库存储过...
分类:
其他好文 时间:
2014-06-03 13:22:54
阅读次数:
229
触发region
flush的因素有很多,如手动触发,memstore压力触发,memstore到达限制触发,flush时间触发等。regionserver的flush由flush实际操作步骤为
1.获得region写锁,将region的所有store执行prepare,产生snapshort,释....
分类:
其他好文 时间:
2014-05-31 21:57:30
阅读次数:
317
Hbase的安装须要考虑Hadoop的版本号,即兼容性。有不足的希望能指出。下面考究官网得到的,关于hadoop版本号和hbase版本号可到下面网址中下载:http://mirror.bit.edu.cn/apache/hbaseHBase-0.92.xHBase-0.94.xHBase-0.96....
分类:
其他好文 时间:
2014-05-31 15:24:19
阅读次数:
377
一个集中的日志系统,第三方应用每次写日志,都需要发送一个远程的rpc或者http请求,造成写日志的延时比较大。改进的做法是:提供一个写日志调用包,第三方应用写日志时,先把日志缓存到一个线程安全的容器里,然后后台线程实时消费容器内的日志,如果有持久化的需求,就可以实时的把日志flush到文件中,然后再...
分类:
其他好文 时间:
2014-05-31 13:13:20
阅读次数:
290
本篇是本人在做一个大数据项目时,对于系统架构的一点总结,如何在保证存储量的情况下,又能保证数据的检索速度。
分类:
其他好文 时间:
2014-05-30 20:34:01
阅读次数:
405
【转】:http://www.cnblogs.com/lazycoding/archive/2011/04/04/two_include.html<%@
include file=”relativeURI”%><jsp:include page=”relativeURI” flush=”true” ...
分类:
Web程序 时间:
2014-05-29 01:50:53
阅读次数:
242
概括1.
创建、删除及启用禁用表、添加列等都需用到HBaseAdmin,另外需要注意删除,添加列等操作都需要禁用表2.
表中添加数据,查询等都是和HTable相关,如果是多线程的情况下注意用HTablePool3. 插入数据使用Put,可以单行添加也可批量添加4.
查询数据需使用Get,Result...
分类:
编程语言 时间:
2014-05-28 02:19:21
阅读次数:
327
相关知识创建表插入数据删除等见:http://www.cnblogs.com/wishyouhappy/p/3735077.htmlHBase
API简介见:http://www.cnblogs.com/wishyouhappy/p/3753347.html按行、列簇等查询package
wish....
这是这个系列的最后一篇了,实在没精力写了,本来还想写一下hbck的,这个东西很常用,当hbase的Meta表出现错误的时候,它能够帮助我们进行修复,无奈看到3000多行的代码时,退却了,原谅我这点自私的想法吧。在讲《Get、Scan在服务端是如何处理?》当中的nextInternal流程,它的第一步...
分类:
其他好文 时间:
2014-05-26 19:44:29
阅读次数:
254