码迷,mamicode.com
首页 > 其他好文 > 详细

hbase性能优化

时间:2015-05-04 19:42:33      阅读:214      评论:0      收藏:0      [点我收藏+]

标签:

查询缓存

Scancaching属性默认值是1,意味着扫描器每次从region服务器抓取1条记录进行匹配。我们可以设置caching为比1大得多的值。例如,设置为500,则一次可以抓取500条,需要注意的是该值设得越大服务器的内存开销会越多。
HTableInterface hTable=getHTable(tableName);
Scan scan=new Scan();
/*设置缓存*/
scan.setCaching(StaticConfig.getIControl_hbase_cache());
ResultScanner scanner= hTable.getScanner(scan);

多线程配置

Hbase.regionser.handler.count
RegionServer中RPC监听器实例的数量。对于master来说,这个属性是master受理的处理线程(handler)数量。默认值是10。
根据调控层的业务场景,1条运价的匹配查询就会产生4条hbase并发查询。如果有20条,就可能有80条并发,这个并发量是相当的。除了将该参数适当调大可以增加并发处理能力外,还跟集群的数量和服务器的配置有直接的关系,预计集群数量越多,服务器CPU核数越高,并发处理能力越强。

预分区

HRegion是Hbase中分布式存储和负载均衡的最小单元。最小单元就表示不同的Hregion可以分布在不同的HRegion server上。但一个Hregion是不会拆分到多个server上的。
Hbase.hregion.max.filesize
HstoreFile的最大值。Region中任何一个列族的存储文件如果超过了这个上限,就会被拆分成两个region。默认:268435456256x1024x1024),即256M
我们的调控文件比较小,要达到分区最大上限256M需要较多的调控文件。为了提高并发量,我们需要在没有达到分区上限的情况下,产生多个hregion来保存和处理数据,这里就用hbase的预分区功能。
示例:
Configuration conf = HBaseConfiguration.create()
HBaseAdmin admin = new HBaseAdmin(conf);
HTableDescriptor desc = new HTableDescriptor(
            Bytes.toBytes(tablename));
HColumnDescriptor coldef = new HColumnDescriptor(
            Bytes.toBytes(colfamily));
admin.createTable(desc, Bytes.toBytes(1L),Bytes.toBytes(10L), 10);
//以第一位字符不同划分区
desc.setValue(HTableDescriptor.SPLIT_POLICY,
                     KeyPrefixRegionSplitPolicy.class.getName());
                     desc.setValue("prefix_split_key_policy.prefix_length","1");
更多分享请关注:http://bbs.superwu.cn  关注超人学院微信:BJ-CRXY

hbase性能优化

标签:

原文地址:http://www.cnblogs.com/CRXY/p/4476653.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!