最近的项目需要使用Hbase做实时查询,由于Hbase只支持一级索引,也就是使用rowkey作为索引查询,所以对于多条件筛选查询的支持不够,在不建立二级索引的情况下,只能使用Hbase API中提供的各种filter过滤器进行筛选,感觉查询效率不太理想,于是考虑建立二级索引的方案。
经过google学习网上前辈们的经验,暂时找到两种可用的方案:
对两种方案进行了比较发现,第一种方案中存在的问题是无法直接获取数据记录总数(要获取记录总数,需要在写入数据时单独维护一个计数器,并一直更新记录总数),对于分页显示的需求不容易满足;而solr服务器的查询方式类似于SQL语句,支持各种查询条件过滤、限定查询范围、页数以及直接获取记录总数,所以我比较倾向于第二种方案。
关于两种方案的效率问题,目前还在测试中,后面会陆续写出第二套方案的详细部署以及代码。
第一次开博客,先写这么多吧,下班!
原文地址:http://www.cnblogs.com/bxljoy/p/3849359.html