Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了,虽然也有 Impala 等后起之秀,但目前从功能、稳定性等方面来说,Hive 的地位尚不可撼动。其实这篇博文主要是想聊聊 SMB join 的,Join 是整个 MR/Hive 最为核心的部分之一,是每个 Hadoop/Hiv...
分类:
其他好文 时间:
2014-08-14 16:22:48
阅读次数:
244
stream_bucket_append函数:为队列添加数据 stream_bucket_make_writeable函数:从操作的队列中返回一个数据对象stream_bucket_new函数:为当前队列创建一个新的数据stream_bucket_prepend函数:预备数据到队列 stream_c...
分类:
Web程序 时间:
2014-08-12 13:11:44
阅读次数:
220
http://blog.csdn.net/houapple/article/details/6480100桶排序 (Bucket sort)或所谓的箱排序,是一个排序算法,工作的原理是将阵列分到有限数量的桶子里。每个桶子再个别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。桶排...
分类:
其他好文 时间:
2014-08-04 14:01:07
阅读次数:
292
sand crusher also called sand washing machine is a kind of wheeled and bucket washing equipment, for cleaning and separating the dust and powder from ...
分类:
其他好文 时间:
2014-08-04 10:58:17
阅读次数:
206
如何覆盖hashCode():
明白了如何散列之后,编写自己的hashCode()就更有意义了。
首先,你无法控制bucket数组的下标值的产生。这个值依赖于具体的HashMap对象的容量,而容量的改变与容器的充满程度和负载因子有关。hashCode()生成的结果,经过处理后称为桶位的下标。
设计hashCode()时最重要的因素就是:无论何时,对同一个对象调用hashCode()都应该...
分类:
其他好文 时间:
2014-07-31 00:00:35
阅读次数:
219
文章转自:http://www.jydba.net/cache-buffer-chain/buffer cache的管理有两个重要的数据结构:hash bucket和cache buffer chain1. hash bucket和cache buffer chain可以想象,如果所有的buffer...
分类:
其他好文 时间:
2014-07-27 23:11:09
阅读次数:
342
分析完leveldb以后,接下来的时间准备队tair的源码进行阅读和分析。我们刚刚分析完了leveldb而在tair中leveldb是其几大存储引擎之一,所以我们这里首先从tair对leveldb的使用和修改来窥探在这个分布式的存储引擎中是如何将area和bucket持久化到存储,并且方便bucke...
分类:
数据库 时间:
2014-07-27 22:41:49
阅读次数:
574
监控 ehcache缓存:1,下载:http://terracotta.org/downloads/open-source/destination?name=ehcache-monitor-kit-1.0.3-distribution.tar.gz&bucket=tcdistributions&fi...
分类:
其他好文 时间:
2014-07-21 00:27:02
阅读次数:
378
以下注释的源代码都在memcached项目的assoc.c文件中 1 /* how many powers of 2's worth of buckets we use */ 2 unsigned int hashpower = HASHPOWER_DEFAULT; /* 哈希表bucket的级.....
分类:
其他好文 时间:
2014-07-18 15:20:11
阅读次数:
344