1.require 'upyun' 引用upyun2.upyun = Upyun::Rest.new(bucket,operator,password,options,endpint)3.res = upyun.put('/1/2/3/4/5/hi.jpg', File.new('/workspac...
1.hash_set集合容器
hash_set利用链式哈希表,进行数据的插入、删除和搜索。与set容器相同,不允许插入重复键值的元素。SGIC++哈希表是一个链式的结构,由表头和一系列单链组成。表头是一个数组式的线性表,用vector向量泛化出来。每个表头节点,称为桶(bucket),是一个指针域,指向链入的元素数据。表头的长度为向量容器的元素个数。
哈希表中数据的遍历,迭代器从0号桶、1号桶...
分类:
其他好文 时间:
2015-08-19 11:13:45
阅读次数:
319
16. 蛤蟆的数据结构进阶十六排序实现之基数排序
本篇名言:“社会犹如一条船 ,
每人都要有掌舵的准备。--易卜生”
我们来看下基数排序。
欢迎转载,转载请标明出处:
1. 基数排序
基数排序(radix sort)属于“分配式排序”(distributionsort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元...
分类:
编程语言 时间:
2015-08-18 22:49:54
阅读次数:
165
桶(bucket)是指将表或分区中指定列的值为key进行hash,hash到指定的桶中,这样可以支持高效采样工作。抽样(sampling)可以在全体数据上进行采样,这样效率自然就低,它还是要去访问所有数据。而如果一个表已经对某一列制作了bucket,就可以采样所有桶中指定序号的某个桶,这就减少了访问...
分类:
其他好文 时间:
2015-08-17 23:16:32
阅读次数:
502
大数据扫盲 目录 大数据扫盲1 0.1.大数据处理流程1 0.2.大数据处理技术架构2 1.数据分区与路由2 1.1.二级映射机制3 1.1.1.哈希分区3 1.1.2.虚拟桶(virtual bucket)3 1.1.3.一致性哈希(consiste...
分类:
其他好文 时间:
2015-07-29 00:49:34
阅读次数:
248
大数据扫盲 目录 大数据扫盲1 0.1.大数据处理流程1 0.2.大数据处理技术架构2 1.数据分区与路由2 1.1.二级映射机制3 1.1.1.哈希分区3 1.1.2.虚拟桶(virtual bucket)3 1.1.3.一致性哈希(consiste...
分类:
其他好文 时间:
2015-07-29 00:34:37
阅读次数:
230
大数据扫盲 目录 大数据扫盲1 0.1.大数据处理流程1 0.2.大数据处理技术架构2 1.数据分区与路由2 1.1.二级映射机制3 1.1.1.哈希分区3 1.1.2.虚拟桶(virtual bucket)3 1.1.3.一致性哈希(consiste...
分类:
其他好文 时间:
2015-07-29 00:33:59
阅读次数:
216
1. 桶排序介绍 桶排序(Bucket sort)是一种基于计数的排序算法,工作的原理是将数据分到有限数量的桶子里,然后每个桶再分别排序(有可能再使用别的排序算法或是以递回方式继续使用桶排序进行排序)。当要被排序的数据内的数值是均匀分配的时候,桶排序时间复杂度为Θ(n)。桶排序不同于快速排序,并不是...
分类:
编程语言 时间:
2015-07-23 23:24:36
阅读次数:
213
使用场景一:储存网站的图片,并能被任何人访问1. 创建一个bucket,名字与需要绑定的域名一致。例如,根域名是mysite.com,希望把所有图片放在pic.mysite.com下面,访问的时候用pic.mysite.com/a.jpg就能直接访问,那么这个bucket的名字就应该设置成pic.m...
分类:
其他好文 时间:
2015-07-15 19:03:07
阅读次数:
94
Hive 已是目前业界最为通用、廉价的构建大数据时代数据仓库的解决方案了,虽然也有 Impala 等后起之秀,但目前从功能、稳定性等方面来说,Hive 的地位尚不可撼动。其实这篇博文主要是想聊聊 SMB join 的,Join 是整个 MR/Hive 最为核心的部分之一,是每个 Hadoop/Hiv...
分类:
其他好文 时间:
2015-07-15 15:02:19
阅读次数:
192