首先,Hive 没有专门的数据存储格式,也没有为数据建立索引,用户可以非常自由的组织 Hive 中的表,只需要在创建表的时候告诉 Hive 数据中的列分隔符和行分隔符,Hive 就可以解析数据。
其次,Hive 中所有的数据都存储在 HDFS 中,Hive 中包含以下数据模型:Table,External Table,Partition,Bucket。
Hive 中的 Table 和数据库...
分类:
其他好文 时间:
2015-04-13 16:49:23
阅读次数:
103
基数排序(radix
sort)属于“分配式排序”(distribution sort),又称“桶子法”(bucket sort)或bin sort,顾名思义,它是透过键值的部份资讯,将要排序的元素分配至某些“桶”中,藉以达到排序的作用,基数排序法是属于稳定性的排序,其时间复杂度为O
(nlog(r)m),其中r为所采取的基数,而m为堆数,在某些时候,基数排序法的效率高于其它的稳定性排序法...
分类:
编程语言 时间:
2015-04-04 09:18:12
阅读次数:
207
kernel: TCP: time wait bucket table overflow的问题最近用elk收集系统日志,发现某些机器有很多内核报错
网上大多数的说法是要把net.ipv4.tcp_max_tw_buckets 这个内核参数调大。但是没说原理我想了一下,其实tw_buckets的含义是time wait bucket table 这个表满了。
为什么会满?netstat -an|m...
分类:
其他好文 时间:
2015-04-01 17:42:01
阅读次数:
138
相关概念BUCKET :每个bucket上挂有一个 chunk list。同一个BUCKET中的chunk在物理地址上是不一定相邻的FREE LISTS:按bucket划分,共有255个,bucket 0---bucket 254RESERVED FREE LISTS:在SQL语句所需CHUNK大于...
分类:
其他好文 时间:
2015-03-21 22:39:16
阅读次数:
229
今天在给nginx添加几十个域名后,重启nginx的时候,报错”[emerg]:couldnotbuildtheserver_names_hash,youshouldincreaseeitherserver_names_hash_max_size:512orserver_names_hash_bucket_size:128″在nginx.conf配置文件的http{}把server_names_hash_bucket_size128改为serve..
分类:
其他好文 时间:
2015-03-19 18:40:42
阅读次数:
124
1.DDL 操作1.建表2.3.创建简单表4.创建外部表5.建分区表6.建Bucket表7.创建表并创建索引字段ds8.复制一个空表9.显示所有表10.按正条件正则表达式显示表11.修改表结构12.表添加一列 13.添加一列并增加列字段注释14.更改表名15.删除列16.增加删除分区17.重命名表1...
分类:
数据库 时间:
2015-03-18 10:12:13
阅读次数:
253
/var/log/messages 中出现大量的TCP: time wait bucket table overflow引起该现象的原因是服务器tcp的连接数太多,超出了内和定义的最大数临时改变使用# echo 20000 > /proc/sys/net/ipv4/tcp_max_tw_bucket...
分类:
其他好文 时间:
2015-03-13 12:08:23
阅读次数:
135
转载自:http://it.taocms.org/07/1145.htm数据结构:HashTable数据结构的描述在Zend/zend_hash.h文件中。首先,HashTable中的每一个元素都保存在下面这样的一个struct中:typedef struct bucket { ulong h...
分类:
Web程序 时间:
2015-03-09 12:17:22
阅读次数:
172
算法介绍桶排序 (Bucket sort)或所谓的箱排序,是一个排序算法,工作的原理是将数组分到有限数量的桶子里。每个桶子再个别排序(有可能再使用别的排序算法或是以递归方式继续使用桶排序进行排序)。桶排序是鸽巢排序的一种归纳结果。当要被排序的数组内的数值是均匀分配的时候,桶排序使用线性时间(O(n))。但桶排序并不是 比较排序,他不受到 O(n log n) 下限的影响。算法步骤如下:...
分类:
编程语言 时间:
2015-03-01 15:47:24
阅读次数:
208
在类Unix系统中,/dev/null称为空设备,它是一个特殊的设备文件,它丢弃一切写入其中的数据,不过他会报告写入成功,读取它的话会立即得到一个EOF。在程序员行话中,尤其是Unix行话中,/dev/null被称为位桶,也就是bit bucket,也可以称之为黑洞,即black hole。这个空设备通常被用于丢弃不需要的输出流,或者作为用于输入流的空文件。这些操作通常由重定向完成。...
分类:
其他好文 时间:
2015-02-25 09:08:38
阅读次数:
156