共同点:1.hbase与hive都是架构在hadoop之上的。都是用hadoop作为底层存储区别:2.Hive是建立在Hadoop之上为了减少MapReduce jobs编写工作的批处理系统,HBase是为了支持弥补Hadoop对实时操作的缺陷的项目 。3.想象你在操作RMDB数据库,如果是全表扫描...
分类:
其他好文 时间:
2014-07-16 21:30:18
阅读次数:
167
引言 最近LZ带头在做一个互联网项目,互联网的东西总是那么新鲜,这也难怪大部分猿友都喜欢互联网。这个互联网项目不仅让LZ开发了一个HBase大数据应用,近期的一次需求讨论会上,又出来一个小需求,蛮有意思的。这些需求在之前枯燥的企业内部应用开发中,还是很难见到的,毕竟内部应用更多的是业务流程的体现。....
分类:
其他好文 时间:
2014-07-13 19:13:57
阅读次数:
266
一、被索引的域 Schema.xml
在使用solr对Nutch抓取到的网页进行索引时,schema.xml被改变成以下内容。
文件中指定了哪些域被索引、存储等内容。
<fieldType name="string" class="solr.StrField" sortMissingLast="true"
omitNor...
分类:
其他好文 时间:
2014-07-13 18:56:21
阅读次数:
411
Hbase适用于存储不太复杂但数据很大的数据。列如商城系统中:用户,商品,订单,店铺,卖家,这些数据关系复杂不适合用Hbase。这里面订单数据量很大,而且要频繁拿出来计算,可以考虑只将订单这项存入Hbase。其他方面:
1,数据量达到上亿以上时可以使用Hbase如果只有上千或上百万行,则用传统的RDBMS。
2,不依赖所有RDBMS的额外特性(列数据类型, 第二索引, 事物,高级查询语言等.)...
分类:
其他好文 时间:
2014-07-12 19:45:51
阅读次数:
202
主要看Roger的文档,这里作为文档的补充HFile的格式-HFile的基本结构Trailer通过指针找到Meta index、Data index、File info。Meta index保存每一个元数据在HFile中的位置、大小、元数据的key值。Data index保存每一个数据块在HFile...
分类:
其他好文 时间:
2014-07-12 08:26:39
阅读次数:
606
1、安装JDK并设置环境变量 2、上传Hbase安装包hbase-0.94.0.tar.gz3、解压# tar -xzvf hbase-0.94.0.tar.gz4、设置环境变量# vi ~/.bash_profile或vi /etc/profileexport HBASE_HOME=/home/h...
分类:
其他好文 时间:
2014-07-12 00:24:15
阅读次数:
235
Hive学习路线图Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, C...
分类:
其他好文 时间:
2014-07-11 08:48:52
阅读次数:
291
【甘道夫】HBase(0.96以上版本)过滤器Filter详解及实例代码...
分类:
其他好文 时间:
2014-07-10 21:05:26
阅读次数:
312
现在 Hadoop 已经发展成为包含多个子项目的集合。虽然其核心内容是 MapReduce 和Hadoop 分布式文件系统(HDFS),但 Hadoop 下的Common 、Avro、 Chukwa、Hive 、HBase等子项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。以...
分类:
其他好文 时间:
2014-07-10 14:57:00
阅读次数:
333
通过HBaseAdmin维护表(创建,删除表)importorg.apache.hadoop.conf.Configuration;
importorg.apache.hadoop.hbase.HBaseConfiguration;
importorg.apache.hadoop.hbase.HColumnDescriptor;
importorg.apache.hadoop.hbase.HTableDescriptor;
importorg.apache.hadoop.hbase...
分类:
编程语言 时间:
2014-07-09 08:28:58
阅读次数:
170