码迷,mamicode.com
首页 >  
搜索关键字:hbase thrift    ( 4567个结果
数据导入HBase最常用的三种方式及实践分析
数据导入HBase最常用的三种方式及实践分析         摘要:要使用Hadoop,需要将现有的各种类型的数据库或数据文件中的数据导入HBase。一般而言,有三种常见方式:使用HBase的API中的Put方法,使用HBase 的bulk load工具和使用定制的MapReduce Job方式。本文均有详细描述。        【编者按】要使用Hadoop,数据合并至...
分类:其他好文   时间:2014-05-15 18:15:19    阅读次数:495
非结构化数据的存储与查询
当今信息化时代充斥着大量的数据。海量数据存储是一个必然的趋势。然而数据如何的存储和查询,尤其是当今非结构化数据的快速增长,对其数据的存储,处理,查询。使得如今的 关系数据库存储带来了巨大的挑战。分布存储技术是云计算的基础,主要研究如何存储、组织和管理数据中心上的大规模海量数据.由于面临的数据规模和用户规模更加庞大,在可扩展性、容错性以及成本控制方面面临着更加严峻的挑战[1]。        ...
分类:其他好文   时间:2014-05-15 18:13:55    阅读次数:438
hbase源码系列(十)HLog与日志恢复
HLog概述hbase在写入数据之前会先写入MemStore,成功了再写入HLog,当MemStore的数据丢失的时候,还可以用HLog的数据来进行恢复,下面先看看HLog的图。旧版的HLog是实际上是一个SequceneFile,0.96的已经使用Protobuf来进行序列化了。从Writer和R...
分类:其他好文   时间:2014-05-15 07:38:50    阅读次数:377
Hive常用命令
创建表: hive> CREATE TABLE pokes (foo INT, bar STRING);          Creates a table called pokes with two columns, the first being an integer and the other a string 创建一个新表,结构与其他一样 hive> create table n...
分类:其他好文   时间:2014-05-15 07:07:58    阅读次数:303
hive-0.10.0-cdh4.3.0安装
1.我使用的Hadoop2.0-cdh4.3.0,对应hive配套版本hive-0.10.0-cdh4.3.0。    2.修改hive/conf下hive-site.xml文件,无则创建hive-site.xml,在底部添加如下内容:  [html] view plaincopy xml version="1.0" encoding="UTF-8"...
分类:其他好文   时间:2014-05-15 04:05:27    阅读次数:341
基于HBase的报表实现设想
很多复杂的报表项目,是借助报表工具(或插件)来实现的,下面以jasperReport举例。这些报表工具可以对传统的数据源(关系型数据库、collections、javaBeanArray)进行很好的支持。HBase的数据结构虽然与关系型数据库不一样,但HBase本身就是java开发的。有专门的javaAPI实现对HB..
分类:其他好文   时间:2014-05-14 18:23:58    阅读次数:281
Hive sql 语法解读
一、 创建表      在官方的wiki里,example是这样的: Sql代码   CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name    [(col_name data_type [COMMENT col_comment], ...)]    [COMMENT table_comment]    [PARTITION...
分类:数据库   时间:2014-05-14 14:50:27    阅读次数:463
基于HBase的手机数据备份系统 .
基于HBase实现的手机数据备份系统,实现了手机关键信息的备份,如短信、联系人等。包括服务器端(Server)和客户端(Client)Server运行环境:Hadoop+HBase+TomcatClient运行环境: Eclipse+Android2.3Server端介绍:接收客户端请求的Actio...
分类:移动开发   时间:2014-05-14 13:18:12    阅读次数:374
hbase源码系列(九)StoreFile存储格式
从这一章开始要讲Region Server这块的了,但是在讲Region Server这块之前得讲一下StoreFile,否则后面的不好讲下去,这块是基础,Region Sever上面的操作,大部分都是基于它来进行的。HFile概述HFile是HBase中实际存数据的文件,为HBase提供高效快速的...
分类:其他好文   时间:2014-05-14 11:42:39    阅读次数:314
Microsoft Avro介绍
Microsoft发布了他们自己对Apache Avro通信协议的实现。Avro被描述为“紧凑的二进制数据序列化格式,类似于Thrift或者Protocol Buffers”,同时还有像Hadoop这样的分布式处理环境所需要的额外功能。 为了让该协议尽可能地快,Microsoft Avro类库会在运...
分类:其他好文   时间:2014-05-14 10:59:37    阅读次数:336
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!