创建表CREATE TABLE pokes (foo INT, bar
STRING);创建表并创建索引字段dsCREATE TABLE invites (foo INT, bar STRING) PARTITIONED BY
(ds STRING);显示所有表SHOW TABLES;按正条件(正则...
分类:
其他好文 时间:
2014-06-11 23:10:11
阅读次数:
299
link:http://blog.csdn.net/uniquechao/article/details/26449761版本信息:
hadoop 2.3.0 hive 0.11.01. Application Master 无法访问 点击application mater 链接,出现
http ....
分类:
其他好文 时间:
2014-06-11 13:08:02
阅读次数:
385
SolrCloud是一种分布式解决方案,是基于zookeeper和solr的,可以简单理解为一种集群,可以提供分布式查询,分布式写索引。
SolrCloud的结构大致是这样的,一个SolrCloud包括多个Shared节点,一个Shared的包括Solr节点,其中每个Shared中的有一个Leader Solr节点,多个Replica节点。
每个SOLR节点的内容是一样的。...
写在前面一:本文将Hive与HBase整合在一起,使Hive可以读取HBase中的数据,让Hadoop生态系统中最为常用的两大框架互相结合,相得益彰。写在前面二:使用软件说明:约定所有软件的存放目录:/home/yujianxin一、Hive整合HBase原理Hive与HBase整合的实现是利用两者本身对外的API接口互相进行通信,相互通信主要是依靠hive-hbase-handler-0.9.0...
分类:
其他好文 时间:
2014-06-07 13:33:43
阅读次数:
274
在新近发布的spark
1.0中新加了sql的模块,更为引人注意的是对hive中的hiveql也提供了良好的支持,作为一个源码分析控,了解一下spark是如何完成对hql的支持是一件非常有趣的事情。
分类:
其他好文 时间:
2014-06-06 08:40:02
阅读次数:
348
一:课程简介:作为云计算实现规范和实施标准的Hadoop恰逢其时的应运而生,使用Hadoop用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的、高效,的、可伸缩的,能够使用普通的社区服务器出来PB...
分类:
其他好文 时间:
2014-06-05 16:37:09
阅读次数:
285
Hadoop是云计算的事实标准软件框架,是云计算理念、机制和商业化的具体实现,是整个云计算技术学习中公认的核心和最具有价值内容。如何从企业级开发实战的角度开始,在实际企业级动手操作中深入浅出并循序渐进的掌握Hadoop是本课程的核心。云计算学习者的心声:如何从企业级开发的角度,不断动手实际操作,循序...
分类:
其他好文 时间:
2014-06-05 14:25:48
阅读次数:
300
一:课程简介:
Hadoop是云计算分布式大数据的事实标准软件框架,Hadoop中的架构实现是整个云计算产业技术的基础,作为与Google三大核心技术DFS、MapReduce、BigTable相对的HDFS、MapReduce、和HBase也是整个Hadoop生态系统的核心的技术,本课程致力于帮您...
分类:
其他好文 时间:
2014-06-05 14:17:33
阅读次数:
273
用hbase做数据库,但由于hbase没有类sql查询方式,所以操作和计算数据非常不方便,于是整合hive,让hive支撑在hbase数据库层面 的 hql查询.hive也即 做数据仓库
1. 基于Hadoop+Hive架构对海量数据进行查询:http://blog.csdn.net/kunshan_shenbin/article/details/7105319
2. HBase...
分类:
其他好文 时间:
2014-06-02 10:33:40
阅读次数:
277
写在前面一:
本文总结基于HBase的SQL查询系统——Salesforce phoenix
写在前面二:
环境说明:
一、什么是Phoenix
摘自官网:
Phoenix是一个提供hbase的sql操作的框架,Phoenix是构建在HBase之上的一个SQL中间层。Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JD...
分类:
数据库 时间:
2014-06-01 14:05:11
阅读次数:
403