码迷,mamicode.com
首页 > 其他好文 > 详细

从零自学Hadoop(23):Impala介绍及安装

时间:2017-05-31 12:01:00      阅读:393      评论:0      收藏:0      [点我收藏+]

标签:集群   不可用   分享   并行执行   检查   需要   block   lock   dfs   

阅读目录

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

文章是哥(mephisto)写的,SourceLink

 

     上一篇,我们讲述了HBase的协处理器。

   下面我们开始介绍Impala的介绍及安装。

介绍

一:定义

  Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。和Hive相比,速度快了个数量级,具有非常好的交互式SQL执行。

三:架构

技术分享

 

Impala Daemon

  是Impala的核心进程,进程名叫做:impalad,运行在所有的数据节点上,可以读写数据,并接收客户端的查询请求,并行执行来自集群中其他节点的查询请求,将中间结果返回给调度节点。调用节点将结果返回给客户端。

Impala Statestore

  状态管理进程,定时检查The Impala Daemon的健康状况,协调各个运行impalad的实例之间的信息关系,Impala正是通过这些信息去定位查询请求所要的数据,进程名叫做 statestored,在集群中只需要启动一个这样的进程,如果Impala节点由于物理原因、网络原因、软件原因或者其他原因而下线,Statestore会通知其他节点,避免查询任务分发到不可用的节点上。

Impala Catalog Service

  元数据管理服务,进程名叫做 catalogd,将数据表变化的信息分发给各个进程。

安装

一:新增服务

  技术分享

二:勾选Impala

  技术分享

三:分配服务

  技术分享

  

四:存储配置

  技术分享

五:添加服务进行中

  技术分享

 

六:添加完成

  技术分享

 

  

 

  

--------------------------------------------------------------------

  到此,本章节的内容讲述完毕。

系列索引

  【源】从零自学Hadoop系列索引

 

 

 

 

本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作。

文章是哥(mephisto)写的,SourceLink

 

从零自学Hadoop(23):Impala介绍及安装

标签:集群   不可用   分享   并行执行   检查   需要   block   lock   dfs   

原文地址:http://www.cnblogs.com/mephisto/p/6921663.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!