码迷,mamicode.com
首页 >  
搜索关键字:kettle hbase    ( 4514个结果
Hadoop与HBase中遇到的问题
1. Hadoop中遇到的问题曾经所遇到的问题因为没有记录,所以忘了(1)NameNode没有启动成功, 是因为你对HDFS多次格式化,导致datanode中与namenode中的VERSION文件里的namespaceID不一致(对于NameNode节点,该文件位于hdfs-site配置文件里df...
分类:其他好文   时间:2014-06-28 12:47:08    阅读次数:394
分布式HBase-0.98.3环境搭建
Hbase是一个分布式,版本化(versioned),构建在 Apache Hadoop和 Apache ZooKeeper上的列数据库.本文使用默认的Zookeeper,构造HDFS基础上的分布式Hbase。1 安装环境操作系统:Ubuntu-12.04 JDK版本:jdk1.7.0_51 计算....
分类:其他好文   时间:2014-06-26 00:31:04    阅读次数:302
shell 脚本实战笔记(3)--集群机器的时间同步设置
背景: 有些分布式服务(比如HBase服务), 依赖于系统时间戳, 如果集群各个节点, 系统时间不一致, 导致服务出现诡异的情况.解决方案: 那如何同步集群各个节点之间的时间? 采用NTP(Network Time Protocol)方式来实现, 选择一台机器, 作为集群的时间同步服务器, 然...
分类:其他好文   时间:2014-06-25 22:59:50    阅读次数:346
java程序员网站
blog or webProject https://github.com/ http://www.open-open.com/2_23.htm http://www.07net01.com/linux/HBase_Hadoopxuexibiji_62422_1359608614.html ...
分类:编程语言   时间:2014-06-25 13:08:07    阅读次数:220
CDH5上安装Hive,HBase,Impala,Spark等服务
Apache Hadoop的服务的部署比较繁琐,需要手工处理配置文件、下载依赖包等。Cloudera Manager以GUI的方式的管理CDH集群,提供向导式的安装步骤。由于需要对Hive,HBase,Impala,Spark进行功能测试,就采用了Cloudera Manager方式进行安装。本文讲解的是parcel安装方式。...
分类:其他好文   时间:2014-06-24 22:44:17    阅读次数:501
HBase的常用Java API
1. 创建HBase表的对象HBase表的对项名字叫HTable,创建它的方法有很多,常见的有如下:org.apache.hadoop.hbase.client.HTable hTable = new HTable(org.apache.hadoop.hbase.HBaseConfiguration...
分类:编程语言   时间:2014-06-23 08:32:23    阅读次数:386
使用kettle实现两张表的数据更新
请大家指教,使用的Oracle数据库作为数据源,mysql数据库做同步1.如图所示:拖进,表输入,插入/更新,write to log,2.下面进入配置页面,双击”表输入“ 或是右键”编辑步骤“ 如果所示:配置你的主数据源,就是你要从他上边更新数据的,点击”新建“或是”编辑“进行数据库配置,如图所示...
分类:其他好文   时间:2014-06-23 08:27:53    阅读次数:756
Hadoop Hive sql 语法详解
Hive 是基于Hadoop 构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据,可以将结构 化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行,通过自己的SQL 去查询分析需 要的内容,这套SQL 简称Hive SQL,使不熟悉mapreduce 的用户很方便的利用SQL 语言...
分类:数据库   时间:2014-06-22 22:41:52    阅读次数:342
【DB】HBase的基本概念
一 Hbase是个啥东东?  在说Hase是个啥家伙之前,首先我们来看看两个概念,面向行存储和面向列存储。面向行存储,我相信大伙儿应该都清楚,我们熟悉的RDBMS就是此种类型的,面向行存储的数据库主要适合于事务性要求严格场合,或者说面向行存储的存储系统适合OLTP,但是根据CAP理论,传统的RDBMS,为了实现强一致性,通过严格的ACID事务来进行同步,这就造成了系统的可用性和伸缩性方面大大折扣...
分类:数据库   时间:2014-06-22 17:58:25    阅读次数:291
详细图解 快速入门kettle
写在前面一: 数据仓库ETL工具有很多,基于大数据环境下的分析,Hive用的多些。本文介绍国外的 一款开源ETL工具——Kettle。 写在前面二: 所用软件说明: 一、什么是Kettle Kettle是一款国外开源的ETL工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transf...
分类:其他好文   时间:2014-06-22 12:01:20    阅读次数:619
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!