码迷,mamicode.com
首页 >  
搜索关键字:初识appache hadoop    ( 13955个结果
HDFS HA系列实验之二:HA+JournalNode+zookeeper
1:原理图 A:NN1、NN2(或者更多个NN节点)只有一个是Active状态,通过自带ZKFailoverController组件(zookeeper客户端)和zookeeper集群协同对所有NN节点进行检测和选举来达到此目的。B:Active NN 的EditLog 写入共享的JournalNode集群中,Standby NN通过JournalNode集群获取Editlog,并在本地运行来保持...
分类:其他好文   时间:2014-05-15 14:46:42    阅读次数:414
Hive常用命令
创建表: hive> CREATE TABLE pokes (foo INT, bar STRING);          Creates a table called pokes with two columns, the first being an integer and the other a string 创建一个新表,结构与其他一样 hive> create table n...
分类:其他好文   时间:2014-05-15 07:07:58    阅读次数:303
Hadoop大数据处理读书笔记
几个关键性的概念 1 云计算是指利用大量计算节点构成的可动态...
分类:其他好文   时间:2014-05-15 05:37:04    阅读次数:434
Hadoop 2.0 Queue
Hadoop 2.0 Queue setting 解析...
分类:其他好文   时间:2014-05-15 05:03:25    阅读次数:544
Hadoop-2.2.0中文文档—— MapReduce 下一代 - Encrypted Shuffle
简介  Encrypted Shuffle capability (加密洗牌功能?)允许用HTTPS 和 可选的客户端验证 (也称作双向的 HTTPS, 或有客户端证书的 HTTPS) 去加密 MapReduce shuffle.它包括: 在HTTP 和 HTTPS 之间绑定 shuffle 的一个 Hadoop 配置用来指定 keystore 和 truststore 属性的Hado...
分类:其他好文   时间:2014-05-15 04:59:35    阅读次数:301
hive-0.10.0-cdh4.3.0安装
1.我使用的Hadoop2.0-cdh4.3.0,对应hive配套版本hive-0.10.0-cdh4.3.0。    2.修改hive/conf下hive-site.xml文件,无则创建hive-site.xml,在底部添加如下内容:  [html] view plaincopy xml version="1.0" encoding="UTF-8"...
分类:其他好文   时间:2014-05-15 04:05:27    阅读次数:341
hadoop学习;大数据集在HDFS中存为单个文件;安装linux下eclipse出错解决;查看.class文件插件
一个典型的hadoop工作流会在别的地方...
分类:系统相关   时间:2014-05-15 03:47:41    阅读次数:422
Hive sql 语法解读
一、 创建表      在官方的wiki里,example是这样的: Sql代码   CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name    [(col_name data_type [COMMENT col_comment], ...)]    [COMMENT table_comment]    [PARTITION...
分类:数据库   时间:2014-05-14 14:50:27    阅读次数:463
hadoop-mapreduce中maptask运行分析
MapTask运行通过执行.run方法: 1.生成TaskAttemptContextImpl实例,此实例中的Configuration就是job本身。 2.得到用户定义的Mapper实现类,也就是map函数的类。 3.得到InputFormat实现类。 4.得到当前task对应的InputSplit. 5.通过InputFormat,得到对应的RecordReader。 6.生成Re...
分类:其他好文   时间:2014-05-14 14:31:59    阅读次数:381
Microsoft Avro介绍
Microsoft发布了他们自己对Apache Avro通信协议的实现。Avro被描述为“紧凑的二进制数据序列化格式,类似于Thrift或者Protocol Buffers”,同时还有像Hadoop这样的分布式处理环境所需要的额外功能。 为了让该协议尽可能地快,Microsoft Avro类库会在运...
分类:其他好文   时间:2014-05-14 10:59:37    阅读次数:336
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!