Hive是一种构建在Hadoop上的数据仓库,Hive把SQL查询转换为一系列在Hadoop集群中运行的MapReduce作业,是MapReduce更高层次的抽象,不用编写具体的MapReduce方法。Hive将数据组织为表,这就使得HDFS上的数据有了结构,元数据即表的模式,都存储在名为meta....
分类:
其他好文 时间:
2014-05-23 05:54:55
阅读次数:
1771
Hadoop Eclipse 开发工具 主要分为1、根据Hadoop版本生成插件2、安装Hadoop
Eclipse插件3、配置Hadoop目录4、配置Hadoop连接5、新一个MapReduce工程WordCount.javaMapReduce——WordCount问题总结参考:http://bl...
分类:
系统相关 时间:
2014-05-23 02:44:30
阅读次数:
354
通过MapReduce程序分析气象数据集,更好的了解计算过程。环境:Hadoop 1.2.1
& Centos 6.5
x641、气象数据集准备下载链接:ftp://ftp3.ncdc.noaa.gov/pub/data完整数据集非常大,可以下载部分数据集作为日常实验数据。2、气象数据上传到HDFS...
分类:
其他好文 时间:
2014-05-22 15:39:14
阅读次数:
361
import java.io.IOException;import
java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import
org.apache.hadoop.fs.Path;import org.ap...
分类:
其他好文 时间:
2014-05-22 01:11:55
阅读次数:
337
Hadoop技术内幕中指出Top
K算法有两步,一是统计词频,二是找出词频最高的前K个词。在网上找了很多MapReduce的Top
K案例,这些案例都只有排序功能,所以自己写了个案例。这个案例分两个步骤,第一个是就是wordCount案例,二就是排序功能。一,统计词频 1 package
TopK;...
分类:
其他好文 时间:
2014-05-21 22:29:14
阅读次数:
599
InputFormat中的Splits集合的获取;InputFormat是一个接口,该接口有2个成员函数;InputSplit[]
getSplits(JobConf job, int numSplits) throws IOException;RecordReader
getRecordReade...
分类:
其他好文 时间:
2014-05-21 19:21:45
阅读次数:
234
代志远早年就职网易研究院从事MapReduce与DFS系统的自主研发,后加入支付宝数据平台负责Hadoop与HBase体系的架构设计与二次研发,支付宝流计算与分布式搜索系统的设计和研发,后成为支付宝海量计算体系架构师兼支付宝三代架构成员。现就转战于阿里巴巴集团-CDO-海量数据部门,负责创新性项目的研究和跟进,目前专注于Google第二代数据库产品MegaStore的研究和在阿里的落地。
在...
分类:
数据库 时间:
2014-05-21 17:04:40
阅读次数:
393
基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析
课程讲师:迪伦
课程分类:Java
适合人群:高级
课时数量:96课时
用到技术:MapReduce、HDFS、Map-Reduce、Hive、Sqoop
涉及项目:Greenplum Hadoop大数据分析平台
更新程度:完毕
对这个课程有兴趣的朋友可以加我的QQ2059055336和...
分类:
其他好文 时间:
2014-05-21 13:23:22
阅读次数:
363
newLISP提供了一个简单的MapReduce的方式,利用net-eval函数,可以向远程运行这newlisp服务进程的机器发起调用。本文介绍最简单的方法:首先服务器启动newlisp进程newlisp -l -c -d 4711 &-l 代表记录日志,默认是打印到终端-c 是不会出现常见的newlisp的会话终端-d 是在连接之间保存状态,一个边际效应就是后续的请求必须等待前面的请求已经完成才...
分类:
其他好文 时间:
2014-05-21 07:20:38
阅读次数:
260
前段时间遇到了一个很诡异的发生的Map阶段的OOM异常,花了些时间才找到原因,这个简要记录一下。先看log。节点一的TaskTracker的log:节点二的TaskTracker的log:节点三的TaskTracker的log:其他节点的TaskTracker中的log都和slave4的一样的:故障分析:OOM是一个比较常见的故..
分类:
其他好文 时间:
2014-05-20 22:15:47
阅读次数:
422