Shark0.9.0错误如下:
Starting the Shark Command Line Client
Exception in thread "main" java.lang.UnsupportedClassVersionError: org/apache/hadoop/hive/cli/CliDriver : Unsupported major.minor version 51.0...
分类:
其他好文 时间:
2014-05-15 05:42:17
阅读次数:
375
几个关键性的概念
1 云计算是指利用大量计算节点构成的可动态...
分类:
其他好文 时间:
2014-05-15 05:37:04
阅读次数:
434
Hadoop 2.0 Queue setting 解析...
分类:
其他好文 时间:
2014-05-15 05:03:25
阅读次数:
544
1.我使用的Hadoop2.0-cdh4.3.0,对应hive配套版本hive-0.10.0-cdh4.3.0。
2.修改hive/conf下hive-site.xml文件,无则创建hive-site.xml,在底部添加如下内容:
[html] view
plaincopy
xml version="1.0" encoding="UTF-8"...
分类:
其他好文 时间:
2014-05-15 04:05:27
阅读次数:
341
积累了小一个月,终于搞定了64位Ubuntu14.4中的Hadoop集群环境安装。虽然只能算是囫囵吞枣,但是基本完成了预期的目标,接下来要细细品味所有的细节了。...
分类:
其他好文 时间:
2014-05-15 02:58:17
阅读次数:
297
hive执行query语句时提示错误:org.apache.hadoop.ipc.RemoteException: java.io.IOException: java.io.IOException:...
分类:
编程语言 时间:
2014-05-14 21:49:08
阅读次数:
378
ReduceTask的运行
Reduce处理程序中需要执行三个类型的处理,
1.copy,从各map中copy数据过来
2.sort,对数据进行排序操作。
3.reduce,执行业务逻辑的处理。
ReduceTask的运行也是通过run方法开始,
通过mapreduce.job.reduce.shuffle.consumer.plugin.class配置shuffle的plugin,
...
分类:
其他好文 时间:
2014-05-14 20:23:57
阅读次数:
519
近来多次和百度、阿里、腾讯、中移动数据中心的架构师进行交流,同时也在网上的论坛/社区主导大数据分析范例的一些讨论,与互联网/云开发人员进行沟通。由此,我愉快地发现,大数据分析在中国非常普遍:不光是星巴克、纸牌屋等美国文化元素在中国广受追捧;Hadoop也受到广泛接纳,并且在中国的云开发人员的讨论中占据了主导地位。...
分类:
其他好文 时间:
2014-05-14 19:37:49
阅读次数:
255
很多复杂的报表项目,是借助报表工具(或插件)来实现的,下面以jasperReport举例。这些报表工具可以对传统的数据源(关系型数据库、collections、javaBeanArray)进行很好的支持。HBase的数据结构虽然与关系型数据库不一样,但HBase本身就是java开发的。有专门的javaAPI实现对HB..
分类:
其他好文 时间:
2014-05-14 18:23:58
阅读次数:
281
MapTask运行通过执行.run方法:
1.生成TaskAttemptContextImpl实例,此实例中的Configuration就是job本身。
2.得到用户定义的Mapper实现类,也就是map函数的类。
3.得到InputFormat实现类。
4.得到当前task对应的InputSplit.
5.通过InputFormat,得到对应的RecordReader。
6.生成Re...
分类:
其他好文 时间:
2014-05-14 14:31:59
阅读次数:
381