王家林 Spark公开课大讲坛第一期:Spark把云计算大数据速度提高100倍以上 http://edu.51cto.com/lesson/id-30816.html
Spark实战高手之路 系列书籍 http://down.51cto.com/tag-Spark%E6%95%99...
分类:
数据库 时间:
2014-08-14 10:32:38
阅读次数:
218
以ANALYZE为例描述ANALYZE在Hive中的使用方法详见:https://cwiki.apache.org/confluence/display/Hive/StatsDev#StatsDev-ExistingTablesANALYZE在Hive中使用简单介绍一张表有4个分区:Partitio...
分类:
数据库 时间:
2014-08-11 14:23:32
阅读次数:
428
定制spark让sql更简单,上个版本的start.scala用的是HiveContext,这个是SQLContext的,不需编译。...
分类:
数据库 时间:
2014-07-13 20:44:21
阅读次数:
330
1.准备数据employee.txt1001,Gong Shaocheng,11002,Li Dachao,11003,Qiu Xin,11004,Cheng Jiangzhong,21005,Wo Binggang,3将数据放入hdfs[root@jfp3-1 spark-studio]# hdf...
分类:
数据库 时间:
2014-06-29 00:17:54
阅读次数:
415