二、Hive、Spark SQL、Impala比较 Hive、Spark SQL和Impala三种分布式SQL查询引擎都是SQL-on-Hadoop解决方案,但又各有特点。前面已经讨论了...
分类:
其他好文 时间:
2016-08-25 21:42:57
阅读次数:
166
简介 随着云时代的到来,大数据(big data)也越来越受大家的关注,比如互联网行业日常生成的运营、用户行为数据,随着时间及访问量的增长这一规模日益庞大,单位可达日TB或PB级别。如何在如此庞大的数据中挖掘出对我们有用的信息?目前业界主流存储与分析平台是Hadoop为主的开源生态圈,MapRedu ...
分类:
其他好文 时间:
2016-08-22 17:50:32
阅读次数:
203
十七、分段维度 本节说明分段维度的实现技术。分段维度包含连续值的分段。例如,年度销售订单分段维度可能包含有叫做“低”、“中”、“高”的三档;各档定义分别为0.01到15000、15000.01到30000.00、30000.01到99999999.99。如果一个客户的年度销售订单金额为10000,则被归为“低”档。 分段维度可以存储多个分段集合。例如,可能有一个用于促销...
分类:
其他好文 时间:
2016-08-11 18:00:09
阅读次数:
151
在过去的几年里,CSS 经历了一场巨变,正如 JavaScript 在 2004 年前后所经历的那场革命。它从一门极度简单/功能有限的样式语言,发展成为一项由 80 多项 W3C 规范(含草案)所定义的复杂技术,并建立起了独有的开发者生态圈/专属的技术会议/专用的框架和工具链。CSS 已经如此壮大, ...
分类:
Web程序 时间:
2016-08-06 18:52:40
阅读次数:
143
要说jQuery 最成功的地方,我认为是它的可扩展性吸引了众多开发者为其开发插件,从而建立起了一个生态系统。这好比大公司们争相做平台一样,得平台者得天下。苹果,微软,谷歌等巨头,都有各自的平台及生态圈。 学会使用jQuery并不难,因为它简单易学,并且相信你接触jQuery后肯定也使用或熟悉了不少其 ...
分类:
Web程序 时间:
2016-08-04 06:46:19
阅读次数:
368
在线教育的巨大潜力有目共睹,不管是创业者还是巨头都纷纷杀入其中。在线教育本身囊括的范围极其广阔,从胎教、学龄前教育、中小学教育、高等教育,再到职业教育,乃至细分化的英语教育、技能教育等,构成一个完整的教育生态圈。但让人无奈的是,国内在线教育最火爆的却还是中..
分类:
其他好文 时间:
2016-08-02 22:23:47
阅读次数:
131
五、快照 前面实验说明了处理维度的扩展。本节讨论两种事实表的扩展技术。 有些用户,尤其是管理者,经常要看某个特定时间点的数据。也就是说,他们需要数据的快照。周期快照和累积快照是两种常用的事实表扩展技术。 周期快照是在一个给定的时间对事实表进行一段时期的总计。例如,一个月销售订单周期快照汇总每个月底时总的销售订单金额。 累积快照用于跟踪事实表的...
分类:
其他好文 时间:
2016-07-22 19:18:25
阅读次数:
160
三、维度子集 有些需求不需要最细节的数据。例如更想要某个月而不是某天的记录。再比如相对于全部的销售数据,可能对某些特定状态的数据更感兴趣等。这些特定维度包含在从细节维度选择的行中,所以叫维度子集。维度子集比细节维度的数据少,因此更易使用,查询也更快。 本节中将准备两个特定维度,它们均取自现有的维度:月份维度(日期维度的子集),Pennsylvania州客户维度(客户维度...
分类:
其他好文 时间:
2016-07-19 10:04:48
阅读次数:
162