微软向Linux用户提供Hadoop on Azure服务 目前HDInsight支持的唯一Linux版本是Ubuntu(在虚拟机中),是由Canonical提供支持的。微软现在已经开始提供Storm for Azure HDInsight。Storm是一种开源的流分析平台,已经从2014年10...
分类:
其他好文 时间:
2015-03-17 10:12:00
阅读次数:
196
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQ...
分类:
Web程序 时间:
2015-03-07 22:34:02
阅读次数:
192
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:
1,Pig是什么?
Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQL-like语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转...
分类:
Web程序 时间:
2015-03-06 09:47:10
阅读次数:
140
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-like..
分类:
Web程序 时间:
2015-03-06 06:21:44
阅读次数:
146
在文章开始之前,我们还是简单来回顾下Pig的的前尘往事:1,Pig是什么?Pig最早是雅虎公司的一个基于Hadoop的并行处理架构,后来Yahoo将Pig捐献给Apache(一个开源软件的基金组织)的一个项目,由Apache来负责维护,Pig是一个基于 Hadoop的大规模数据分析平台,它提供的SQ...
分类:
Web程序 时间:
2015-03-06 06:09:45
阅读次数:
138
企业每天都在制造大量的经营数据,这些数据反映了企业生成、销售状况。营销分析是在广泛收集信息资料的基础上,运用各种定性和定量的方法,帮助管理层决策分析,更好的为开展营销工作服务。
一般而言营销管理分析系统包含以下几个基本要求:
①灵活弹性的报表设计,适应各个地区、情况的报表需求,能迎合企业需要快速反应企业状况;
②可视化的数据呈现方式,帮助企业领...
分类:
其他好文 时间:
2015-03-03 09:55:01
阅读次数:
191
eBay已经开源了一种实时大数据分析的平台—— Pulsar,它利用了分布式处理和Complex Event Processing技术,实现了一个低延迟,高可靠的分布式实时分析平台。...
分类:
其他好文 时间:
2015-03-02 14:55:20
阅读次数:
793
经过10年的发展,中国在高速铁路的建设和发展上取得了举世瞩目的成就,目前已经拥有全世界最大规模以及最高运营速度的高速铁路网。从最早的时速100公里的“东风号”内燃机车到最新的最高时速486公里的“和谐号”高速动车,中国铁路技术实现了快速跨越式发展,局部技术上已经走在了世界的前列。同样,在信息安全领域...
分类:
其他好文 时间:
2015-02-27 13:28:55
阅读次数:
142
AWS提供的服务和基础设施能够在云环境中建设可靠,容错和高可用的Web应用程序。在生产环境中,这些应用产生大量的日志信息。这些数据是任何公司运营web应用程序的重要知识来源,分析日志可以揭示信息,如交通模式,用户行为,市场资料等。 然而,作为Web应用程序的增长和的访问者数量的增加,存储和分析网络日志变得越来越具有挑战性。下图展示了如何使用AWS构建一个可扩展且可靠的大规模日志分析平台。该架构的核...
分类:
Web程序 时间:
2015-02-05 20:30:15
阅读次数:
324
Spark是基于内存的大数据分析平台,由UC Berkely AMP lab发布的一大神器。相比Hadoop而言,其最大的优势是基于内存,这样可以极大提高其速度和通用性。本文从最简单的安装到第一个应用脚本,引导初学者入门。。。。...
分类:
其他好文 时间:
2015-01-27 00:39:23
阅读次数:
322