HDinsight Storm概述
什么是Storm?
Apache Storm是一个分布式,容错,开放源码的计算系统,让你来处理数据的实时。Storm解决方案还可以提供有保证的处理的数据,与重试未成功处理的第一次数据的能力。...
分类:
其他好文 时间:
2014-12-16 11:44:03
阅读次数:
244
http://www.chinahadoop.cn/page/developer什么是大数据开发师?围绕大数据系平台系统级的研发人员, 熟练Hadoop、Spark、Storm等主流大数据平台的核心框架。深入掌握如何编写MapReduce的作业及作业流的管理完成对数据的计算,并能够使用Hadoop提...
分类:
其他好文 时间:
2014-12-14 19:54:40
阅读次数:
280
Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2
Apache Hadoop YARN: Moving beyond MapReduce and Batch Processing with Apache Hadoop 2 .mobi: http://www....
分类:
Web程序 时间:
2014-12-13 19:26:27
阅读次数:
180
先来看一下一张技术的全景图,其中涉及内存计算的技术标成红色。 1)事务处理:主要分为Cache(Memcached, Redis, GemFire)、RDBMS、NewSQL(以VoltDB为首的)三部分,缓存和NewSQL数据库是关注的重点。2)流式处理:Storm本身只是计算的框架,而Spark-Streaming才实现了内存计算式的流处理。3)分析阶段的对比:Ø 通用处理:MapReduc...
分类:
其他好文 时间:
2014-12-13 15:11:40
阅读次数:
484
Release Notes - Apache Storm - Version 0.9.2-incubating Sub-task [STORM-207] - Add storm-starter as a module [STORM-208] - Add storm-kafka as a module [STORM-223] - Safe YAML Parsing [STORM-232] - ...
分类:
Web程序 时间:
2014-12-12 15:07:15
阅读次数:
429
Trident主要有5类操作: 1、作用在本地的操作,不产生网络传输。 2、对数据流的重分布,不改变流的内容,但是产生网络传输。 3、聚合操作,有可能产生网络传输。 4、作用在分组流(grouped streams)上的操作。 ...
分类:
其他好文 时间:
2014-12-12 13:28:26
阅读次数:
1018
程序中用了IE的内核,想取出网站中的验证码图片,单独显示出来,调研了以下几路方法1、枚举所有缓存文件,进行处理,找到想要的,核心代码if (0)//这段代码可以枚举所有缓存资源,然后对应做处理{ LPINTERNET_CACHE_ENTRY_INFO lpCacheEntry = NULL; ...
分类:
其他好文 时间:
2014-12-11 17:10:12
阅读次数:
211
Learning storm book 笔记8
有代码的书籍看起来就是爽,看完顺便跑个demo,感觉很爽!
场景分析
主要是利用apache的访问日志来进行分析统计 如用户的IP来源,来自哪个国家或地区,用户使用的Os,浏览器等信息,以及像搜索的热词等信息的统计 这里日志信息如下
24.25.135.19 - - [1-01-2011:06:20:31 -0500] "GET...
分类:
其他好文 时间:
2014-12-11 06:48:19
阅读次数:
261