码迷,mamicode.com
首页 >  
搜索关键字:streaming 数据清理    ( 1344个结果
Spark Resources
From apacheAdvanced Spark Internals and Tuning – Reynold Xin –SLIDES|VIDEOSpark SQL – Michael Armburst –SLIDES|VIDEOSpark Streaming – Tathagata Das –S...
分类:其他好文   时间:2014-12-17 12:33:45    阅读次数:174
STOMP协议介绍
STOMP,Streaming Text Orientated Message Protocol,是流文本定向消息协议,是一种为MOM(Message Oriented Middleware,面向消息的中间件)设计的简单文本协议。它提供了一个可互操作的连接格式,允许STOMP客户端与任意STOMP消...
分类:其他好文   时间:2014-12-16 22:16:34    阅读次数:259
内存计算技术资料整理
先来看一下一张技术的全景图,其中涉及内存计算的技术标成红色。 1)事务处理:主要分为Cache(Memcached, Redis, GemFire)、RDBMS、NewSQL(以VoltDB为首的)三部分,缓存和NewSQL数据库是关注的重点。2)流式处理:Storm本身只是计算的框架,而Spark-Streaming才实现了内存计算式的流处理。3)分析阶段的对比:Ø  通用处理:MapReduc...
分类:其他好文   时间:2014-12-13 15:11:40    阅读次数:484
Sqoop问题总结
1.?sqoop导入mysql数据出错 ????用sqoop导入mysql数据出现以下错误: 14/12/03?16:37:58?ERROR?manager.SqlManager:?Error?reading?from?database:?java.sql.SQLException:?Streaming?result?set...
分类:其他好文   时间:2014-12-04 16:05:46    阅读次数:199
Jackson Gson Json.simple part 2
这篇blog介绍 Jackson 的特点和使用方法Jackson支持三种使用方法流API(streaming api Incremental parsing/generation)JsonParse reads, JsonGenerator writes高效和part 1 json的用法类似,不好用...
分类:Web程序   时间:2014-11-23 17:26:49    阅读次数:212
Hadoop Streaming例子(python)
以前总是用java写一些MapReduce程序现举一个例子使用Python通过Hadoop Streaming来实现Mapreduce。 任务描述: HDFS上有两个目录/a和/b,里面数据均有3列,第一列都是id,第二列是各自的业务类型(这里假设/a对应a,/b对应b),第三列是一个jso...
分类:编程语言   时间:2014-11-23 13:07:40    阅读次数:270
反向Ajax原理和模型(燕十八php笔记)
commet又叫反向Ajax(Reverse Ajax),或者server push 服务器推技术,在实时聊天和消息推送中应用的比较广,我们要了解反向Ajax、轮询(polling)、流(streaming)、Comet和长轮询(long polling),学习如何实现不同的反向Ajax通信技术,并...
分类:Web程序   时间:2014-11-19 15:43:06    阅读次数:327
Hadoop-2.4.1学习之Streaming编程
本篇文章学习了如何编写hadoop streaming程序,重点讲述了工作原理及用到的各种参数...
分类:其他好文   时间:2014-11-17 12:27:22    阅读次数:171
hive streaming 使用的时候的一些心得
hive streaming 报错的解决方案:1、把使用到hive streaming 的sql 分解,例如:select transform a,b,c,d using 'python cc.py' as (e,f) from table,分解成:select a,b,c,d from table...
分类:其他好文   时间:2014-11-14 15:37:33    阅读次数:256
Python中字符串的解压缩
今天在用Streaming-Python处理一个MapReduce程序时,发现reducer失败,原因为耗费内存达到极限了!仔细查看代码时,发现有一个集合里保存着URL,而URL长度是比较长的,直接保存确实是耗费内存,于是想到用压缩存储,然后用的时候再解压,虽然处理时间增加,但是耗费内存大大降低! 具体就是使用zlib模块 import zlib raw_data = "hello,wor...
分类:编程语言   时间:2014-11-08 07:06:23    阅读次数:323
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!