SocketException: OS Error: Broken pipe, errno = 32 这个错误其实有点迷惑性,很多时候调用栈显示是在 的时机出的错,但实际是因为socket已经被对端关闭,而关闭的原因可能是因为发送了错误的数据。 解决: 发送数据时机检查socket连接状态及数据正确 ...
分类:
其他好文 时间:
2019-11-12 13:11:53
阅读次数:
114
Flink 读写Kafka 在Flink中,我们分别用Source Connectors代表连接数据源的连接器,用Sink Connector代表连接数据输出的连接器。下面我们介绍一下Flink中用于读写kafka的source & sink connector。 Apache Kafka Sour ...
分类:
其他好文 时间:
2019-11-10 10:01:34
阅读次数:
116
Flume配置文件: 但是在启动Flume时,报以下错误: 解决方案: 由于用到了agent的sink是 org.apache.spark.streaming.flume.sink.SparkSink类型,需要把spark streaming flume sink_2.11 2.4.3.jar复制到 ...
分类:
Web程序 时间:
2019-10-16 13:43:59
阅读次数:
98
Sink 不断地轮询 Channel 中的事件且批量地移除它们,并将这些事件批量写入到存储或索引系统、或者被发送到另一个 Flume Agent。 Sink 是完全事务性的。 在从 Channel 批量删除数据之前,每个 Sink 用 Channel 启动一个事务。 批量事件一旦成功写出到存储系统或 ...
分类:
Web程序 时间:
2019-10-01 09:59:54
阅读次数:
102
开源实现:https://github.com/keedio/flume-ng-sql-source 这里记录的是自己手动实现。 测试中要读取的表 记录表(必须),告诉 Flume 每次从哪开始读取 一、编写自定义 Source 1.添加 pom 依赖 2.编写类 MySQLSourceHelper ...
分类:
数据库 时间:
2019-09-29 19:58:38
阅读次数:
141
flume 三大组件 source 收集 channel 聚集 sink 输出 使用Flume关键就是写配置文件 A 配置source B 配置channel C 配置sink D 把以上3个组件串起来 1.通过IP端口 接收数据 启动agent flume-ng agent \ --name a1 ...
分类:
Web程序 时间:
2019-09-28 23:11:36
阅读次数:
122
一、串联 Flume Agent 连接 这种模式是将多个 flume 顺序连接起来了,从最初的 source 开始到最终 sink 传送的目的存储系统。此模式不建议桥接过多的 flume 数量,flume 数量过多不仅会影响传输速率,而且一旦传输过程中某个节点 flume 宕机,会影响整个传输系统。 ...
分类:
Web程序 时间:
2019-09-25 00:59:53
阅读次数:
171
Flume是一个分布式的、可靠的、高可用的海量日志采集、聚合和传输的系统。Java实现,插件丰富,模块分明。 数据流模型:Source-Channel-Sink 事务机制保证了消息传递的可靠性 一、基本组件 Event:消息的基本单位,有header和body组成。header是键值对的形式,bod ...
分类:
Web程序 时间:
2019-09-21 21:36:06
阅读次数:
148
说明文档 Consumer 的扩展,用于在流管道的各个阶段处理值,并且提供了额外的方法去管理大小信息、控制流程等 在首次调用 Sink 的 accept() 方法之前,必须首先调用 begin() 方法去通知其数据即将过来(视情况还会通知 Sink 有多少数据即将过来),在所有数据发送过来后,必须调 ...
分类:
其他好文 时间:
2019-09-18 01:01:43
阅读次数:
69