步骤: 1.在Linux下安装netcat工具,用户开启socket客户端: a.切换至root下 $>su root b.执行安装命令 $>yum install -y nc c.切换至Alex_lei用户下,模拟聊天室: $>nc 开启服务端 $>nc -l 55555 开启客户端 $>nc l ...
分类:
Web程序 时间:
2018-12-31 14:43:05
阅读次数:
279
一:介绍 (1)日志采集系统 (2)是一种分布式,可靠且可用的服务,用于有效地收集,聚合和移动大量日志数据。 (3)具有基于流数据流的简单灵活的架构。 (4)具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错能力。 二:flume的三个组件:【Source,Channel,Sink】构成A ...
分类:
Web程序 时间:
2018-12-31 13:51:24
阅读次数:
211
一、Flume是什么 Flume是一个数据,日志收集的一个组件,可以用于对程序,nginx等日志的收集,而且非常简单,省时的做完收集的工作。Flume是一个分布式、可靠、和高可用的海量日志采集聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集日志,同时Flume对日志做简单的处理。 Fl ...
分类:
Web程序 时间:
2018-12-30 13:59:48
阅读次数:
189
#!/bin/bash #echo "begin start flume..." path=/sysware/apache-flume-1.8.0-bin echo "flume home is :$path" process=$2 AgentName=$3 JAR="flume" Flumecon... ...
分类:
Web程序 时间:
2018-12-29 16:00:44
阅读次数:
1849
一、什么是大数据 四个特性(4个V) 数据量大(Volume) 大数据摩尔定律:IDC估测数据一直以50%的速度增长,到2020年,全球将拥有35ZB的数据量。(GB>TB>PB>EB>ZB) 快速化(Velocity) 处理速度快,1秒级决策 多样化(Varity) 数据类型繁多,大部分为非结构化 ...
分类:
其他好文 时间:
2018-12-24 22:35:05
阅读次数:
411
最近做了一个POC,目的是系统日志的收集和分析,此前有使用过splunk,虽然用户体验很好,但一是价格昂贵,二是不适合后期开发(splunk已经推出了SDK,后期开发已经变得非常容易)。在收集TB级别的日志量上flume-ng是更好的选择,因为后面的存储是扩展性极佳的HDFS。先简要介绍一下测试环境 ...
分类:
Web程序 时间:
2018-12-22 12:37:32
阅读次数:
246
flume安装: https://blog.csdn.net/u011254180/article/details/80000763 1 运行机制 1、 Flume分布式系统中最核心的角色是agent,flume采集系统就是由一个个agent所连接起来形成 2、每一个agent相当于一个数据传递员, ...
分类:
Web程序 时间:
2018-12-18 14:40:18
阅读次数:
257
Flume安装成功,环境变量配置成功后,开始进行agent配置文件设置。 1.agent配置文件(mysql+flume+Kafka) #利用Flume将MySQL表数据准实时抽取到Kafka a1.channels = c1 a1.sinks = k1 a1.sources = s1 #sourc ...
分类:
数据库 时间:
2018-12-13 19:14:48
阅读次数:
222
1.下载软件 在 /opt/deploy 下新建 flume 文件夹: # mkdir / opt/deploy / flume 到Flume官网上http://flume.apache.org/download.html下载软件包,例如: wget "http://mirrors.cnnic.cn ...
分类:
Web程序 时间:
2018-12-12 10:36:22
阅读次数:
239