Flume: source: Avro是一个轻量级的rpc框架,可以解决单点故障。 Thrift少用。 Exec:类似 tail -f spooling Directory:目录 Tail dir多个目录里面动态变化的数据 kafka sosurce netcat source 图中红色用法较多。 ...
分类:
Web程序 时间:
2020-03-03 10:33:19
阅读次数:
61
功能远超Sqoop、DataX、Flume、Logatash、Filebeat等采集工具 注:由于文章篇幅有限,完整文档可扫免费获取 深知其他组件的局限性,才能彰显DBus的优越感 当前有很多数据采集工具(Sqoop、DataX、Flume、Logatash、Filebeat等),他们或多或少都存在 ...
分类:
数据库 时间:
2020-02-25 19:43:18
阅读次数:
115
面试时间:2019年6月 深信服的效率是很快的,前一天晚上5点钟通知笔试,在7点就要进行笔试,9点笔试完11点钟通知第二天中午11点面试 所以我做完也没有来得及有所准备,就得去面试了 面经如下: 1.namenode和secondarynamenode的工作机制 2.谈谈对flume的理解, flu ...
分类:
其他好文 时间:
2020-02-24 20:59:36
阅读次数:
89
官网下载window版zabbix_agents软件包。 1:创建zabbix_agent目录并解压zabbix_agents_3.4.5.win.zip,生成conf,bin目录文件。 2:修改zabbix_agent,conf文件: EnableRemoteCommands=1 #允许在本地执行 ...
1. 开启 2. 通过浏览器访问node节点,http://IP:50070 检查 (如果无法访问,将防火墙关闭) 如果jps查看缺少了某个节点,首先查看xml文件是否正确,如果正确,删除hadoop/tmp文件夹,然后再次格式化,(格式化会重新创建hadoop/tmp),再次启动 3. 操作分布式 ...
分类:
Web程序 时间:
2020-02-22 11:57:30
阅读次数:
81
这个迭代刚好要在做TeamCity迁移工作,也算边工作边学习吧,把遇到的问题记录下来,希望能帮到有需要的胖友。 一、Windows系统下 安装与配置Agent 1.先在TeamCity服务中的导航栏中点击Administration,点击Install Build Agents,下载相应的Agent ...
一、相关知识回顾 分布式文件存储 信息源: 购买信息元(对海量数据清洗) 自营提供(限于大公司) 爬虫、抓包 信息格式:文件、文本、sql、json 分布式计算 离线批处理 MapReduce spark 实时数据流 storm spark Sqoop数据迁移:hdfs mysql flume数据上 ...
分类:
其他好文 时间:
2020-02-19 10:28:03
阅读次数:
94
Sqoop 简介 Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可 ...
分类:
Web程序 时间:
2020-02-18 12:47:15
阅读次数:
149
1. Flume介绍 1.1 Flume Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。 1.2 系统功能 1 ...
分类:
Web程序 时间:
2020-02-17 15:40:44
阅读次数:
95