Linux部分 ①列举你使用的常用指令? ②怎么查看服务是否开启?后面的参数都是什么意思? ③怎么查看服务器内存使用情况? ④日志查看指令? ⑤跨机房怎么传输文件? Hadoop部分 ①怎么搭建一个Hadoop集群? ②Hadoop的Shuffer机制? ③切片概念?文件256M时,几个切片? ④M ...
分类:
其他好文 时间:
2020-07-08 13:03:03
阅读次数:
59
一.简单实现 需求:根据 flume 监控 exec 文件的追加数据,写入 kafka 的 test-demo 分区,然后启用 kafka-consumer 消费 test-demo 分区数据。 需求分析 1)flume的配置文件 在hadoop102上创建flume的配置文件 # define a ...
分类:
Web程序 时间:
2020-07-07 23:22:58
阅读次数:
79
Agent的配置文件最好根据Flume的拓扑架构,依次写好每个节点的配置文件; 一.Agent 开头都是先要定义agent,sorce,channel,sink名 # Name the components on this agent( 描述这个Agent,给各个组件取名字) a1.sources ...
分类:
Web程序 时间:
2020-07-06 01:18:20
阅读次数:
133
问题最近心血来潮把mac版本升级了下,然后就发现我写的登录SSH的脚本 无法登录服务器了。一开始以为是dns出问题了,但是单独 ping 域名 ip 却是对的,我就非常郁闷了。但是由于比较忙一直就没有在乎这个问题,今天上网搜索了下发现有人遇到同样的问题,原来是 mac 升级之后的一个Bug、Bug、... ...
分类:
系统相关 时间:
2020-07-05 17:04:52
阅读次数:
102
一.Flume定义 ? Flume是Cloudera公司提供的一个高可用、高可靠、分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。 ? Flume最主要的作用就是,实时读取服务器的本地磁盘的数据,将数据写入到HDFS。 二.Flume基础架构 ? Flume基本组成架构如下 ...
分类:
Web程序 时间:
2020-07-03 23:51:14
阅读次数:
112
日志的功能 系统和程序的“日记本” 记录系统、程序运行中发生的各种事件 通过查看日志,了解及排除故障 信息安全控制的“依据” 常见的系统日志文件 /var/log/messages 记录内核消息、各种服务的公共消息 /var/log/dmesg 记录系统启动过程的各种消息 /var/log/cron ...
分类:
其他好文 时间:
2020-07-03 12:16:17
阅读次数:
66
如果现在要想将flume中的sink设置为kafka,因为在实际的开发中,可能会有若干个子系统或者若干个客户端进行flume日志采集,那么能够承受这种采集任务量的只有kafka来完成,可是需要注意一个问题,现在的kafka是采用了Kerberos认证,所以要想在flume之中去使用kafka操作,就 ...
分类:
Web程序 时间:
2020-07-03 01:11:20
阅读次数:
154
Kafka在实际的开发之中的确可以处理千万级别的数据,但是现在有一个问题,这些数据从哪里来呢?Kafka产生的初衷是进行数据的收集以及合理的消费,但是这些实际之中的数据我们应该如何获取,我们该用什么样的方式来获取,而且最关键的是,如果现在是一个已经成型的系统(SSH、SSM、Spring),那么这个 ...
分类:
Web程序 时间:
2020-07-01 12:37:05
阅读次数:
61
大数据技术为决策提供依据,在政府、企业、科研项目等决策中扮演着重要的角色,在社会治理和企业管理中起到了不容忽视的作用,很多国家,如中国、美国以及欧盟等都已将大数据列入国家发展战略,微软、谷歌、百度以及亚马逊等大型企业也将大数据技术列为未来发展的关键筹码,可见,大数据技术在当今乃至未来的重要性! 大数 ...
分类:
其他好文 时间:
2020-06-29 11:48:57
阅读次数:
47
一、概述 1.Flume是Apache提供的开源的、分布式的、可靠的日志收集系统 2.能够有效的收集、聚合、传输大量的日志数据 3.flume有2个版本:flume-og(flume09x)和flume-ng(flume1.x),flume-og和flume-ng不兼容 二、基本概念 1.Event ...
分类:
Web程序 时间:
2020-06-28 15:19:31
阅读次数:
62