Sqoop 在hadoop和关系型数据库之间转换数据 Flume Flume是一个分布式的高可用的数据收集、聚集和移动的工具。通常用于从其他系统搜集数据,如web服务器产生的日志,通过Flume将日志写入到Hadoop的HDFS中 Canal 数据抽取是 ETL 流程的第一步。我们会将数据从 RDB ...
分类:
其他好文 时间:
2020-09-17 18:33:30
阅读次数:
37
1.概述 最近有同学留言咨询,Flink消费Kafka的一些问题,今天笔者将用一个小案例来为大家介绍如何将Kafka中的数据,通过Flink任务来消费并存储到HDFS上。 2.内容 这里举个消费Kafka的数据的场景。比如,电商平台、游戏平台产生的用户数据,入库到Kafka中的Topic进行存储,然 ...
分类:
其他好文 时间:
2020-09-17 17:38:24
阅读次数:
37
一、软件介绍1、CDH概览CDH(ClouderaDistributionofApacheHadoop)是ApacheHadoop和相关项目中最完整、经过测试和流行的发行版。CDH提供Hadoop的核心元素,可伸缩存储和可扩展分布式计算,以及基于web的用户界面和关键的企业功能。CDH是apache授权的开放源码,是惟一提供统一批处理、交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解
分类:
其他好文 时间:
2020-09-17 16:53:39
阅读次数:
33
YARN YARN是Hadoop 2.0中的资源管理系统,它的基本设计思想是将MRv1中的JobTracker拆分成了两个独立的服务:一个全局的资源管理器ResourceManager和每个应用程序特有的ApplicationMaster。其中ResourceManager负责整个系统的资源管理和分 ...
分类:
其他好文 时间:
2020-09-17 14:19:46
阅读次数:
28
HDFS-硬盘文件分布式公链骤然崛起你知道吗?随着数字内容的增长,数据指数不断的增长。面对海量的数据,传统的存储缺点也越来越明显,如扩展性差、单点故障等。为了克服上述缺点,满足海量数据的存储需求,市场上出现了分布式存储技术。分布式存储的兴起与互联网的发展密不可分,互联网公司由于其数据量大而资本积累少,而通常都使用大规模分布式存储系统。现阶段互联网技术以及硬件的发展,分布式系统的出现、演变一直未曾止
分类:
其他好文 时间:
2020-09-17 13:56:22
阅读次数:
24
HDFS-硬盘文件分布式公链骤然崛起你知道吗?随着数字内容的增长,数据指数不断的增长。面对海量的数据,传统的存储缺点也越来越明显,如扩展性差、单点故障等。为了克服上述缺点,满足海量数据的存储需求,市场上出现了分布式存储技术。分布式存储的兴起与互联网的发展密不可分,互联网公司由于其数据量大而资本积累少,而通常都使用大规模分布式存储系统。现阶段互联网技术以及硬件的发展,分布式系统的出现、演变一直未曾止
分类:
其他好文 时间:
2020-09-17 13:56:08
阅读次数:
27
当运行中出现Container is running beyond physical memory这个问题出现主要是因为物理内存不足导致的,在执行mapreduce的时候,每个map和reduce都有自己分配到内存的最大值,当map函数需要的内存大于这个值就会报这个错误,解决方法: 在mapredu ...
分类:
其他好文 时间:
2020-09-17 13:31:24
阅读次数:
39
比DCEP还火的国民级区块链应上线,HDFS值多少钱?近期我们建设银行对央行数字货币DCEP进行公测的消息刷屏整个行业,让从业者亢奋不已。国家数字货币的发行,对于区块链行业而言无疑是巨大的利好,意味着数字货币本身的具有实用性也意味着区块链行业马上迎来大爆发。DCEP一旦上线,无疑是一个国民级的区块链技术应用,但是在DCEP之前,有潜力成为国民级别的区块链应用的还有不少,比如说HDFS,这是有一款主
分类:
其他好文 时间:
2020-09-16 12:25:09
阅读次数:
28
hadoop的RPC基本概念: 1,RPC(Remote Procedure Call Protocol)--远程过程调用协议,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信 ...
分类:
其他好文 时间:
2020-09-16 12:21:20
阅读次数:
33
一、过程 1、修改配置文件 vim etc/hadoop/hdfs-site.xml <property> <name>dfs.datanode.data.dir</name> <value>file:///${hadoop.tmp.dir}/dfs/data1,file:///${hadoop.t ...
分类:
其他好文 时间:
2020-09-15 21:01:05
阅读次数:
37