Hadoop的官方案例都在mapreduce.jar文件夹中,提供了mapreduce的基本功能,可用于计算,eg:pi值,计算文档中的字数等 官方案例都在 hadoop-mapreduce-examples-2.7.3.jar 这个jar包中。 命令:hadoop jar ./hadoop-2.7 ...
分类:
其他好文 时间:
2020-04-24 01:40:56
阅读次数:
107
1. 下载wordcount jar 文件 下载文件夹放置你的目录: https://github.com/yjy24/bigdata_learning/blob/master/hadoopMapRedSimple.zip 2. 启动 hadoop 管理员身份运行window cmd: 启动 Had ...
大概的流程具体如下: 1、修改主机名 2、关闭防火墙 3、安装JDK并配置环境变量 4、安装Hadoop并配置环境变量 上面每个流程的具体操作如下: 一、修改主机名 1、修改主机名 根目录下输入如下代码: vim etc/hostname 然后把当前的主机名改掉,我改成了hadoop 2、修改lin ...
分类:
其他好文 时间:
2020-04-23 19:08:09
阅读次数:
57
为避免因自然灾害等意外情况而导致的本地数据丢失情况,异地数据容灾也是企业数据保护的一大常见命题。Ucahe备份呢支持通过远程复制技术,将本地数据同步到异地,实现异地数据保护。一站式的web管理,支持增量,差异,永久,定时,多副本等30多项功能列表,8项灾备技术,3款产品,满足企业不同场景的数据备份需求,帮助企业实现小时级、分钟级、秒级RTO/RPO目标,高效率,低成本,操作简单,Ucahe采用首次
分类:
其他好文 时间:
2020-04-23 16:20:09
阅读次数:
85
一、Kafka介绍 Kafka是一个开源的分布式消息引擎/消息中间件,同时Kafka也是一个流处理平台。Kakfa支持以发布/订阅的方式在应用间传递消息,同时并基于消息功能添加了Kafka Connect、Kafka Streams以支持连接其他系统的数据(Elasticsearch、Hadoop等 ...
分类:
系统相关 时间:
2020-04-23 12:02:24
阅读次数:
86
ZooKeeper 简介 ZooKeeper 是一个分布式的、开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。Zoo ...
分类:
其他好文 时间:
2020-04-22 16:49:02
阅读次数:
66
import org.apache.hadoop.hbase.io.ImmutableBytesWritable import org.apache.hadoop.hbase.mapreduce.TableOutputFormat import org.apache.hadoop.hbase.cli ...
分类:
其他好文 时间:
2020-04-22 09:54:55
阅读次数:
108
import org.apache.hadoop.hbase.HBaseConfiguration import org.apache.hadoop.hbase.mapreduce.TableInputFormat import org.apache.hadoop.hbase.util.Bytes ...
分类:
其他好文 时间:
2020-04-22 09:16:07
阅读次数:
55
一:自定义数据类 为什么需要自定义数据类 上一篇文章里面我们自己写了一个mapreduce 里面的Top N的https://www.cnblogs.com/wuxiaolong4/p/12733518.html,我们可以从代码里面看出来,里面用|作分隔符,这种方法不好,会由于你自己的失误导致读取字 ...
分类:
其他好文 时间:
2020-04-19 23:46:13
阅读次数:
104
1. Java Download the Java 1.8 64 bit version from https://java.com/en/download/ If not 64 bit java there will be error when start resource node manage ...