1.词频统计 a.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 b.编写map与reduce函数 c.本地测试map和reduce d.将文本数据上传到HDFS上 e.用hadoop streaming提交任务 f.查看运行结果 g.计算结果取回本地 ...
分类:
其他好文 时间:
2020-11-07 16:36:45
阅读次数:
33
1.下载喜欢的电子书或大量文本数据,并保存在本地文件夹中 2.编写map与reduce函数 3.本地测试map与reduce 4.将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:
其他好文 时间:
2020-11-07 16:32:22
阅读次数:
17
1.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中 2编写map与reduce函数 3本地测试map与reduce 4将文本数据上传至HDFS上 5.用hadoop streaming提交任务 6.查看运行结果 7.计算结果取回到本地 ...
分类:
其他好文 时间:
2020-11-07 16:17:20
阅读次数:
18
将.txt格式文件插入Hbase中,代码如下 package addHbase; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.ap ...
分类:
其他好文 时间:
2020-11-06 02:49:19
阅读次数:
37
import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.hbase.*;import org.apache.hadoop.hbase.client.*;import org.apache.hadoop.hbase.ut ...
分类:
其他好文 时间:
2020-11-06 01:37:17
阅读次数:
15
知乎HBase实践前言HBase是一个基于Hadoop面向列的非关系型分布式数据库(NoSQL),设计概念来源于谷歌的BigTable模型,面向实时读写、随机访问大规模数据集的场景,是一个高可靠性、高性能、高伸缩的分布式存储系统,在大数据相关领域应用广泛.HBase系统支持对所存储的数据进行透明切分,从而使得系统的存储以及计算具有良好的水平扩展性.知乎从2017年起开始逐渐采用HBase系统存储各
分类:
其他好文 时间:
2020-11-06 01:07:32
阅读次数:
22
[default] callback_whitelist = profile_tasks # The best way I’ve found to time the execution of Ansible playbooks is by enabling the profile_tasks cal ...
分类:
其他好文 时间:
2020-11-04 19:01:00
阅读次数:
20
环境: 操作系统:ubuntu 12.10 64bit jdk:sun jdk 1.6 64bit hadoop:apache hadoop 1.02 hbase:apache hbase 0.92 先决条件:配置apache hadoop append,默认这个属性是false,需要设置为true ...
分类:
其他好文 时间:
2020-11-04 18:45:23
阅读次数:
16
可能是Hadoop hdfs mapreduce最亲民的介绍
分类:
其他好文 时间:
2020-10-30 13:03:28
阅读次数:
17
配置 slaves [xiaoran@hadoop102 hadoop-2.7.2]$ vim etc/hadoop/slaves 添加(注意:一定不能有多余的空格和空行) hadoop102 hadoop103 hadoop104 同步所有节点配置文件 [xiaoran@hadoop102 had ...
分类:
其他好文 时间:
2020-10-29 10:44:54
阅读次数:
27