1、轮询策略:按照消息尽量保证每个分区的负载,消息会均匀分布到每个partition。写入消息的时候,key为null的时候,默认使用的是轮询策略。 2、随机策略:不使用。 3、按key写入策略:key.hash()%分区的数量。 4、自定义分区策略:类似于mapReduce指定分区。 乱序问题: ...
分类:
其他好文 时间:
2021-07-26 16:34:25
阅读次数:
0
01.安装VMware,加载centos镜像软件。配置主机、VMware、Windows的IP地址。 02.hadoop中目录介绍:bin目录 hdfs 、mapred、 yarn 命令 etc目录包含hdfs 、mapred、 yarn 相关的配置文件 sbin 目录与集群相关的命令 share目 ...
分类:
其他好文 时间:
2021-04-29 11:57:44
阅读次数:
0
基于Hadoop的sqoop组件的部署 什么是 Sqoop Sqoop 是一款开源的工具,主要用于在 Hadoop(Hive)与传统的数据库(mysql、postgresql...) 间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres 等)中的 数据导 ...
分类:
其他好文 时间:
2021-04-26 13:03:24
阅读次数:
0
Docker Hadoop 配置常见错误及解决办法 问题1:wordcount运行卡住,hadoop 任务运行到running job就卡住了 INFO mapreduce.Job: Running job: job_.... 解决如下: 1. 修改mapred-site.xml配置,配置文件在Ha ...
分类:
其他好文 时间:
2021-04-20 14:54:20
阅读次数:
0
配置文件 mapred-site.xml 加入以下代码 <!-- 历史服务器端地址 --> <property> <name>mapreduce.jobhistory.address</name> <value>hadoop102:10020</value> </property> <!-- 历史服 ...
分类:
其他好文 时间:
2021-03-06 14:37:58
阅读次数:
0
vim sqoop-env.sh export HADOOP_HOME=/apps/hadoop export HADOOP_MAPRED_HOME=/apps/hadoop export HIVE_HOME=/apps/hive export ZOOKEEPER_HOME=/apps/zookee ...
分类:
其他好文 时间:
2021-03-02 12:20:39
阅读次数:
0
set hive.mapred.mode=nonstrict; 这是不严格模式,默认如此 对分区表进行查询,若在where子句中没有加分区的话,将禁止提交任务。 把属性值进行设置.默认值是没有开启的。默认是nonstrict 查看hive是否开启严格模式 set hive.mapred.mode 说 ...
分类:
其他好文 时间:
2021-01-26 12:44:54
阅读次数:
0
实验目的 ? 在 Linux(VM15pro/CentOS8) 环境下完成Hadoop-3.2.1伪分布式环境的搭建,并运行 Hadoop 自带的 WordCount 实例检测是否运行正常。 一、下载并配置java环境 ? Java 环境可选择 Oracle 的 JDK,或是 OpenJDK,现在一 ...
分类:
其他好文 时间:
2020-10-18 09:51:46
阅读次数:
25
Gartner:大数据宣传在商务智能市场成效不明显市场研究公司Gartner指出,去年的大数据宣传未能促进全球商务智能和分析市场出现快速增长。Gartner称,尽管商务智能和分析市场在2013年增长了8%,增长至144亿美元,但是涨幅低于预期。大数据通常指对来自社交网络、传感器等来源的海量非结构化信息进行的挖掘与分析,而传统的商务智能只是报告和分析结构化数据存储。Gartner分析师DanSomm
分类:
其他好文 时间:
2020-09-14 18:45:17
阅读次数:
22
自己学习Hadoop时,整理的资料,方便以后查看,希望能帮到大家,有什么问题欢迎大家指出 一、Hadoop是什么?其核心又是什么? Hadoop历史 雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜 ...
分类:
其他好文 时间:
2020-07-23 22:35:14
阅读次数:
65