搜索关键字：flume hdfs sink lzo 格式压缩，搜索到6349个结果！码迷,mamicode.com！

Flume实战案例

从端口读数据读取到本地文件 #1.给三个组件命名 a3.sources = r1 a3.channels = c1 a3.sinks = k1 #2.给source组件属性赋值 a3.sources.r1.type = avro a3.sources.r1.bind = hadoop102 a3.s ...

分类：Web程序时间：2020-12-14 12:51:33 阅读次数：7

Hive 操作与应用词频统计

一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop，启动hive 3.创建数据库，创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...

分类：其他好文时间：2020-12-10 11:39:01 阅读次数：12

Hive 操作与应用词频统计

一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop，启动hive 3.创建数据库，创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果二、hive用HDFS上的文件进行词频统计1.准备电子书或其它大的文本文 ...

分类：其他好文时间：2020-12-10 11:24:10 阅读次数：6

Hive 操作与应用词频统计

一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop，启动hive 3.创建数据库，创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...

分类：其他好文时间：2020-12-10 10:59:18 阅读次数：4

Hive 操作与应用词频统计

一、hive用本地文件进行词频统计 1.准备本地txt文件 2.启动hadoop，启动hive 3.创建数据库，创建文本表 4.映射本地文件的数据到文本表中 5.hql语句进行词频统计交将结果保存到结果表中。 6.查看统计结果二、hive用HDFS上的文件进行词频统计 1.准备电子书或其它大的文本 ...

分类：其他好文时间：2020-12-10 10:55:10 阅读次数：3

HADOOP之HDFS用idea操作(五)

使用idea操作HDFS、创建文件、上传文件、获取块信息、下载文件 1.搭建maven工程 2.pom依赖  <dependency> <groupI ...

分类：其他好文时间：2020-12-09 12:24:14 阅读次数：6

Flink实战（103）：配置（二）参数配置和常见参数调优

来源： 1 Flink 1.1 Flink参数配置 jobmanger.rpc.address jm的地址。 jobmanager.rpc.port jm的端口号。 jobmanager.heap.mb jm的堆内存大小。不建议配的太大，1-2G足够。 taskmanager.heap.mb tm的 ...

分类：其他好文时间：2020-12-09 12:04:30 阅读次数：4

HBase中Memstore存在的意义以及多列族引起的问题和设计

HBase在WAL机制开启的情况下，不考虑块缓存，数据日志会先写入HLog，然后进入Memstore，最后持久化到HFile中。HFile是存储在hdfs上的，WAL预写日志也是，但Memstore是在内存的 ...

分类：其他好文时间：2020-12-07 12:09:37 阅读次数：4

图解Spark系列：RDD的创建与执行

设计Spark程式过程中最初始的是创建RDD数据集，该数据集来自定义的源数据，当RDD数据集初始后，再通过算子对RDD数据集作转换生成后续的数据集。Spark中提供了多种创建RDD数据集的方法，比如：通过内存集合创建、或使用本地文件创建以及HDFS文件创建RDD数据集。最常见的是第三种方式，生产环境下通常会读取并基于HDFS上存储的数据来创建并进行离线批处理。典型的RDD创建流程为，通过输入算子（

分类：其他好文时间：2020-12-04 10:59:58 阅读次数：4

Hive的基本介绍

什么是Hive？ Hive：由Facebook开源用于解决海量结构化日志的数据统计工具。 Hive 是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将SQL转化成MapReduce程序。 1、Hive 处理的数据存储在HDFS； 2、Hiv ...

分类：其他好文时间：2020-12-03 11:43:46 阅读次数：3