搜索关键字：hdf，搜索到476个结果！码迷,mamicode.com！

Sqoop的数据导入

1. 列举出所有的数据库命令行查看帮助 sqoop help 列出hadoop02主机所有的数据库 sqoop list-databases --connect jdbc:mysql://hadoop02:3306/ --username root --password 123456 查看某一个数 ...

分类：其他好文时间：2021-06-18 19:33:43 阅读次数：0

hadoop 启动dfs失败（but there is no HDFS_NAMENODE_USER defined）

https://blog.csdn.net/linuxvfast/article/details/93720931 在Hadoop安装目录下找到sbin文件夹在里面修改四个文件对于start-dfs.sh和stop-dfs.sh文件，添加下列参数： #!/usr/bin/env bash HDF ...

分类：其他好文时间：2021-05-24 06:40:05 阅读次数：0

hadoop 集群崩溃操作办法

杀死进程 $HADOOP_HOME/sbin/stop-yarn.sh $HADOOP_HOME/sbin/stop-dfs.sh 删除所有节点 hadoop 根目录下的 data 和 logs rm -rf data/ logs/ 格式化在 hadoop 根目录下执行 hdfs namenode ...

分类：其他好文时间：2021-03-06 14:35:10 阅读次数：0

Spark executor中task的数量与最大并发数

每个task处理一个partition，一个文件的大小/128M就是task的数量 Task的最大并发数当task被提交到executor之后，会根据executor可用的cpu核数，决定一个executor中最多同时运行多少个task。默认情况下一个task对应cpu的一个核。如果一个exec ...

分类：其他好文时间：2021-02-02 11:14:58 阅读次数：0

Hive中的UDF详解

hive作为一个sql查询引擎，自带了一些基本的函数，比如count(计数)，sum(求和)，有时候这些基本函数满足不了我们的需求，这时候就要写hive hdf(user defined funation)，又叫用户自定义函数。 UDF 创建与使用步骤继承org.apache.hadoop.hiv ...

分类：其他好文时间：2020-12-25 13:07:42 阅读次数：0

大数据平台建设 —— SQL查询引擎之Presto

大数据查询引擎Presto简介SQLonHadoop：Hive的出现让技术人员可以通过类SQL的方式对批量数据进行查询，而不用开发MapReduce程序MapReduce计算过程中大量的中间结果磁盘落地使运行效率较低为了提高SQLonHadoop的效率，各大工具应运而生，比如Shark、Impala等SQLonHadoop的常见工具：Presto是什么：Presto是由Facebook开发的分布式

分类：数据库时间：2020-11-21 12:01:11 阅读次数：8

Checkpointing

上级：https://www.cnblogs.com/hackerxiaoyon/p/12747387.html 每个函数和算子都可以有状态在flink中。状态的函数存储数据通过独立的元素或事件处理。为了让状态具有容错性，flink需要把状态进行快照。检查点允许flink恢复状态和位置在流中，从而是 ...

分类：其他好文时间：2020-10-29 09:52:49 阅读次数：16

【BAT面试通关手册】覆盖Java相关29个技能，学完之后吊打面试官！

这是一份涵盖了Java相关29个技能的Java架构进阶学习资料,绝对是全网最好全完整的一个学习文档资料了。下面给大家介绍一下这份【BAT面试手册】都有哪些知识点的详细解析。需要领取完整版的老铁请转发+关注，然后添加我的VX（tkzl6666）获得免费领取方式! 1、JVM 线程 JVM内存区域 J ...

分类：编程语言时间：2020-10-16 10:27:24 阅读次数：24

flume安装与使用

1.flume简介 Flume是Cloudera提供的日志收集系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 2.安装和使用说明 ...

分类：Web程序时间：2020-08-13 22:07:34 阅读次数：83

YARN

Yarn资源调度器 Yarn是一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而MapReduce等运算程序则相当于运行于操作系统之上的应用程序。 Yarn基本架构 YARN主要由ResourceManager、NodeManager、ApplicationMas ...

分类：其他好文时间：2020-07-26 23:11:08 阅读次数：88

共476条 1 2 3 4 ... 48 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)