搜索关键字：hadoop hdfs命令，搜索到13969个结果！码迷,mamicode.com！

配置文件说明

默认配置文件要获取的默认配置文件文件存放在Hadoop的jar包中的位置自定义配置文件[etc/hadoop]中 [core-default.xml] hadoop-common-2.10.0.jar/core-default.xml [core-site.xml] [hdfs-default ...

分类：其他好文时间：2020-06-22 12:33:23 阅读次数：48

[AWS][大数据][Hadoop] 使用EMR做大数据分析

实验包括：1.使用EMR创建Hadoop集群2.定义schema，创建示例表。3.通过HiveQL分析数据，并将分析结果保存到S3上4.下载已经分析结果数据。Task1：创建一个S3桶创建一个存储桶比如hadoop202006…Task2：创建EMR集群这里我解释一下Hadoop集群中的一些组件，了解大数据的同学直接忽略就好。ApacheHadoop：在分布式服务器集群上存储海量数据并运行分布式分

分类：其他好文时间：2020-06-22 09:17:08 阅读次数：174

hadoop组成

1.x MapReduce：计算+调度 HDFS：数据存储 Common：辅助工具 2.x MapReduce：计算 Yarn：资源调度 HDFS：数据存储 Common：辅助工具 ...

分类：其他好文时间：2020-06-21 23:45:14 阅读次数：83

hadoop

Hadoop 分布式系统基础结构海量数据存储，海量数据计算 Hadoop指的是Hadoop生态圈 Google=》Hadoop GFS->HDFS Map-Reduce->MR BigTable->HBase Hadoop发行版本 Apache：最基础 Cloudera：大型互联网企业 Horto ...

分类：其他好文时间：2020-06-21 23:10:42 阅读次数：63

Apache Hudi：云数据湖解决方案

1. 引入开源Apache Hudi项目为Uber等大型组织提供流处理能力，每天可处理数据湖上的数十亿条记录。随着世界各地的组织采用该技术，Apache开源数据湖项目已经日渐成熟。 Apache Hudi（Hadoop Upserts Deletes and Incrementals）是一个数据 ...

分类：Web程序时间：2020-06-21 13:52:56 阅读次数：166

Hadoop

一、概述 1.Hadoop 是 Apache提供的开源的、可靠的、可扩展的，用于分布式计算的框架 2.Hadoop 除了官网提供的发行版本以外，各大厂商也提供了发行版：Cloudera的CDH、华为的HDP 二、发展 1.创始人：Doug Cutting和Mike Cafarella 2.在2002 ...

分类：其他好文时间：2020-06-21 13:27:38 阅读次数：141

Hadoop【MR的分区、排序、分组】

一.分区问题：按照条件将结果输出到不同文件中自定义分区步骤 1.自定义继承Partitioner类，重写getPartition()方法 2.在job驱动Driver中设置自定义的Partitioner 3.在Driver中根据分区数设置reducetask数分区数和reducetask关系 ...

分类：编程语言时间：2020-06-21 11:32:34 阅读次数：65

大数据期末复习重点

1.Hadoop平台: 1.理论概念:结构组成: 1. HDFS分布式文统.2.MapReduce计算大数据. 3Yarn任务调度与资源管理. 2. 伪分布式环境搭建: 网络配置: 配置网卡信息: vi /etc/sysconfig/network 配置主机的虚拟域名: vi /etc/hosts ...

分类：其他好文时间：2020-06-21 11:26:51 阅读次数：96

想了解大数据的鼻祖Hadoop技术栈，这里有一份优质书单推荐！

? 如何用形象的比喻描述大数据的技术生态？Hadoop、Hive、Spark 之间是什么关系？对于大部分人来说都是傻傻分不清楚。今年来大数据、人工智能获得了IT界大量的关注。如果一个企业不玩大数据，都不好意思说自己是在IT圈混的。我敢打赌，你在中关村西二旗地铁站溜一圈，保准你会听到如下名词：Had ...

分类：其他好文时间：2020-06-20 23:54:38 阅读次数：100

使用linux脚本shell检查大数据各节点服务是否运行正常

脚本通过ssh检查大数据环境中各节点的相关实例是否运行正常，包括：zk、hadoop-ha、hdfs、yarn、hbase、hive-metastore、hiveserver2、kafka。注意修改成自己的集群节点名称及kafka版本 #!/bin/bash # 定义机器名前缀 HN_PREFIX ...

分类：系统相关时间：2020-06-20 16:44:49 阅读次数：68

共13969条上一页 1 ... 36 37 38 39 40 ... 1397 下一页

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)