码迷,mamicode.com
首页 >  
搜索关键字:ansible playbook hadoop    ( 16441个结果
centos搭建LAMP环境
只是为了记录一下,出处看最后 一,安装 apache 1,安装 apache [hadoop@YunMaster ~]$ sudo yum -y install httpd httpd-manual mod_ssl mod_perl mod_auth_mysql 2,启动 apache [hadoo ...
分类:其他好文   时间:2020-06-22 22:39:34    阅读次数:66
Hadoop dfs目录
dfs目录位置由core-site.xml文件中 hadoop.tmp.dir 属性决定 :hadoop.tmp.dir属性对应值/dfs 1.dfs目录是在NameNode被格式化的时候产生的 格式化:首先在停止hadoop之后,删除 hadoop.tmp.dir 属性对应值目录下的所有文件后,执 ...
分类:其他好文   时间:2020-06-22 12:36:38    阅读次数:145
配置文件说明
默认配置文件 要获取的默认配置文件 文件存放在Hadoop的jar包中的位置 自定义配置文件[etc/hadoop]中 [core-default.xml] hadoop-common-2.10.0.jar/core-default.xml [core-site.xml] [hdfs-default ...
分类:其他好文   时间:2020-06-22 12:33:23    阅读次数:48
[AWS][大数据][Hadoop] 使用EMR做大数据分析
实验包括:1.使用EMR创建Hadoop集群2.定义schema,创建示例表。3.通过HiveQL分析数据,并将分析结果保存到S3上4.下载已经分析结果数据。Task1:创建一个S3桶创建一个存储桶比如hadoop202006…Task2:创建EMR集群这里我解释一下Hadoop集群中的一些组件,了解大数据的同学直接忽略就好。ApacheHadoop:在分布式服务器集群上存储海量数据并运行分布式分
分类:其他好文   时间:2020-06-22 09:17:08    阅读次数:174
hadoop组成
1.x MapReduce:计算+调度 HDFS:数据存储 Common:辅助工具 2.x MapReduce:计算 Yarn:资源调度 HDFS:数据存储 Common:辅助工具 ...
分类:其他好文   时间:2020-06-21 23:45:14    阅读次数:83
hadoop
Hadoop 分布式系统基础结构 海量数据存储,海量数据计算 Hadoop指的是Hadoop生态圈 Google=》Hadoop GFS->HDFS Map-Reduce->MR BigTable->HBase Hadoop发行版本 Apache:最基础 Cloudera:大型互联网企业 Horto ...
分类:其他好文   时间:2020-06-21 23:10:42    阅读次数:63
运维简介&Ansible详解
1. 运维工作简介 1.1 运维简述 1.1.1 运维工作 运维工作的核心任务: 发布、变更、故障处理 系统安装(物理机、虚拟机)--> 程序包安装、配置、服务启动 --> 批量操作 --> 程序发布 --> 监控 系统安装(物理机、虚拟机) 程序安装、配置、服务启动 批量操作(批量运行命令) 程序 ...
分类:其他好文   时间:2020-06-21 15:57:03    阅读次数:47
Apache Hudi:云数据湖解决方案
1. 引入 开源Apache Hudi项目为Uber等大型组织提供流处理能力,每天可处理数据湖上的数十亿条记录。 随着世界各地的组织采用该技术,Apache开源数据湖项目已经日渐成熟。 Apache Hudi(Hadoop Upserts Deletes and Incrementals)是一个数据 ...
分类:Web程序   时间:2020-06-21 13:52:56    阅读次数:166
Hadoop
一、概述 1.Hadoop 是 Apache提供的开源的、可靠的、可扩展的,用于分布式计算的框架 2.Hadoop 除了官网提供的发行版本以外,各大厂商也提供了发行版:Cloudera的CDH、华为的HDP 二、发展 1.创始人:Doug Cutting和Mike Cafarella 2.在2002 ...
分类:其他好文   时间:2020-06-21 13:27:38    阅读次数:141
Hadoop【MR的分区、排序、分组】
一.分区 问题:按照条件将结果输出到不同文件中 自定义分区步骤 1.自定义继承Partitioner类,重写getPartition()方法 2.在job驱动Driver中设置自定义的Partitioner 3.在Driver中根据分区数设置reducetask数 分区数和reducetask关系 ...
分类:编程语言   时间:2020-06-21 11:32:34    阅读次数:65
16441条   上一页 1 ... 50 51 52 53 54 ... 1645 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!