码迷,mamicode.com
首页 >  
搜索关键字:ansible playbook hadoop    ( 16441个结果
奈学教育:Hadoop源码编译全流程分享
首先准备一个hadoop源码包,我选择的hadoop版本是:hadoop-2.7.7-src.tar.gz,在hadoop-2.7.7的源码包的根目录下有一个文档叫做BUILDING.txt,这其中说明了编译hadoop所需要的一些编译环境相关的东西。不同的hadoop版本的要求都不一样,对应的版本 ...
分类:其他好文   时间:2020-06-03 13:23:45    阅读次数:63
BMAAS PART 3: MULTI-TENANCY
There are currently 3 alternatives for configuring Multi-tenancy for baremetal in Ironic (ml2 drivers): networking-generic-switch ansible-networking v ...
分类:其他好文   时间:2020-06-03 10:39:53    阅读次数:142
初窥Ansible playbook
Ansible是一个系列文章,我会尽量以通俗易懂、诙谐幽默的总结方式给大家呈现这些枯燥的知识点,让学习变的有趣一些。 Ansible系列博文直达链接:Ansible入门系列 前言 在上一篇文章中说到Ansible有两种玩法,一种是Ansible Ad-Hoc,另一种是就是这里要说的playbook。 ...
分类:其他好文   时间:2020-06-03 00:23:46    阅读次数:72
HDFS基础(二)shell操作
Hadoop fs 命令分类: 1、本地-》HDFS: put(从本地文件系统中复制单个或多个源路径到目标文件系统) hadoop fs -put localfile /user/hadoop/hadoopfile copyFromLocal(和put命令相似) hadoop fs -copyFro ...
分类:系统相关   时间:2020-06-02 22:55:20    阅读次数:78
Hadoop之HDFS入门实战
一、HDFS优缺点 优点: 高容错性 数据自动保存多个副本 某一个副本丢失后,它可以自动恢复 适合处理大数据 数据规模,可以达到PB级 文件规模,能够处理百万规模的文件数量 可构建在廉价机器上,通过多副本保证可靠性 缺点: 不适合低延时数据访问 不适合对大量小文件进行存储 存储大量小文件,他会占用N ...
分类:其他好文   时间:2020-06-01 23:45:55    阅读次数:68
脚本启动集群 zookeeper , hadoop
1.在NameNode的一个节点下执行以下命令 #!/bin/bash for i in 192.168.1.101 192.168.1.102 192.168.1.103 do ssh $i "source /etc/profile;source ~/.bash_profile;/home/abb ...
分类:其他好文   时间:2020-06-01 13:34:08    阅读次数:62
Apache Avro 简介
一、引言 1、 简介 Avro是Hadoop中的一个子项目,也是Apache中一个独立的项目,Avro是一个基于二进制数据传输高性能的中间件。在Hadoop的其他项目中例如HBase(Ref)和Hive(Ref)的Client端与服务端的数据传输也采用了这个工具。Avro是一个数据序列化的系统,可以 ...
分类:Web程序   时间:2020-05-31 22:07:53    阅读次数:125
Ansible playbooks入门和编写规范、Ansible Playbooks常用模块介绍、常用模块集合
一、Playbooks框架与格式(三个主文件) 设置SSH免密码密钥认证(方便Ansible服务器端快捷连接目标服务器) 执行Playbooks 二、Ansible Playbooks常用模块介绍(模块在main.yml中使用) 1.File模块:在目标主机创建文件或目录,并赋予其系统权限 2.Co ...
分类:其他好文   时间:2020-05-31 21:33:10    阅读次数:138
sqoop数据迁移
1.1、概述 sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统; 导出数据:从Hadoop的文件系统中导出数据到关系数据库mysql等 1.2、sqoop1与 ...
分类:其他好文   时间:2020-05-31 19:30:40    阅读次数:69
第2天Python实战Spark大数据分析及调度-RDD编程
Spark提供的主要抽象是resilient distributed dataset(RDD) 弹性分布式数据集,它是跨集群节点划分的元素的集合,可以并行操作。通过从Hadoop文件系统(或任何其他Hadoop支持的文件系统)中的文件或驱动程序中现有的Scala集合开始并进行转换来创建RDD。用户还 ...
分类:编程语言   时间:2020-05-31 16:03:22    阅读次数:92
16441条   上一页 1 ... 59 60 61 62 63 ... 1645 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!