码迷,mamicode.com
首页 >  
搜索关键字:HDFS    ( 4980个结果
hadoop
Hadoop 分布式系统基础结构 海量数据存储,海量数据计算 Hadoop指的是Hadoop生态圈 Google=》Hadoop GFS->HDFS Map-Reduce->MR BigTable->HBase Hadoop发行版本 Apache:最基础 Cloudera:大型互联网企业 Horto ...
分类:其他好文   时间:2020-06-21 23:10:42    阅读次数:63
入门大数据---Hive分区表和分桶表
Hive分区表和分桶表 一、分区表 1.1 概念 Hive 中的表对应为 HDFS 上的指定目录,在查询数据时候,默认会对全表进行扫描,这样时间和性能的消耗都非常大。 分区为 HDFS 上表目录的子目录,数据按照分区存储在子目录中。如果查询的 where 字句的中包含分区条件,则直接从该分区去查找, ...
分类:其他好文   时间:2020-06-21 16:22:24    阅读次数:55
大数据期末复习重点
1.Hadoop平台: 1.理论概念:结构组成: 1. HDFS分布式文统.2.MapReduce计算大数据. 3Yarn任务调度与资源管理. 2. 伪分布式环境搭建: 网络配置: 配置网卡信息: vi /etc/sysconfig/network 配置主机的虚拟域名: vi /etc/hosts ...
分类:其他好文   时间:2020-06-21 11:26:51    阅读次数:96
使用linux脚本shell检查大数据各节点服务是否运行正常
脚本通过ssh检查大数据环境中各节点的相关实例是否运行正常,包括:zk、hadoop-ha、hdfs、yarn、hbase、hive-metastore、hiveserver2、kafka。 注意修改成自己的集群节点名称及kafka版本 #!/bin/bash # 定义机器名前缀 HN_PREFIX ...
分类:系统相关   时间:2020-06-20 16:44:49    阅读次数:68
ClickHouse大数据分析技术与实战
ClickHouse大数据分析技术与实战课程课程基于ClickHouse的最新的20.x版本,从理论到实践,由浅入深详解ClickHouse的原理和使用。本课程从零开始,有Linux操作系统和SQL使用经验即可。课程以案例驱动,包含大量的实践案例。将ClickHouse与MySQL、Kafka、HDFS等第三方系统集成,增强ClickHouse的功能。课程覆盖面广,既有基础功能的详细讲解,也包含了
分类:其他好文   时间:2020-06-18 17:49:42    阅读次数:113
ClickHouse大数据分析技术与实战
ClickHouse大数据分析技术与实战课程课程基于ClickHouse的最新的20.x版本,从理论到实践,由浅入深详解ClickHouse的原理和使用。本课程从零开始,有Linux操作系统和SQL使用经验即可。课程以案例驱动,包含大量的实践案例。将ClickHouse与MySQL、Kafka、HDFS等第三方系统集成,增强ClickHouse的功能。课程覆盖面广,既有基础功能的详细讲解,也包含了
分类:其他好文   时间:2020-06-18 16:18:50    阅读次数:65
分布式文件系统HDFS
1、HDFS(Hadoop Distributed File System)是一个分布式文件系统,具有良好的扩展性、容错性以及易用的API。它的核心思想是将文件切分成等大的数据块,以多副本的形式存储到多个节点上。HDFS采用了经典的主从软件架构,其中主服务被称为NameNode,管理文件系统的元信息 ...
分类:其他好文   时间:2020-06-18 14:33:17    阅读次数:67
hadoop的参数调优
1,在hdfs-site.xml 中配置多目录,提前配置好,以免以后要配置时,需要重启集群。 2,namenode 有一个工作线程池,用来处理不同的datanode的并发心跳和客户端访问并发请求。配置dfs.namenode.handler.count=20 * log2(Cluster Size) ...
分类:其他好文   时间:2020-06-16 13:33:15    阅读次数:64
Hadoop面试题2020
元数据更新过程? MapReduce的Shuffle过程? HDFS的读的流程? HDFS写的流程? 如何将hadoop配置文件从一台机器同步到另一台机器上? scp -r hadoop-2.7.3 hpsk@192.168.134.222:/opt/modules/ 如何终止yarn上正在运行的程 ...
分类:其他好文   时间:2020-06-15 23:20:15    阅读次数:144
大数据 week2 Hadoop and HDFS
https://www.cse.unsw.edu.au/~cs9313/20T2/slides/L2.pdf https://drive.google.com/drive/folders/13_vsxSIEU9TDg1TCjYEwOidh0x3dU6es 第二节课花了40分钟讲,如果dataNode ...
分类:其他好文   时间:2020-06-15 18:02:14    阅读次数:50
4980条   上一页 1 ... 19 20 21 22 23 ... 498 下一页
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!