#Hadoop 分布式计算平台,同时也是一个生态圈 hadoop 1.X HDFS+MapReducer+Common hadoop 2.X HDFS+MAP+Reducer+Common hadoop 3.X java7->java8,引入纠删码,重写shell脚本,支持超过两个NameNode, ...
分类:
其他好文 时间:
2021-04-27 15:04:12
阅读次数:
0
原文链接:https://www.cnblogs.com/zsql/ 本篇主要对hadoop命令和hdfs命令进行阐述,yarn命令会在之后的文章中体现 hadoop fs命令可以用于其他文件系统,不止是hdfs文件系统内,也就是说该命令的使用范围更广可以用于HDFS、Local FS等不同的文件系 ...
分类:
其他好文 时间:
2021-04-26 13:47:48
阅读次数:
0
实时数据 →文件系统(Linux文件系统、HDFS等) →Hive 导入到hive,Load。(转成相应的hive表,导入后可直接使用HiveSQL查询) hive的内容分两部分:元数据、数据。 其中数据是存在HDFS中,元数据存在mysql中。 Hive数据仓库 Hive/mysql/HDFS关系 ...
分类:
其他好文 时间:
2021-04-26 13:27:01
阅读次数:
0
什么是mycat 1、一个彻底开源的,面向企业应用开发的大数据库集群 2、支持事务、ACID、可以替代MySQL的加强版数据库 3、一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群 4、一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQL Server 5、结合传 ...
分类:
数据库 时间:
2021-04-24 13:26:20
阅读次数:
0
Information & Data Overview - Essential Project Documentation https://enterprise-architecture.org/docs/information_architecture/information_and_data_o ...
分类:
Web程序 时间:
2021-04-22 16:18:10
阅读次数:
0
HDFS缓存 集中式缓存管理,由Datanode堆外内存组成,Namenode统一管理 优点: 阻止频繁使用的数据从内存中删除 由于是Namenode统一管理,因此在读可以根据情况调度,提高读性能 客户端可以通过零拷贝技术直接读取缓存数据 提高集群内存利用率,读某个文件的时候会将 解决步骤 查看是否 ...
分类:
其他好文 时间:
2021-04-14 12:00:19
阅读次数:
0
内容简介 当使用Elasticsearch做为“大时间”的数据分析的时候,建议使用时间作为索引,并设置三种不同类型的节点(主、热、温),也就是我们说的「Hot-Warm」架构。 本文介绍了「Hot-Warm」架构的一些基本概念、要注意的一些问题、如何搭建集群。 节点类型 每个节点都有他们自己的作用, ...
分类:
其他好文 时间:
2021-04-12 12:30:53
阅读次数:
0
sentry缺点: 1、组件只支持hive、hdfs、impala 不支持hbase,stome等 show roles; create role admin_zr; 0: jdbc:hive2://cbp5.chinaoly.com:10000/> grant all on server serv ...
分类:
其他好文 时间:
2021-04-06 14:49:20
阅读次数:
0
学习过得技术 HDFS YARN MR HIVE HBASE SPARK SPARK(sparkCore、sparkSql、sparkStreaming) HDFS 数据库管理、 存磁盘 Ha模式(在zookeeper之上) 联邦机制(把大象装进冰箱) split切片 Hbase 列式数据库 半结构 ...
分类:
其他好文 时间:
2021-04-05 12:37:34
阅读次数:
0
hdfs会为每一个用户创建一个回收站目录:/usr用户名/.Trash/,每一个用户在Shell命令行删除的文件/目录,会进入到对应的回收站目录中,在回收站中的数据都有一个生命周期,也就是说当回收站中的文件/目录在一段时间之内没有被用户恢复的话,HDFS就会自动将这个文件/目录彻底删除。 默认情况下 ...
分类:
其他好文 时间:
2021-04-05 12:30:22
阅读次数:
0