文章目录 5.1 HBase简介 什么是HBase BigTable 面向列的数据库 什么是非结构化数据存储 HBase在Hadoop生态中的地位 HBase与HDFS HBase使用场景 5.1 HBase简介 1 什么是HBase HBase是一个分布式的、面向列的开源数据库 HBase是Goo ...
分类:
数据库 时间:
2021-01-19 12:02:43
阅读次数:
0
前言 Kafka 是一款分布式消息发布和订阅系统,具有高性能、高吞吐量的特点而被广泛应用与大数据传输场景。它是由 LinkedIn 公司开发,使用 Scala 语言编写,之后成为 Apache 基金会的一个顶级项目。kafka 提供了类似 JMS 的特性,但是在设计和实现上是完全不同的,而且他也不是 ...
分类:
编程语言 时间:
2021-01-19 11:48:43
阅读次数:
0
有序集合有两种编码方式:压缩列表 ziplist 和跳表 skiplist。 ...
分类:
其他好文 时间:
2021-01-16 12:09:10
阅读次数:
0
热身30题 1.描述一下HDFS的写流程 2.描述一下HDFS的读流程 3.详细讲解一下HDFS的体系结构 4.如果一个datanode出现宕机,恢复流程是什么样的? 5.通常你是如何解决Haddop的NameNode宕机的,流程是什么? 6.描述一下NameNode对元数据的管理 7.NameNo ...
分类:
其他好文 时间:
2021-01-14 10:47:06
阅读次数:
0
原文链接:https://blog.csdn.net/qq_26803795/article/details/106522611 文章目录 一、前言 二、内置分词器解析 2.1、内置分词器梳理 2.2、内置分词器对中文的局限性 三、安装IK分词器 3.1、下载IK分词器 3.2、编译源码包 3.3、 ...
分类:
其他好文 时间:
2021-01-12 10:47:41
阅读次数:
0
public static IFeatureClass FeatureToFeature(IFeatureClass SourFeature,IFeatureClass TargetFeature, List<ColumnInternationMapping> columnMapp,bool IsO ...
分类:
其他好文 时间:
2021-01-11 11:06:09
阅读次数:
0
什么是druid druid是一个为OLAP查询需求而设计的开源大数据系统,druid提供低延时的数据插入,实时的数据查询 druid使用Java开发,基于Jetty提供http rest服务,也提供了Java/Python等语言的工具包 druid是一个集群系统,使用zookeeper做节点管理和 ...
分类:
其他好文 时间:
2021-01-08 10:28:10
阅读次数:
0
Atlas 作用: 记录并展示Hive表字段含义,以及表和字段之间的数据血缘关系。 局限: 依赖HBase和solr。 Azkaban 作用: 实现任务流执行,满足任务间依赖关系。 局限: 任务能添加依赖的任务,但是不能传参数,任务流中任意一条路线断了,不能这条路线重启执行。 ...
分类:
其他好文 时间:
2021-01-07 12:23:38
阅读次数:
0
1.为什么安装Impala一定要先安装Hive? Impala是基于Hive的大数据实时分析查询引擎,直接使用Hive的元数据库Metadata,意味着impala元数据都存储在Hive的metastore中。 2.Impala与Hive的关系? Impala 与Hive都是构建在Hadoop之上的 ...
分类:
其他好文 时间:
2021-01-06 11:58:32
阅读次数:
0
所学时间(包括上课) 9个小时 代码量(行) 1300 博客量 1篇 了解到的知识点 centos虚拟机的安装以及 大数据相应所用的软件安装 以及环境的配置 ...
分类:
其他好文 时间:
2021-01-02 11:40:57
阅读次数:
0