一、引言 HBase由于其存储和读写的高性能,在OLAP即时分析中越来越发挥重要的作用,在易观精细化运营产品 易观方舟也有广泛的应用。作为Nosql数据库的一员,HBase查询只能通过其Rowkey来查询(Rowkey用来表示唯一一行记录),Rowkey设计的优劣直接影响读写性能。HBase中的数据 ...
分类:
其他好文 时间:
2020-05-19 10:33:51
阅读次数:
84
MongoDB / ElasticSearch: 文档数据库一般用类JSON格式存储数据,存储的内容是文档型的 HBase: 按列存储数据的。最大特点是方便存储结构化和半结构化数据,方便做数据压缩,针对某一列或某几列的查询有非常大的I/O优势,适合于批量数据处理和即时查询。 Redis: 通过key ...
分类:
其他好文 时间:
2020-05-18 18:31:48
阅读次数:
59
1.解压 unZip pdi-ce-9.0.0.0-423.zip -d ~/soft/kettle 2.运行 sh spoon.sh 3.连接mysql数据库需要相应版本的驱动jar包 放在kettle/lib目录下 jar包集合下载:https://mvnrepository.com/artif ...
分类:
系统相关 时间:
2020-05-17 13:04:32
阅读次数:
250
原文地址:https://www.cnblogs.com/frankdeng/p/9310278.html 一、系统架构 注意:应该是每一个 RegionServer 就只有一个 HLog,而不是一个 Region 有一个 HLog。 从HBase的架构图上可以看出,HBase中的组件包括Clien ...
分类:
其他好文 时间:
2020-05-13 20:40:22
阅读次数:
84
https://www.bilibili.com/video/av83930526/ https://blog.csdn.net/yuanbingze/article/details/51891222 ...
分类:
其他好文 时间:
2020-05-13 12:28:00
阅读次数:
56
前言: 本文详细介绍了 HBase QualifierFilter 过滤器 Java&Shell API 的使用,并贴出了相关示例代码以供参考。QualifierFilter 基于列名进行过滤,在工作中涉及到需要通过HBase 列名进行数据过滤时可以考虑使用它。比较器细节及原理请参照之前的更文: " ...
分类:
其他好文 时间:
2020-05-13 10:03:15
阅读次数:
61
kettle同步数据,从mysql到sqlServer中,MySQL中的时间字段为timestamp类型,sqlserver中的数据列数据类型为timestamp类型,但是二者同步的时候会发生错误,报错:然后试图将sqlServer中的timestamp字段类型修改为datatime类型,执行语句:... ...
分类:
数据库 时间:
2020-05-12 17:23:34
阅读次数:
251
1、读取Mysql数据 object JdbcRddDemo { def getConn() = { Class.forName("com.mysql.jdbc.Driver").newInstance() DriverManager.getConnection("jdbc:mysql://hado ...
分类:
数据库 时间:
2020-05-10 17:31:37
阅读次数:
97
在弄清楚这个问题之前,我们先了解一下什么是分布式的CAP定理。 根据百度百科的定义,CAP定理又称CAP原则,指的是在一个分布式系统中,Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),最多只能同时三个特性中的两个,三者不可 ...
分类:
其他好文 时间:
2020-05-10 12:35:44
阅读次数:
235
JDBC 以MySQL为例 读取 import java.sql.DriverManager import org.apache.spark.rdd.JdbcRDD import org.apache.spark.{SparkConf, SparkContext} /** * Author atgu ...
分类:
数据库 时间:
2020-05-09 23:21:09
阅读次数:
86