1. 简要介绍 HBase 是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的 BigTable 建模,实现的编程语言为 Java。它是 Apache 软件基金会的 Hadoop 项目的一部分,运行于 HDFS 文件系统之上,为 Hadoop 提供类似于 BigTable 规模的服务,可 ...
分类:
其他好文 时间:
2020-07-26 01:59:15
阅读次数:
89
NoSQL 有分很多种,其中key-value NoSQL (Redis, MemcacheD, etc) 的选用相对比较清楚些,大多是当后端Data storage的cache层来用。这篇主要想请教Column Family NoSQL (e.g. Cassandra, Hbase) 和SQL之间 ...
分类:
数据库 时间:
2020-07-24 15:31:56
阅读次数:
77
数据库: 本质上就是一个文件系统,通过标准的sql语句对数据进行增删改查(curd)操作 数据库类型: 关系型数据库: 存放实体与实体间关系的数据库,本质上为二维表(mysql、oracle、sql server、DB2) 非关系型数据库: 存放的是对象(redis、No-sql、Hbase、Mon ...
分类:
数据库 时间:
2020-07-24 09:27:08
阅读次数:
94
数据 ROW COLUMN+CELL 1001 column=info:name, timestamp=1502368030841, value=张三 1001 column=info:age, timestamp=1502368069926, value=18 1001 column=info:s ...
分类:
Web程序 时间:
2020-07-23 01:46:26
阅读次数:
108
引用的jar包(maven) <properties> <java.version>1.8</java.version> <ch.qos.logback.version>1.2.3</ch.qos.logback.version> <sharding-sphere.version>4.1.1</sh ...
分类:
编程语言 时间:
2020-07-21 21:58:23
阅读次数:
74
详情见图 etl_bst_agg_zw_tkt_model_d.py 支持传递时间参数,不传递时,默认调度昨天的数据 如:python etl_bst_agg_zw_tkt_model_d.py 20200101 20200102 调度20200101这一天的数据 python etl_bst_ag ...
分类:
编程语言 时间:
2020-07-20 13:26:11
阅读次数:
135
操作步骤 1)TmpBstAggZwTktModelD 按天读取Mysql表数据bst_agg_zw_tkt_model_d,存入hive临时表tmp_bst_agg_zw_tkt_model_d(临时表采用txt格式,按年月日进行分区) 2)HiveBstAggZwTktModelD 连接hive ...
分类:
数据库 时间:
2020-07-20 13:08:14
阅读次数:
129
jdk的安装 上传jdk的安装包到linux中 解压、更名 [root@qianfeng01 software]# tar -zxvf jdk-8u221-linux-x64.tar.gz -C /usr/local/ [root@qianfeng01 software]# cd /usr/loca ...
分类:
其他好文 时间:
2020-07-19 17:54:49
阅读次数:
72
1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1。 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP 说明 hadoop01 10.0.0.10 DataNode、NodeManager、NameNode hadoop02 10.0.0 ...
分类:
其他好文 时间:
2020-07-19 16:31:06
阅读次数:
63
ElasticSearch之介绍 一 Elasticsearch产生背景 1.1 大规模数据如何检索 如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(mysql、oracle、mongodb、hbase…) 2)如何解决单点故障 ...
分类:
其他好文 时间:
2020-07-18 22:29:18
阅读次数:
436