? 1. 场景描述 使用python连接greenplum或者postgresql。 2. 解决方案 2.1 真实代码 2.1.1 调用类 2.1.2 Gp数据库连接类 2.2 代码说明 (1)调用类中异常的返回比较特殊,只指定Exception的话,其他的几种异常还捕获不到。 (2)psycopg ...
分类:
数据库 时间:
2019-07-13 23:57:48
阅读次数:
367
Greenplum数据库集群 系统版本:Red Hat Enterprise Linux (RHEL5) ...
分类:
数据库 时间:
2019-07-12 12:53:03
阅读次数:
116
01,连接问题 首先解决连接是否成功,ping 相应的主机看返回是否是成功状态 02,激活失效的segment 03, 检测同步 04,恢复初始化状态 因为宕机一个主segment,镜像会激活另一个,并且成为主segment。运行gprecoverseg之后,主segment依旧没变化,失效的seg ...
分类:
其他好文 时间:
2019-07-11 17:35:44
阅读次数:
167
摘自《Greenplum企业应用实战》 重点: 使用gp_dist_random函数,将查询下发到每个Segement 创建查看子节点SQL运行状态视图 1)创建v_active_sql视图方便查看SQL create view v_active_sql as select pg_stat_acti ...
分类:
数据库 时间:
2019-07-04 17:32:59
阅读次数:
1207
Greenplum 调优--VACUUM系统表 1、VACUUM系统表原因 Greenplum是基于MVCC版本控制的,所有的delete并没有删除数据,而是将这一行数据标记为删除, 而且update其实就是delete加insert。所以,随着操作越来越多,表的大小也会越来越大。对于OLAP 应用 ...
分类:
其他好文 时间:
2019-07-04 15:56:02
阅读次数:
123
前几篇文章介绍了GreenPlum数据库的安装、启动、关闭、状态检查、登录等操作,数据库已经创建好了,接下来介绍如何使用数据库。按照习惯,需要先创建测试用户、表空间、数据库。先创建测试用户dbdream。 view source 1 postgres=# create role dbdream pa ...
分类:
数据库 时间:
2019-07-04 11:06:38
阅读次数:
416
关联数据在不同节点上,对于普通关系型数据库来说,是无法进行连接的。关联的数据需要通过网络流入到一个节点中进行计算,这样就需要发生数据迁移。数据迁移有广播和重分布两种。在GP中,每一个广播或重分布会产生一个切片,每一个切片在每个数据节点上都会对应发起一个进程来处理该slice负责的数据,上一层负责该s ...
分类:
其他好文 时间:
2019-07-03 17:10:16
阅读次数:
142
Greenplum的gpload工具使用可读外部表和Greenplum并行文件服务器(gpfdist或者gpfdists)来装载数据。它处理并行的基于文件的外部表设置并且允许用户在一个单一配置文件中配置他们的数据格式、外部表定义以及gpfdist或者gpfdists设置。使用gpload工具,需要编写gpload的控制文件,这个控制文件是一个yaml格式文件,如下图所示:然后执行gpload进行装
分类:
其他好文 时间:
2019-06-19 18:35:04
阅读次数:
209
Greenplum的外部表和ORACLE的外部表一样,都是数据存储在数据库之外的表。它的外部表除了可以加载本地的数据,还可以通过gpfdist工具并行加载数据。由于本地方式加载的效率低,已经被gpfdist取代。本文先介绍本地方式加载,后介绍gpfdist方式。1、本地方式加载1.1、创建外部表rhnschema=#CREATEEXTERNALTABLEext_rhn1(package_idnum
分类:
其他好文 时间:
2019-06-19 16:24:16
阅读次数:
372
Copy是PostgreSql数据库自带的数据工具,它不仅支持表于表之间的数据加载,也支持文件于表之间的数据加载和表对文件的数据卸载。对于Greenplum数据库,使用copy命令进行数据加载,数据需要经过Master节点分发到Segment节点;同样使用copy命令进行数据卸载,数据也需要由Segment发送到Master节点,由Master节点汇总后再写入外部文件,这样就限制了数据加载与卸载的
分类:
其他好文 时间:
2019-06-19 10:53:16
阅读次数:
515