Greenplum是一种基于postgresql的分布式数据库。其采用shared nothing架构(MPP),主机,操作系统,内存,存储都是自我控制的,不存在共享。也就是每个节点都是一个单独的数据库。节点之间的信息交互是通过 节点互联网络实现。通过将数据分布到多个节点上来实现规模数据的存储,通过...
分类:
数据库 时间:
2015-07-16 00:25:32
阅读次数:
278
IT-培训基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析Hadoop2.0_YARN_Spark_Storm_Tez技术培训视频教程基于IBM Cognos Report studio技术的商业智能解决方案(广播分发报表、EVENT STUDIO)基于IBM Cog...
分类:
其他好文 时间:
2015-06-24 08:10:41
阅读次数:
172
5月4日-5月24日,断断续续折腾了三个星期的Greenplum,总算告一段落了:扩容,发现扩不成容,只好升级;升级,发现一堆错误,只好暂停修复数据库;修好了,继续升级;升完级,发现错误,修啊修啊修好了;最后,终于完成了扩容。这个过程里写了8篇博文把实施过程和问题解决都记录下来了,这里把整个过程总结一下。本来早就要写了,可家里外头一堆事儿,拖到今天才找个空来落笔。...
分类:
其他好文 时间:
2015-06-09 17:19:01
阅读次数:
91
任何分布式系统都要面对的事儿就包括扩容,不然分布式系统存在的意义就大打折扣了,这篇就介绍一下对GP进行扩容的准备过程,事实上,扩容的实施是个非常简单的过程,主要要做的就是准备。...
分类:
数据库 时间:
2015-05-21 14:14:02
阅读次数:
279
任何系统的升级都有个量变到质变的过渡:版本相差小的时候,通常很简单,版本相差大的时候,就是一场噩梦。不过版本相差小的时候,大伙儿往往安于现状。本文实际记录从GP4.2.7.2到4.3.5.0的升级过程,从版本号看相差不大,但是GP的版本命名中,第二位的变化就已经是大升级了。另需说明的是,本文升级的GP数据库规模不小,用户较多,管理混沌,在加上GP实在是有点儿脆弱(相比oracle等),所以遇到了较多...
分类:
数据库 时间:
2015-05-18 16:49:57
阅读次数:
266
Greenplum的gpcheckcat是用来检查system catalog的一致性的命令,其中有专门针对磁盘文件的检查($GPHOME/bin/lib/gpcheckcat -R persistent -p 5432 databasename),主要是对于system catalog里关于磁盘文件的记录与实际磁盘文件的情况的一致性检查。本文结合一个实际错误介绍如何解决这类元数据错误。...
分类:
其他好文 时间:
2015-05-15 09:11:29
阅读次数:
400
Greenplum的元数据错误也会影响到数据备份过程,在使用pg_dump进行数据结构备份时,会由于分布策略的缺失导致备份失败,本文介绍此错误的解决办法。...
分类:
其他好文 时间:
2015-05-14 12:00:19
阅读次数:
619
Greenplum的可靠性还是没法和传统商业数据库相比,它跑着跑着就会把自己的元数据给跑乱,有些是可以通过命令修复的,有些则只能直接去增删改system catalog。本文结合一个具体错误,介绍如何操作system catalog解决元数据错误。...
分类:
其他好文 时间:
2015-05-13 10:24:46
阅读次数:
164
作为分布式数据库,Greenplum的元数据经常(是真的,经常遇到)会出现些错误,典型的一个是master node与seg node元数据不一致,本文结合一个具体错误,介绍下解决的办法。...
分类:
其他好文 时间:
2015-05-12 13:38:29
阅读次数:
175
$
gpinitsystem-c
/usr/local/greenplum-db/gpconfigs
/gpinitsystem_config20150429:15:30:59:023693gpcreateseg.sh:y153-hadoop-namenode2:gpadmin-[WARN]:-Failedtoinsertport=40000in/data/primary/gpseg0/postgresql.confony153-hadoop-namenode2.vclound.com20150429:15:..
分类:
其他好文 时间:
2015-04-30 20:19:10
阅读次数:
728