Greenplum-概念篇

时间：2014-07-01 16:57:59 阅读：411 评论：0 收藏：0 [点我收藏+]

标签：blog http 使用文件数据 2014

Greenplum主要组件包括：Master、Segments、Interconnect；其他组件包括ETL Server、Greenplum command center等。
bubuko.com,布布扣
0. 组件之-Master：
master功能
master也是一个gp的独立的数据库，是gp的入口，负责接受和管理客户端的连接请求，并处理用户SQL语句语句，可以通过psql或者odbc等连接工具来连接pg数据库。包含了一个称作system catalog的自描述的信息内容，类似于oracle的数据字典，但是不包含任何用户数据，master节点验证客户端的连接、处理用户提交的SQL语句、在seg节点之间调节工作负载、整合从各个seg节点执行后返回的数据结果并返回给用户。

master redundancy
如上所述master承担着重要的功能，因此有必要对它做冗余，可以采用独立主机也可以采用其中的某个seg节点来搭建standby master，standby处于热备状态，通过日志传输进程transaction log replication来见master的system catalog变化信息复制传输应用到standby master上，如果master节点失败，那么日志传输进程将停止，这个时候可以激活standby master变成master，当master恢复之后，日志传输进程将自动同步system catalog内容回去到master

1. 组件之-Segments
segments功能
seg是gp系统中实际承担数据存储和存取的节点，每个seg节点只存储表或者索引的部分数据，SQL语句并不是在master节点上执行，而是在seg节点上执行并生成结果的，但是用户并不会直接接触到seg节点，这一过程是由master来协调完成的。根据主机cpu的配置情况，通过测试来获得每个seg主机最佳的seg实例数量。

segments redundancy
seg也可以配置冗余，seg的冗余不能配置在本主机上，当seg失败的时候，冗余节点将承担起相应的功能角色。
只要失败的seg节点的冗余节点还存活，gp就可以继续在线运行，当master无法连接到seg的时候，它会将seg节点在数据字典中标记为不可用并从系统中剔除，并在处理失败的seg并重新启动之后，自动在线恢复，恢复的数据仅仅包含从失败之后的内容。如果没有配置冗余的seg，当某个seg失败的时候整个gp将崩溃失败并关闭，这个情况下需要修复失败的seg节点之后重新启动gp。

2. 组件之-Interconnect
是gp的网络层，通常使用千兆网络连接，在各个节点直接通信和传输信息；默认情况下使用UDP协议传输；可以配置冗余实现高可用性。

3. 组件之ETL Server
常规的txt和csv文件可以通过gpfdist这程序来作为文件服务程序，以便gp连接这些外部文件创建外部表并导入到数据库。

4. 组件之Greenplum command center
通过在每个seg上部署agent来监控整个系统情况，可以给予命令行查询和web界面展示方式查看系统情况。

疑问：
master和segs的判断fail机制是什么？
redundancy判断fail机制是什么？失败恢复之后，standby的角色是否会变回去？
seg判断fail机制是什么？数据传输复制机制？角色是否转变?
gp的性能受限于性能最差的seg节点吗？

interconnect网卡冗余配置最佳实践是什么？多个实例和多个网卡的配置情况？

master的redundancy之间、seg的redundancy之间以及master和seg之间的平台异构？

-EOF-

摘自http://blog.csdn.net/gtlions/article/details/8752200

Greenplum-概念篇,布布扣,bubuko.com

Greenplum-概念篇

标签：blog http 使用文件数据 2014

原文地址：http://www.cnblogs.com/zhuangjb/p/3817928.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行