1 Lustre概述Lustre是面向集群的存储架构,它是基于Linux平台的开源集群(并行)文件系统,提供与POSIX兼容的文件系统接口。Lustre两个最大特征是高扩展性和高性能,能够支持数万客户端系统、PB级存储容量、数百GB的聚合I/O吞吐量。Lustre是Scale-Out存储架构,借助强...
分类:
其他好文 时间:
2014-06-29 00:39:13
阅读次数:
253
一、控制Hive中Map和reduce的数量Hive中的sql查询会生成执行计划,执行计划以MapReduce的方式执行,那么结合数据和集群的大小,map和reduce的数量就会影响到sql执行的效率。除了要控制Hive生成的Job的数量,也要控制map和reduce的数量。1、map的数量,通常情...
分类:
其他好文 时间:
2014-06-23 07:48:43
阅读次数:
288
局域网 两台机 192.168.1.2 我们称为A机器 192.168.1.3 我们称为B机器 配置集群的时候,从A或者是B的web后台都可以添加, 在这里 我们以 A机器为主 目前A机器里面 有桶一个 default ,数据不多 目前B机器里面 有桶2个 分别是 default 和 needpwd...
分类:
其他好文 时间:
2014-06-23 06:36:35
阅读次数:
238
mysql集群ndb和drdb那个比较好一些,我数据日访问量500w数据,数据达到T级别http://zhidao.baidu.com/link?url=dbpH5rI2o-XcscD8beSZrDvQxyG4vkUYFIRf58ARc-vKuuSA3ACvBYM3ewnazqqFEyeB2ZRPC...
分类:
数据库 时间:
2014-06-20 23:06:12
阅读次数:
294
刚接触一些Apache Kafka的内容,用了两天时间研究了一下,仅以此文做相关记录,以供学习交流。概念:kafka依赖的项:1.硬件上,kafka利用线性存储来进行硬盘直接读写。2.kafka没有使用内存作为缓存。3.用zero-copy。4.Gzip和Snappy压缩,5.kafka对事务处理比...
分类:
其他好文 时间:
2014-06-20 18:18:45
阅读次数:
329
本文分析了Spark1.0.0的Client,Master和Worker之间是如何通信的。通过对通信的分析,可以清楚的理解各个角色的作用和责任,和它在集群中扮演的不同角色。
当然了,为了便于源码分析,本文开始分析了akka,一个非常优秀的actor的实现:高性能,易于编程,可扩展和弹性无中心。...
分类:
其他好文 时间:
2014-06-18 06:59:54
阅读次数:
183
Shark是基于Spark与Hive之上的一种SQL查询引擎。...
分类:
其他好文 时间:
2014-06-18 06:54:00
阅读次数:
286
高可用,多路冗余GFS2集群文件系统搭建详解2014.06标签:GFS2 multipath 集群文件系统 cmirror实验拓扑图:实验原理:实验目的:通过RHCS集群套件搭建GFS2集群文件系统,保证不同节点能够同时对GFS2集群文件系统进行读取和写入,其次通过multipath实现node和F...
分类:
其他好文 时间:
2014-06-17 23:32:14
阅读次数:
957
最近在测试rsync+inotify的方式同步PHP代码到一个集群下的WEB服务器。如被监控的目录是/var/www/html下有三个目录dream_androiddream_iosgame_router当我把dream_android这个目录更名为android后,发现其他服务器上没有出现android并且原有的dream_android并没有被删除。测试游..
分类:
其他好文 时间:
2014-06-17 18:32:29
阅读次数:
240
前言:上文介绍了高可用集群的基本概念,下面让我们来试试用两台提供web服务的虚拟机来实现一个小小的高可用集群吧~首先,配置一个高可用集群的前提有:1.至少两个节点;2.共享存储(为了提供的页面一致,需要在后端用某些机制来实现。这里我们就做个简单的实验,后端存储先不..
分类:
其他好文 时间:
2014-06-17 17:23:46
阅读次数:
262