目的:本文描述怎么安装和配置一个单结点的Hadoop,以便搭建能快速简单操作和使用Hadoop的MapReduce和Hadoop的分布式文件系统(HDFS);先决条件:支持的平台GNU/Linux
可用作开发和生产平台. Hadoop 在GNU/Linux clusters with 2000 no...
分类:
其他好文 时间:
2014-07-22 23:14:55
阅读次数:
435
1.Hadoop简介Hadoop[h?du:p]实现了一个分布式文件系统(Hadoop
Distributed File
System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high
throughput)来访问应用程序的数...
分类:
其他好文 时间:
2014-04-30 03:17:00
阅读次数:
604
将以前铁板一块的硬件拿来无限细分,路由器,交换机可灵活实现,SDN,NVF。硬盘可以分区,分区可以分布式块存储,操作系统可虚拟化,KVM OR
LXC,网络可自由随时按需求定制更改配置。操作系统支持OSPF,RIPV2协议和路由。LINUX支持VLAN与防火墙。有的开放实现-LINUX,ESXI,X...
分类:
其他好文 时间:
2014-04-30 01:50:50
阅读次数:
924
引言HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系统。它于1990年提出,经过几年的使用与发展,得到不断地完善和扩展。目前在WWW中使用的是HTTP/1.0的第六版,HTTP/1.1的规范化工作正在进行之中,而且HTTP-NG(Next
Generatio...
分类:
其他好文 时间:
2014-04-29 22:05:03
阅读次数:
747
序列化的作用是什么?为什么要序列化? 1、在进程下次启动时读取上次保存的对象的信息。
2、在不同的应用程序域或进程之间传递数据。 3、在分布式应用程序中的各应用程序之间传输对象。
所为序列化,就是将对象先转换为一种适当格式,然后再将其传输到目标位置的过程。 所为适当格式,有时候需要是二...
分类:
其他好文 时间:
2014-04-29 18:31:32
阅读次数:
501
引言
最近LZ的技术博文数量直线下降,实在是非常抱歉,之前LZ曾信誓旦旦的说一定要把《深入理解计算机系统》写完,现在看来,LZ似乎是在打自己脸了。尽管LZ内心一直没放弃,但从现状来看,需要等LZ的PM做的比较稳定,时间慢慢空闲出来的时候才有机会看了。短时间内,还是要以解决实际问题为主,而不是增加自....
分类:
编程语言 时间:
2014-04-28 12:33:58
阅读次数:
668
一、Mahout简介
查了Mahout的中文意思——驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了...
附logo:
(就是他,骑在象头上的那个Mahout)
步入正文:
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现、分类、聚...
分类:
其他好文 时间:
2014-04-27 19:59:55
阅读次数:
569
Logging.c:
/*
Copyright (c) 2008-2012 Red Hat, Inc.
This file is part of GlusterFS.
This file is licensed to you under your choice of the GNU Lesser
General Public License, version 3 or any...
分类:
其他好文 时间:
2014-04-27 18:57:31
阅读次数:
702
大型业务系统面临的主要问题就是高并发性和事务访问,客户端的数量与服务器端的分布式对象数量存在一定程度的正比关系,客户端数量越多,服务器端分布式对象也就越多,如何解决这种高并发的问题也就成了企业级架构首先要解决的问题。EJB作为一种服务器端分布式组件,为我们提供了应对策略。
EJB提供了两种管理大量分布式对象的策略:实例池化和激活。下面分别对EJB组件模型中的三种模型进行一些分析。
...
分类:
数据库 时间:
2014-04-27 18:37:17
阅读次数:
1742