4.高容错性。Hadoop 可以自己主动保存数据的多份副本, 而且可以自己主动将失败的任务又一次分配。
如今的话Hadoop已经包括非常多项目。只是核心内容是MapReduce和Hadoop分布式文件系统。这里spark的话实时性性能方面比hadoop高非常多。这里我不多说什么。(http://www.zdnet.com/faster-more-capable-what-apache-spark-brings-to-hadoop-7000026149/能够看看spark与hadoop比較)
与Hadoop相关的Common,Avro,Chukwa,Hive,HBase等项目也是不可或缺的。它们提供了互补性服务或在核心层上提供了更高层的服务。
原文地址:http://www.cnblogs.com/mengfanrong/p/3776485.html