摘要:
Tachyon是一种分布式文件系统,可以借助集群计算框架使得数据以内存的速度进行共享。当今的缓存技术优化了read过程,但是,write过程因为需要容错机制,就需要通过网络或者是磁盘进行复制操作。Tachyon通过将“血统”技术引入到存储层进而消除了这个瓶颈。创建一个长期的以“血统机制”为基础的存储系统的关键挑战是失败情况发生的时候及时地进行数据恢复。Tachyon通...
分类:
其他好文 时间:
2015-08-13 18:10:01
阅读次数:
203
Spark大数据分析框架的核心部件 Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、Spark...
分类:
其他好文 时间:
2015-08-07 13:35:39
阅读次数:
171
1.在官网下载1.3.0源码后执行如下命令:./make-distribution.sh--tgz--skip-java-test--with-tachyon-Dhadoop.version=2.4.0-Djava.version=1.7-Dprotobuf.version=2.5.0-Pyarn-Phive-Phive-thriftserver2.参数说明:--tgz生成部署包;--skip-java-test滤过测试阶段;--with-ta..
分类:
系统相关 时间:
2015-07-29 06:51:17
阅读次数:
282
Tachyon是Spark生态系统内快速崛起的一个新项目。 本质上, Tachyon是个分布式的内存文件系统, 它在减轻Spark内存压力的同时,也赋予了Spark内存快速大量数据读写的能力。Tachyon把内存存储的功能从Spark中分离出...
分类:
其他好文 时间:
2015-07-07 11:14:48
阅读次数:
177
Spark On Yarn:从0.6.0版本其,就可以在在Yarn上运行Spark
通过Yarn进行统一的资源管理和调度
进而可以实现不止Spark,多种处理框架并存工作的场景部署Spark On Yarn的方式其实和Standalone是差不多的,区别就是需要在spark-env.sh中添加一些yarn的环境配置,在提交作业的时候会根据这些配置加载yarn的信息,然后将作业提交到yarn上进行...
分类:
其他好文 时间:
2015-05-30 09:25:08
阅读次数:
105
Tachyon是什么? Tachyon是一个高性能、高容错、基于内存的开源分布式存储系统,并具有类Java的文件API、插件式的底层文件系统、兼容Hadoop MapReduce和Apache Spark等特征。Tachyon能够为集群框架(如Spark、MapReduce等)提供内存级速度的跨集...
分类:
其他好文 时间:
2015-04-03 15:15:09
阅读次数:
196
Tachyon是一个分布式内存文件系统,可以在集群里以访问内存的速度来访问存储在Tachyon里的文件。Tachyon是架构在最底层的分布式文件系统和上层的各种计算框架之间的一种中间件,其主要职责是将那些不需要落地到D...
分类:
其他好文 时间:
2015-02-11 23:27:01
阅读次数:
695
转自:http://blog.csdn.net/u014252240/article/details/41810849发布人:南京大学PASA大数据实验室顾荣1. Tachyon是什么Tachyon(/'tæki:??n/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为...
分类:
其他好文 时间:
2015-01-27 10:53:42
阅读次数:
3558