[说明:本文是阅读Google论文“Dapper,
a Large-Scale Distributed Systems Tracing Infrastructure”之后的一个简要总结,完整译文可参考此处。 另论文“Uncertainty
in Aggregate Estimates from Sampled Distributed Traces”中有关于采样的更详细分析。此外,Twitt...
分类:
移动开发 时间:
2015-08-17 21:46:50
阅读次数:
471
趋势一:混合架构将逐渐消失 当初,Hadoop的诞生是为了更方便地处理非结构化数据和半结构化数据,但是处理结构化数据的时候功能就显得不够完整。用户还需要使用数据库或者MPP(大规模并行处理)数据库,协助Had...
分类:
其他好文 时间:
2015-03-12 19:28:58
阅读次数:
227
简介:本文是对大数据领域的基础论文的阅读总结,相关论文包括GFS,MapReduce、BigTable、Chubby、SMAQ。大数据出现的原因: 大多数的技术突破来源于实际的产品需要,大数据最初诞生于谷歌的搜索引擎中。随着web2.0时代的发展,互联网上数据量呈献爆炸式的增长,为了满足信息搜...
分类:
其他好文 时间:
2015-01-27 20:07:31
阅读次数:
150
摘要 : 为什么Zara毛利率比LV高?当百度“大数据引擎”等互联网巨头向社会开放大数据基础设施,敢用、会用,就能创造更多商业奇迹和民生福利。大数据,是不是“大忽悠”?当Zara这家零售企业将大数据运用于创新经营时,它创造了比奢侈品巨头LV税前毛利率更高的奇迹!要知道,Zara平均服饰价格只有LV的...
分类:
其他好文 时间:
2014-07-29 13:51:58
阅读次数:
251
课程主要涉及Hadoop Sqoop、Flume、Avro重要子项目的技术实战
课程针对人群
1、本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员,特别适合于想换工作或寻求高薪职业的人士
2、最好有Greenplum Hadoop、Hadoop2.0、YARN、Sqoop、FlumeAvro等大数据基础,学习过北风课程《Gree...
分类:
其他好文 时间:
2014-07-12 20:58:37
阅读次数:
220