先上几个git地址,明天测试 https://github.com/linkedin/camus https://github.com/voyage-h/kafka-hadoop-consumer https://github.com/voyage-h/kafka-hadoop-consumer...
分类:
其他好文 时间:
2015-08-25 13:04:43
阅读次数:
152
一,什么是zookeeper?
ZooKeeper 顾名思义 动物园管理员,他是拿来管大象(Hadoop) 、 蜜蜂(Hive) 、 小猪(Pig) 的管理员, Apache Hbase和 Apache Solr 以及LinkedIn sensei 等项目中都采用到了 Zookeeper。ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,ZooKeeper是以Fast Pa...
分类:
其他好文 时间:
2015-08-20 09:13:06
阅读次数:
112
转载自http://blog.chinaunix.net/uid-20196318-id-2420884.htmlKafka[1]是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运...
分类:
其他好文 时间:
2015-08-17 11:44:06
阅读次数:
105
Cache:缓存,万金油,哪里不行优先考虑Queue:消息队列,常见使用Linkedin的kafkaAsynchronized:批处理+异步,减少系统IO瓶颈Load Balance: 负载均衡,可以使用一致性hash技术做到尽量少的数据迁移Parallelization:并行计算,比如MapRed...
分类:
其他好文 时间:
2015-08-16 19:39:17
阅读次数:
203
KAFKA分布式消息系统 2011-08-28 18:32:46分类: LINUXKafka[1]是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络...
分类:
其他好文 时间:
2015-08-14 11:08:43
阅读次数:
146
前言身为著名的创业者+投资人,LinkedIn和Paypal的联合创始人Reid Hoffman有一个令我印象深刻的ABZ理论,他认为,你在任何时刻,手中都需要有三个计划:A计划、B计划和Z计划。A计划A计划,是一个当下你觉得值得你去持续投入,并获得部分产出和安全感的计划,好比一份你现在正在投入和从...
分类:
其他好文 时间:
2015-08-06 01:55:24
阅读次数:
394
数据科学家可能成为2015年最热门职业 腾讯科技讯 1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌? 如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了——LinkedIn的最新投票结果显示,"统计分析和数据挖掘" 是2...
分类:
其他好文 时间:
2015-07-27 20:54:59
阅读次数:
155
在LinkedIn,我们一直在评估最好的开发框架和工具来开发伟大的产品。11年的历史中,我们使用过很多前端web框架-如Grails、Frontier(LinkedIn内部的web框架),最近是:Play!我们喜欢Play,并热情地在公司内部推...
分类:
编程语言 时间:
2015-07-24 21:03:29
阅读次数:
315
LinkedIn创建于2003年,主要目标是连接你的个人人脉以得到更好的的工作机会。上线第一周只有2700个会员,之后几年,LinkedIn的产品、会员、服务器负载都增长非常快。 今天,LinkedIn全球用户已经超过3.5亿。我们每...
分类:
其他好文 时间:
2015-07-24 01:42:42
阅读次数:
194
【分布式系统的数据一致性问题】OCS概要介绍 据AlertSite网络分析公司表示,Facebook的响应时间在2010年平均为1秒钟,到2011年中期已提高到了0.73秒。对比来看,响应时间占第二位的LinkedIn,网络下载内容时要花费将近2倍的时间。Twitter的响应时间则整整迟了2秒钟。....
分类:
数据库 时间:
2015-07-21 23:54:50
阅读次数:
217