编者按:诚如2015全球未来网络暨SDN技术大会上阿里巴巴首席架构师庞俊英女士(OpenFlow与VxLAN在云网络的应用)所说的,想要网络SDN化、具备更高的可维护性、更具弹性以及更加可视化,目前遇到的困难之一就是关于people的,目前的网络界的技术人员要么太软要么太硬,我们需要全栈架构师。那么可以来看看facebook是如何打造自己的网络团队,他们是如何管理和运维如此复杂和庞大的网络的。
一直以来Facebook内部都有一项针对员工职业发展规划的项目叫着“hack-a-month”,意思就是工程师们有机会申请到其他部门工作一个月的机会,如果在这一个月的时间里你发现你更喜欢新工作,那么你完全可以选择留下来。就在这项规定执行后的很长一段时间内发生了有一个非常有趣的现象,几乎没有软件工程师愿意选择去网络部门。这种现象一直持续到前几年才有所改观,原因是facebook下决心要从根本上改变其网络配置方法。
facebook在网络方面的投入以及取得的成功众所周知,其中在2011年facebook推出了名为FBAR的网络自动化工具,主要目的是帮助facebook的网络做自动化修复。时至今日,FBAR每个月都要对网络设备发出的33.7亿条消息进行筛选,过滤出接近75万条需要进行修复的告警信息,最重要的是FBAR可以在不借助人工的情况下自动修复99.6%的告警。
为了实现网络自动化运维,更好的用软件控制硬件,facebook将重点放在网络硬件设备的模块化和标准化。它的Wedge top-of-rack交换机和6-Pack模块交换机使用相同的背板和线卡(facebook打算通过OCP将这些交换机的设计开源出去)。
虽然说facebook在网络团队改造方面取得了一定的成绩,但是这一切实现起来并不是一帆风顺或者说水到渠成的。因为传统网络工程师的工作更像是系统集成,网络工程师们已经被厂商锁定,就连如何集成也必须是基于厂商所使用的协议基础,所以网工能做的事情太有限了。facebook的方法就是努力将系统集成工作转化成工程师的工作,也就是你不只是做简单的集成而是要通过开发相应的工具解决问题。大家都知道,网络是个大规模分布式的系统,它里面有很多有趣的问题需要解决。
目前,facebook网络团队能够定期通过“hack-a-month”项目吸引到软件工程师,然后通过与部门内传统网络工程师进行配对以便于技能交流,现在团队成员几乎都能编写一定水平的代码。
SDNLAB评:相信无论是对于国内BAT还是其他企业的网络系统部门,都需要吸引一些软件编程人员,这样才能够在网络可维护性、弹性、灵活的路上走的更远,同样也是网络SDN化必须要解决的问题之一。
原文链接:How Facebook Transformed Its Networking Team
译者简介:方辉,就职于江苏省未来网络研究院 负责基于SDN的实验平台以及SDNLAB.com运营工作
原文地址:http://sdnlab12.blog.51cto.com/10269757/1655008