注册 / 登录

喝着咖啡做运维:腾讯运维完成海量DevOps实践背后的故事

分会场:  质量管理/智能运维/DevOps

分享时间: 2017年11月9日 - 12日

案例来源 :

案例讲师

聂鑫

腾讯 运维总监

从开发到运维,伴随腾讯社交网络运营部成长的十年,负责过腾讯社交产品所有业务运维工作,目前主要负责QQ、空间等产品运维团队管理工作。 经历多个业务产品的诞生到蓬勃,伴随着运维团队的成长和成熟,见证着腾讯一代代运营技术的创新和发展。作为运维界老兵有好多故事想和大家讲,也特别愿意听听各位经历的酸甜苦辣。

扫描二维码分享案例

 

案例简述

 

很多人都在说devops,好像这两年大家都找到了运维的完整解决思路了,好像运维界的“教科书”已经出版了,照着做就能实现运维的新时代,过上喝着咖啡做运维的好日子。
然而在此之前的运维痛楚和涅磐过程又是怎样的呢?腾讯SNG的海量业务运维这十年来的Devops实践之路又是怎样演进,是哪几款最重要的软件产品帮助运维完成技术转型?希望时间退回到十年前,一起看看腾讯SNG运维的一步一步实践之路。

 

案例目标

 

当前腾讯SNG运维维护着十万台规模的服务器,最多一人维护一万台,在天津大爆炸、春节红包等各类突发事件背后都展现出突出的运维能力,从体系和理论上的分享已经比较多了。但如果回顾腾讯运维十年前开始的建设历程,又是哪些关键的决策和关键的软件帮助SNG运维一步步实现这种能力的提升,希望这次的分享可以帮助大家揭秘,给予启发。

 

成功(或教训)要点

 

标准化是腾讯SNG运维的海量运营思想的核心理念,需要有一些核心软件和方法论,才能帮助运维少走弯路,突破各种屏障,实现标准化的目标,最终帮助运维和研发向Devops延展。

 

案例ROI分析

 

根据业务所处的不同阶段来做投入产出的分析,能影响运维方向的建设,应当尽早的投入和尽可能的深入。腾讯SNG运维十年前进行的一系列体系搭建奠定了后来长期的建设方向。

 

案例启示

 

组建一套运营体系首先需要考虑五至十年的业务规划和选择合适的运营理念。不迷信于某一种运营方法论,选择最合适自己企业的才是最重要的。这次的分享只是众多方法轮中基于标准化服务治理的实践,相信对同质性的团队将有较好的方法论借鉴意义。