注册 / 登录

小米的服务端APM技术实践

分会场:  运维体系/AIOps&DevOps/区块链

 

案例来源 :

案例讲师

王福

小米人工智能与云平台 架构师、项目负责人

小米架构师,负责分布式链路追踪、测试平台、研发效能平台方面工作

扫描二维码分享案例

 

案例简述

 

通过四个案例,将服务端APM价值链从深向浅逐步展开,分别讲述:
1. 服务端APM探针方案如何选型
2. 服务端APM数据平台如何高效构建
3. 服务端APM平台如何做业务快速发展中的『扁鹊华佗』
4. 如何从用户视角对服务端应用进行测试和监控

 

案例目标

 

在大规模微服务实施背景之下,故障快速定位、服务依赖刻画、性能耗时分析等工作成本越来越高,为此,我们搭建了分布式链路追踪平台来解决分布式服务架构下的Server Insight问题。同时,我们通过搭建测试平台,在满足压测需求的同时,通过提供对自定义接口的用户视角监控,来弥补在服务接口监控方面的能力缺失。


 

成功(或教训)要点

 

1. 数据标准化:无论链路追踪还是测试平台的用户视角主动监控,在平台构建过程中务必仔细权衡各种技术方案,力争寻找到『以不变应万变』的数据获取切入点,并对该点上能够获取的数据进行标准化。只有这样,才能极大减少平台构建过程中的复杂度和成本 


2. 走近用户,互相学习:APM类平台在推广过程中务必贴近用户,了解用户场景,只有这样才能发现不同业务场景的差异性。同时,通过走近用户,也能收集到用户对平台的一些共性需求,从而做出更符合用户期望的产品



 

案例ROI分析

 

wip

 

案例启示

 

wip

 

案例在团队中的意义

 

作者在服务端APM领域工作多年,深入涉及平台搭建、落地等方面工作,且总计对接过近50个互联网业务线,其中包括一些国内或公司顶级流量的业务线。