概述
在日常运维和稳定性保障中,监控是发现问题、感知业务异常、感知用户使用落差的重要手段之一。2017年双11,整体规模空前,在这期间任何一个业务问题和影响都会被放大,在保障过程中如何让问题更快速、更全面地被发现感知、响应处理、防止问题的劣化,在线上异常对用户的影响大范围扩散之前达到解决或止血就变得尤为重要。过往的双11我们的问题更多的是通过用户反馈-客服受理-各层级分拣的方式去发现,然后上报-解决-回访形成闭环,这极大地增加了问题处理开销,用户受业务影响的时间也将延长,在稳定性上将承受客户影响面扩大的风险。
因此在2017年双11,如何更全面地覆盖问题范围、更快速地发现问题、更快速地流转和处理问题成为我们必须要解决的问题,因此我们启动了2017双11稳定性监控专项,从双11监控部署、数据存储归档、监控系统稳定性保障等方面做了充足的准
继续阅读与本文标签相同的文章
-
Weex:一个志在满足万物互联的移动端技术解决方案
2026-05-22栏目: 教程
-
Vue.js作者尤雨溪加盟!Weex 正式联手 Vue
2026-05-22栏目: 教程
-
Redis Cluster集群的实现原理
2026-05-22栏目: 教程
-
双11当天处理数据5PB!揭秘HiStore数据库
2026-05-22栏目: 教程
-
阿里基础设施的智能监控
2026-05-22栏目: 教程
