天天看点

快递行业双11重保护航

项目简介

今年双十一双高峰、长周期,寄递规模达到新的历史高峰,集包作业推广和自动化设备大量增加,对寄递平台的信息处理能力要求更高;对系统算力要求更高、压力更大。云平台承载客户核心业务,任务艰巨,责任重大。

针对此次旺季重保和四季度收尾工作,客户提出四大目标:促发展、保畅通、重体验、保稳定。在明确这一重保目标前提下,与行业对标,全面应用自动化运维手段,梳理系统痛点难点问题,提升信息用户体验。我们的目标是确保“业务不中断,系统不宕机”。

项目成果

此次重保护航从10月31日至18日共19天,历经两次双11旺季业务高峰,阿里云智能与客户联合作战,从云平台稳定性治理、应急预案、产品升级、订单容灾、场景展示、智能工具、故障演练、能力基线等方面进行了充分的准备。其中:完成了三轮深度治理,80多个专项,完成1400多项云产品调优;制定了16个应急预案,确保出现应用级问题,可以快速定位解决;完成了54款组件与产品升级,30+个风险修复;针对新一代寄递订单业务,制定了应用级订单容灾兜底方案,确保出现平台级故障,订单业务系统可以正常使用,为客户核心业务上一份双保险;设计了云平台保障大盘,业务系统保障大盘和应用拓扑保障大盘,全方位展示系统,业务运行状况;利用全链路诊断工具,封神榜钉钉推送及SRE运维大脑等自动化、智能化工具手段,协助客户快速定位问题,分析问题;为保障应急效率,现场执行了4次故障演习,2次VPN接入演练,规范故障处理流程提升驻场故障应急响应能力;专家团队与客户项目组联合压测,建立了213个应用系统接口性能基线,评估业务承载。

项目总结

整个双十一重保期间,阿里产品研发、性能优化专家、一线驻场运维通力合作,7*24小时现场值守,为客户云平台保驾护航,秉承客户为先,业务第一原则,遇到问题冲在一线,实现业务全程0故障、0影响、0重要事件、0应急。在重保现场,阿里各专家站在客户业务应用角度,帮助客户分析解决问题,并不仅限于产品保障,让客户切实感受到了阿里“客户第一”的文化与工作风格,得到了客户领导与直属客户负责人的高度认可与表扬,圆满完成此次护航保障工作。

我们是阿里云智能全球技术服务-SRE团队,我们致力成为一个以技术为基础、面向服务、保障业务系统高可用的工程师团队;提供专业、体系化的SRE服务,帮助广大客户更好地使用云、基于云构建更加稳定可靠的业务系统,提升业务稳定性。我们期望能够分享更多帮助企业客户上云、用好云,让客户云上业务运行更加稳定可靠的技术,您可用钉钉扫描下方二维码,加入阿里云SRE技术学院钉钉圈子,和更多云上人交流关于云平台的那些事。

快递行业双11重保护航