大家好,作为淘宝春晚项目的技术负责人,还是站出来让大家笑话一下,顺便还原一下这起“淘宝崩溃事件”
淘宝到底“崩溃”了什么?
- 活动共四场,只有第一场的用户会有一定概率遇到以下问题:
- 部分用户登录出现限流
- 部分用户购物车打不开
- 部分用户活动页出现限流
- 归纳起来,就是需要登录才能用的很多功能都出现了问题
淘宝是怎么“崩溃”的?
- 看上去问题很多,关键的问题就一句话:登录系统被打到限流了..
- 怎么被打到限流的? 真的是因为大家的热情太吓人,尤其是春晚期间,不少长辈对淘宝“路转粉”,导致新增用户的瞬间调用登录系统量暴增,出现限流情况....其中有一个小细节,并非直接使用登录功能才会调用到登录系统,淘宝 APP 是长登录的,进入 APP 后系统也会有机制自动调用登录系统刷新登录状态,所以其实那个瞬间登录系统的压力还是非常大的..
- 事情发生后现场情况? 当然是吓得冷汗都下来了….赶紧让登录系统在现场值班的同学进行扩容,扩容动作倒真不慢,第一场结束前已经陆续恢复了,第二场开始前容量就够了,所以后面三轮互动都没有出现这些问题.....
- 为什么会被打到限流? 确实是因为我们对登录系统的容量评估失误导致….但很多同学不知道的是,我们其实很早就预估到了登录系统的压力。当时我们经过充分的讨论和商议,基于一些历史数据推导出了种种极端情况,最终决定稳妥起见,以 17 年双十一的容量为基础,对登录再扩容个 3 倍!....结果,春晚当晚登录的实际峰值超过了 17 年双十一的15 倍,尤其新用户的瞬时登录更是完全超出预料......
总结起来,那就是....我们真的对春晚的力量一无所知...
来源:知乎日报
如若转载,请注明出处:https://www.zhangzs.com/257850.html