
电商大促活动特征:
1) 毫秒级延迟,必须进行针对性优化
2)洪峰明显,一般是日常峰值的几十倍,必须进行多次全链路压测和预案梳理
3)高保障,出现问题时第一时间感知,配合多链路冗余进行保障
大促保障:
1)实时任务优化:低延迟和高吞吐是一对矛盾体,需要进行权衡。另外,造成吞吐量不佳的原因有系统资源和实现方式两大类,主流的优化方式如下:
① 实时任务所消耗的资源分为独占资源和共享资源两种,共享资源会被多个实时任务抢占,如果一个任务执行过程中80%的资源都是通过抢占的方式获取的,则需要给他分配更多独占资源,避免抢不到资源
② 选择合理的缓存机智,降低读写库的次数
③ 计算单元合并,减少节点数量。节点间的数据传输涉及序列化与反序列化操作,消耗大量资源
④ 内存对象共享,降低线程间对象拷贝带来的资源消耗
2)数据链路保障:
实时计算的数据链路包括数据同步 -- 数据计算 -- 数据存储 -- 数据服务,单节点故障是常态,需要做到多链路搭建、多机房容灾,在出现故障时能够支持秒级链路切换。

3)压力测试
模拟大促峰值数据,验证系统是否正常运行。压力测试细分为数据压测和产品压测。
① 数据压测主要时蓄洪压测,把几天内的数据在某个时刻全部放开,数据全部是真实数据。
② 产品压测分产品本身压测和前端页面稳定性压测。
网友评论