RT-O11: 대형 이벤트 폭증 대응

🎯 시즌 폭증이란?Surge Response · X10+ Traffic

블랙프라이데이·광군절·신학기 시즌처럼 트래픽이 평소 대비 X10+ 폭증하는 이벤트는 일반 SLA 운영으로는 사실상 붕괴한다. 주문 큐가 적체되고 EDD가 벗어나며, 재고는 한쪽 거점에 쏠리고, 배송사는 capacity 부족으로 물량을 거절한다.

RT-O11은 (1) 사전 예측 LSTM(이력 + 외부 캘린더), (2) 자동 스케일링(kube HPA + 워커 풀 배수), (3) 거점 사전 배치(RT-O7 LP 가속 호출), (4) EDD 동적 가산을 결합하여 SLA 붕괴 없이 폭증을 흡수한다. 6월 블프 시뮬레이션에서 처리량 +540%, EDD 위반 0.7%(평소 1.2%), 장애 0건을 기록했다.

🧭 폭증 대응 5단계 파이프라인5 stages · forecast → throttle
STEP 1
surge_forecast

7~14일 전 폭증 가능성 LSTM 예측. 예: 광군절 D-7 신호 ↑. p_surge 임계 0.7 초과 시 워밍업 트리거.

STEP 2
auto_scale

k8s HPA + Kafka partition 임시 증설 + 운송사 capacity 사전 락. 워커 풀을 ×3~×5 배수로 확장.

STEP 3
preposition

RT-O7 LP에 surge_factor=k 주입 → 거점 재고 사전 이동(prepositioning). D-3까지 완료.

STEP 4
edd_adjust

surge_multiplier × 2h 가산 + 사전 안내 문구. 고객에게 조정 EDD 사전 통지.

STEP 5
live_throttle

큐 깊이 모니터 + 세그먼트별 throttle. P1/구독자 우선, 일반 트래픽은 지연 입장(Watch first 패턴).

🐍 폭증 시 EDD 동적 조정 로직 (Python)
# 주문 폭증 시 EDD 동적 조정 로직
def adjust_edd_for_surge(order, queue_depth):
    surge_multiplier = predict_surge_factor(queue_depth)
    base_edd     = calculate_edd(order)
    adjusted_edd = base_edd + timedelta(hours=surge_multiplier*2)
    # 고객에게 조정된 EDD 사전 안내
    return adjusted_edd
➗ surge_multiplier 산식 & 가중치log-scale · clamp(0,5) · α 보정
surge_multiplier = clamp(0, 5, log(queue_depth / baseline) · α)
adjusted_edd = base_edd + surge_multiplier · 2h
# log scale로 큐가 X10이 되어도 multiplier는 ~3 수준에 머무름 → 과도한 EDD 가산 방지
forecast .30LSTM(history + calendar) · 7~14일 사전 예측 신호. p_surge > 0.7 시 워밍업 트리거 발동.
scale .25HPA + worker_pool × k · k8s 자동 스케일·Kafka partition· 운송사 capacity 사전 확보.
preposition .25RT-O7 LP(surge_factor=k) · 거점 재고 사전 이동 → hub_to_customer 거리 단축.
edd_adj .20+ surge_multiplier · 2h · 사전 안내 발송 → 불만/문의 30% 감소 효과.

예) 큐 깊이가 baseline 대비 9.8배가 되면 log(9.8) ≈ 2.28, α=1.3을 곱해 multiplier ≈ 3, EDD 가산은 +6h가 된다. 사전 안내가 함께 발송되어 고객은 큰 불만 없이 수용한다.

📦 시즌 폭증 사례 (블프 D-7 ~ D+1)2026 블랙프라이데이 시뮬레이션 추적 N=482K orders
일자트래픽 배수EDD 가산위반율주요 동작
D-71.4×01.0%예측 신호 ↑ · 워밍업 시작
D-32.6×+1h1.1%HPA +30% · LP preposition 완료
D 09.8×+6h0.7%피크 가동 · 사전 안내 발송 · throttle ON
D+14.2×+2h0.9%잔여 큐 정리 · 점진적 스케일다운

블프 당일(D 0) 트래픽 9.8배 폭증에도 EDD 위반율은 0.7%로 평소(1.2%)보다 오히려 낮았다. 이는 사전 안내로 고객 기대치가 조정되고, preposition으로 거점 거리가 단축된 효과가 큰 것으로 분석된다.

참고문헌
[1] 김지훈, "시즌 폭증 자동 대응: LSTM 예측 + HPA 스케일링 + EDD 동적 조정", IntraLogis 사내 보고서, 2026.06
[2] Netflix Tech Blog, "Chaos & Surge Engineering Practices", 2024
[3] AWS, Auto Scaling 가이드: Predictive Scaling & Capacity Reservation, 2024
[4] McKinsey & Company, "Black Friday Operations: Lessons from Top Retailers", 2024
[5] KISDI, 이커머스 시즌 트래픽 보고서: 광군절·블프·신학기, 2024