Research Task · RT-T22 · 2025.11
🏢 멀티테넌트 SaaS 아키텍처 설계
TMS AI 라우팅 엔진 · Data/Model/API 3-Layer Isolation · LoRA 어댑터 · 김지훈 수석연구원 · 연구노트 22p 대응
🎯 연구 배경
단일 기업용 AI 라우팅 엔진을 복수 고객사가 공유하는 멀티테넌트 SaaS로 전환합니다. 고객사별 데이터 격리와 모델 커스터마이징을 동시에 지원하여, 공유 인프라의 경제성과 개별 운영의 맞춤성을 양립시킵니다.
🛡️ 멀티테넌트 설계 원칙 (3-Layer Isolation)
Data Isolation
LAYER 1
고객사별 독립 Schema와 Row-Level Security(RLS)로 데이터 교차 접근 차단. 물리 DB는 공유하되 논리적으로 완전 격리.
PostgreSQL 16 · RLS · per-tenant schema
Model Isolation
LAYER 2
공유 베이스 모델 + 고객사별 LoRA 어댑터를 결합한 PEFT 구조. 파라미터 수를 최소화하면서 도메인 특화.
PEFT · LoRA r=16 · 0.3% params
API Isolation
LAYER 3
X-Tenant-Id 헤더 기반 라우팅, 요금제별 Rate Limiting(RPS/일일 배차 건수), 감사 로그. Gateway에서 테넌트 컨텍스트 주입.
API Gateway · JWT · token bucket
📝 테넌트별 모델 관리 (PEFT + LoRA)
# 테넌트별 모델 관리
class TenantModelManager:
def get_model(self, tenant_id):
base = self.load_base_model() # 공유 베이스
adapter = self.load_adapter(tenant_id) # 고객사 어댑터
return PeftModel(base, adapter) # LoRA 결합
💰 요금제 설계 (3-Tier)
🌱 Starter
소규모 화주·신생 물류사용
100건
daily_dispatch ≤ 100
- 표준 배차 모델 (베이스)
- RLS 데이터 격리
- 이메일 지원 (영업일 24h)
- 커스텀 피처
- Fine-tuning 어댑터
🚀 Growth
중견 화주·성장 SaaS 계약
1,000건
daily_dispatch ≤ 1,000
- 커스텀 피처 지원
- 경량 LoRA 어댑터 (r=8)
- 전화 지원 (평일 업무 시간)
- MCP 외부 시스템 연동
- 전담 CSM
🏢 Enterprise
대형 3PL·글로벌 화주
∞
daily_dispatch unlimited
- 전용 Fine-tuning (r=16+)
- 전담 CSM · 24/7 SLA
- 온프레미스 하이브리드 옵션
- 감사·SOC2 확장
- 디지털 트윈(RT-T20) 접근
📉 11월 설계 의의
✓ 멀티테넌트 전환 설계 요약 (2025.11 기준)
Data 격리
RLS
Model 격리
LoRA PEFT
API 격리
X-Tenant-Id
요금제
3-Tier