RT-O18: MCP + 컨텍스트 인식 OMS Agent

🎯 MCP + 컨텍스트 인식 OMS Agent란?Model Context Protocol · Autonomous Tool Use

MCP(Model Context Protocol)는 Anthropic이 제안한 LLM-tool 표준 프로토콜로, OMS Agent가 4개 도메인 MCP 서버(customer·inventory·carrier·order_history)를 자율적으로 query 한다. 각 서버는 자체 도구 목록(get_profile, check_atp, dispatch, search 등)을 manifest로 노출하고, Agent는 사용자 질의 의도에 맞춰 필요한 tool을 1~3개 골라 병렬 호출한다.

핵심은 컨텍스트 인식(context-awareness)이다. 이전 주문 내역, 선호 배송 시간, 결제 패턴, VIP 등급 같은 30일치 메모리를 LLM이 스스로 참조해 단순 명령("고객 #12345 평소대로 보내줘")에서 풍부한 의도를 파악한다. 함수 콜링 baseline 대비 컨텍스트 적중률(remembered preference 활용률)이 62% → 91%로 올랐고, 평균 응답은 3.2초에서 1.8초로 단축됐다. RT-O16 B2B escalation 자율 1차 처리에 적용하기 시작했다.

🧭 MCP Agent 처리 파이프라인5 stages · query → action
STEP 1
intent_resolve

사용자 자연어 → intent + context 추출. 고객 ID, 행위(reorder/cancel/track), 제약 파싱.

STEP 2
tool_selection

4개 MCP 서버 manifest 중 필요한 tool을 1~3개 자동 선택. 평균 1.2 tool/주문.

STEP 3
mcp_invoke

각 MCP 서버에 query 호출. parallel_tool_calls=2로 병렬 실행해 latency 단축.

STEP 4
context_assemble

이력·재고·운송 정보 통합 + LLM reasoning으로 최종 plan 작성.

STEP 5
action_execute

주문 생성 / 예외 escalation / 응답 자동 실행 + 메모리 갱신.

🐍 컨텍스트 인식 주문 처리 (Python)
# 컨텍스트 인식 주문 처리 예시
agent_response = oms_agent.run(
    query="고객 #12345 재주문 처리",
    tools=[oms_customer_mcp, oms_inventory_mcp,
           oms_carrier_mcp, oms_order_history_mcp],
    context="이전 주문: 냉장 제품 2개, 선호 배송: 오전"
)

# LLM이 자율적으로 결정하는 호출 시퀀스
# 1) order_history_mcp.last_order(cust=12345) → 냉장 SKU 2개
# 2) inventory_mcp.check_atp(skus=["A1","B7"]) → 재고 OK
# 3) carrier_mcp.get_options(time="AM", cold=True) → KR-EXP 04:30
# context_hit=91% (선호 시간/카테고리 자동 반영)
➗ Agent 효율 지표tool_efficiency · context_hit_rate
tool_efficiency = useful_calls / total_calls
context_hit_rate = remembered_pref_used / total_query_with_history
# useful_calls = LLM 응답에 실제 인용/사용된 tool result 수
cust .25oms_customer_mcp · 프로필·VIP·CLV·선호 채널 노출
inv .25oms_inventory_mcp · ATP·lock·release 도구로 재고 보장
carr .25oms_carrier_mcp · 운송사 옵션·dispatch·track
hist .25oms_order_history_mcp · 30일 이력 검색·last_order·빈도

예) "평소대로 보내줘" query에서 hist MCP가 last_order로 냉장 SKU·오전 배송을 반환하면 inv·carr는 그 컨텍스트를 받아 ATP만 확인하고 KR-EXP 4:30 옵션을 자동 선택. tool 4개를 다 부르지 않고 평균 1.2개만 호출해도 컨텍스트 hit 91%를 달성한다.

🛰️ MCP 서버 도메인별 노출 tool10월 production 기준 · 4 servers
MCP 서버노출 tool평균 latency컨텍스트 보유
oms_customerget_profile, get_pref, get_segment22msVIP/CLV/선호채널
oms_inventorycheck_atp, lock_stock, release38msper-SKU 가용
oms_carrierget_options, dispatch, track64msOTIF · 서비스 레벨
oms_order_historysearch, last_order, frequency18ms30일 이력

history MCP가 가장 가벼운 18ms로 거의 모든 query에 동반 호출되며, carrier MCP는 외부 API 의존성 때문에 64ms로 가장 느리지만 fallback 정책이 있다. 4개 서버 모두 stateless하게 설계되어 OMS Agent가 rolling memory만 외부에서 관리한다.

참고문헌
[1] 김지훈 외, "MCP 서버 기반 컨텍스트 인식 OMS Agent", IntraLogis 사내 보고서, 2026.10
[2] Anthropic, "Model Context Protocol Specification", 2024
[3] LangGraph Team, "LangGraph MCP Integration Guide", 2025
[4] Cognition AI, "Devin: An Autonomous Software Engineer Agent", 2024
[5] OpenAI, "Function Calling and Tool Use API Reference", 2024
[6] Microsoft, "Copilot Studio Agent Architecture", 2024