Research Task · RT-W15 · 2025.08 · WMS AI
🎧 음성 인식 피킹 가이드 시스템
Whisper STT + gTTS + 블루투스 산업용 헤드셋 · 핸즈프리 피킹 · 박소연 선임연구원 · 연구노트 39p 대응
🎯 연구 배경
AI 피킹 경로 최적화 결과(RT-W1~W2)를 음성으로 피커에게 실시간 안내합니다. 태블릿·PDA 화면 대신 핸즈프리 환경에서 두 손을 자유롭게 사용하며 피킹·확인을 수행할 수 있어, 피킹 속도 20% 향상과 오류율 50% 감소를 목표로 합니다.
🧩 음성 가이드 시스템 3구성
STT · 음성 인식
Whisper (fine-tuned)
OpenAI Whisper 모델을 창고 소음 환경에 맞게 파인튜닝. 지게차·컨베이어 백색 노이즈 속에서도 피커 발화를 정확히 인식.
TTS · 음성 합성
gTTS + KR 창고 사전
Google TTS 기반에 한국어 창고 용어 커스텀 사전 추가. "A존 3번 아일 4번 Bay" 같은 도메인 표현을 정확히 발음.
Hardware · 헤드셋
BT 5.0 · IP65
블루투스 5.0 산업용, 방수 IP65 등급. 8시간 배터리·경량 설계. 양쪽 귀에 쓰는 오버이어 타입으로 소음 차단 동시 달성.
💬 음성 인터페이스 예시
[시스템]"A존 3번 아일, 4번 Bay, 2번 선반으로 이동하세요."
[피커]"완료"
[시스템]"상품 확인 완료. 수량 3개를 피킹하세요."
[피커]"확인. 3개"
[시스템]"다음 위치: B존 7번 아일, 2번 Bay..."
💡 시스템 TTS 안내 → 피커 STT 응답 → 시스템 확인 · 다음 위치 안내의 폐루프 대화 구조. 피커가 "완료"/"확인" 등 짧은 명령어만 발화하면 전체 피킹 프로세스가 자동 진행.
📉 8월 운영 성과
✓ 음성 피킹 가이드 도입 후 (2025.08 기준)
피킹 속도 (건/시간)
94건
112건
▲ 19.1%
피킹 오류율
1.8%
0.7%
▼ 61.1%
담당자 만족도
4.1 / 5.0
손 자유로움 호평