이 발표는 캐치 테이블에서 데이터 사이언티스트로 근무하는 양태현 님의 경험을 다룹니다. 주요 내용은 다음과 같습니다:
문제 상황
- 캐치 테이블은 레스토랑 예약 서비스로, 웨이팅 서비스를 제공하고 있었음
- 인기 매장의 경우 2시간 이상의 긴 대기 시간이 발생하였고, 사용자들은 정확한 대기 시간을 알 수 없어 불편을 겪었음
- 기존 웨이팅 시간 예측 방식의 한계:
- 남은 대기팀 수만 보여줌
- 평균 대기 시간 기반으로 예측하여 정확도 부족
해결 방안
- AWS 캔버스를 활용하여 데이터 분석, 모델링, 배포 등의 과정을 효율적으로 수행
- 데이터 랭글링: 데이터 소스 연결, 전처리, 데이터 품질 및 인사이트 확인 등을 캔버스에서 빠르게 수행
- 모델링: 목표 변수 및 평가 지표 자동 설정, 피처 선택, 다양한 모델 학습 방식 적용 등 캔버스 기능 활용
- 배포: 추론 스크립트 커스터마이징 후 엔드포인트로 배포
결과
- 개발 기간 약 40% 단축
- 예측 오차 5분 이내로 감소
- 데이터 분석 및 모델링을 효율적으로 수행
- 높은 예측 성능의 모델 개발
향후 계획
- 사용자 피드백을 바탕으로 모델 성능 지속 개선
- 전체 매장으로 대기 시간 예측 서비스 확대