MLOps(머신러닝 운영)는 DevOps와 유사한 실천을 ML에 적용합니다 — 전체 ML 라이프사이클(데이터, 훈련, 배포, 모니터링)을 신뢰할 만하고 규모 있게 관리합니다. 이는 프로덕션에서 ML을 배포하고 유지하는 데 고유한 운영 과제를 다룹니다.
ML 라이프사이클
ML 프로젝트는 전체 라이프사이클을 수반(단지 모델 훈련이 아님):
1. 데이터 → 데이터 수집, 정제, 레이블링, 버전 관리(데이터가 기초)
2. 훈련 → 모델 개발, 훈련, 평가(실험, 튜닝)
3. 배포 → 모델을 프로덕션에 투입(예측/추론 서빙)
4. 모니터링 → 프로덕션 성능 추적; 문제 탐지
5. 유지보수 → 데이터와 성능이 변함에 따라 모델 재훈련/갱신
→ 일회성 노력이 아니라 지속적 사이클
MLOps가 다루는 것
MLOps → ML 라이프사이클을 신뢰할 만하게 관리하는 실천/도구(ML을 위한 DevOps):
✓ 재현성 → 데이터, 코드, AND 모델 버전 관리; 실험 추적
✓ 자동화 → 훈련, 테스트, 배포 파이프라인 자동화(ML을 위한 CI/CD)
✓ 배포 → 모델을 신뢰할 만하게 서빙; 스케일링, 버전 관리, 롤백
✓ 모니터링 → 모델 성능, 데이터 드리프트(DRIFT, 시간이 지나며 데이터가 변해 → 모델이
저하), 오류 추적 → 언제 재훈련할지 앎
✓ 데이터 과학자, ML 엔지니어, 운영 간 협업
