**훈련(training)**은 데이터로부터 ML 모델을 가르치는 과정(패턴 학습, 파라미터 조정)이고, **추론(inference)**은 훈련된 모델을 사용해 새 데이터에 대한 예측을 수행하는 것입니다. 이 둘은 서로 다른 특성과 비용을 가진 구별되는 단계입니다.
훈련 vs 추론
훈련(TRAINING) → 모델을 가르침(학습 단계):
→ 많은 DATA를 입력 → 모델이 패턴을 학습하도록 parameter를 조정
→ 계산적으로 비쌈(많은 데이터, 연산, 시간 — 예: LLM 훈련은 막대한 자원 소요);
한 번(또는 갱신을 위해 주기적으로) 수행
→ 훈련된 MODEL을 생성
추론(INFERENCE) → 훈련된 모델을 사용(예측 단계):
→ 훈련된 모델에 NEW 입력을 주면 → 출력(예측/생성)을 생성
→ 훈련보다 훨씬 저렴/빠름(단일 순전파); 여러 번 수행(모델을 사용할 때마다)
→ 한 번 훈련(비쌈), 여러 번 추론(저렴, 프로덕션에서)
실무적 함의
→ 훈련 → 연구/개발; 대규모 데이터셋, 강력한 하드웨어(GPU/TPU), 시간이 필요
→ 추론 → 프로덕션 사용; 지연시간, 비용, 규모를 최적화(상시 실행)
→ API로 LLM 사용 → 사전 훈련된 model에 대한 추론(INFERENCE) 수행(훈련하지 않음)
→ 규모에서 추론 비용/지연시간이 중요(많은 예측); 훈련 비용은 일회성(큰) 투자
