L'entraînement est le processus d'enseignement d'un modèle ML à partir de données (apprentissage de motifs, ajustement des paramètres), tandis que l'inférence est l'utilisation du modèle entraîné pour faire des prédictions sur de nouvelles données. Ce sont des phases distinctes avec des caractéristiques et des coûts différents.
Entraînement vs inférence
TRAINING → teaching the model (the LEARNING phase):
→ feed lots of DATA → the model adjusts its parameters to learn patterns
→ computationally EXPENSIVE (lots of data, compute, time — e.g. training an LLM costs
huge resources); done once (or periodically to update)
→ produces a trained MODEL
INFERENCE → using the trained model (the PREDICTION phase):
→ give the trained model NEW input → it produces an output (prediction/generation)
→ much CHEAPER/faster than training (a single forward pass); done MANY times (every
time you use the model)
→ train once (expensive), infer many times (cheaper, in production)
