Auto Scaling passt die Anzahl der laufenden Ressourcen (z. B. EC2-Instanzen) automatisch basierend auf der Nachfrage an — es fügt Kapazität hinzu, wenn die Last zunimmt, und entfernt sie, wenn die Last abnimmt. Es ist entscheidend für die Erstellung von Anwendungen, die sowohl zuverlässig (Verkehrsspitzen bewältigen) als auch kostengünstig (nicht über-provisioning) sind.
Was Auto Scaling bewirkt
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
