Auto Scaling ajusta automáticamente el número de recursos en ejecución (por ejemplo, instancias EC2) según la demanda — agregando capacidad cuando la carga aumenta y eliminándola cuando disminuye. Es clave para construir aplicaciones que sean tanto confiables (manejen picos de tráfico) como eficientes en costos (no sobre-provisionen).
Qué hace el escalado automático
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
