Auto Scaling ajusta automaticamente o número de recursos em execução (por exemplo, instâncias EC2) com base na demanda — adicionando capacidade quando a carga aumenta e removendo-a quando a carga diminui. É fundamental para construir aplicações que sejam tanto confiáveis (capazes de lidar com picos de tráfego) quanto eficientes em custo (sem over-provisioning).
O que o auto scaling faz
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
→ load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
→ load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
