Kuinka auto scaling toimii AWS:ssä?

Question

Accepted Answer

**Auto Scaling** säätää automaattisesti käytössä olevien resurssien määrää (esim. EC2-instansseja) kysynnän perusteella — lisää kapasiteettia kuorman kasvaessa ja poistaa sitä kuorman pienentyessä. Se on avain sovellusten rakentamiseen, jotka ovat sekä **luotettavia** (käsittelevät liikenteen piikit) että **kustannustehokkaita** (älä ylivarusta).

## Mitä auto scaling tekee

```text
Auto Scaling adjusts capacity AUTOMATICALLY based on demand:
  → load INCREASES (traffic spike) → add instances (scale OUT) → handle the load
  → load DECREASES → remove instances (scale IN) → save money
→ Match capacity to demand automatically: reliable under load, cheap when idle.
```

## EC2 Auto Scaling Groups (ASG)

```text
An AUTO SCALING GROUP manages a fleet of EC2 instances:
  MIN / MAX / DESIRED capacity → bounds and target number of instances
  LAUNCH TEMPLATE → how to launch new instances (AMI, type, config)
  SCALING POLICIES → rules for when to scale (see below)
  HEALTH CHECKS → replace unhealthy instances automatically (self-healing!)
  → typically spread across multiple AZs (high availability)
```

## Skaalausperiaatteet (milloin skaalata)

```text
TARGET TRACKING → keep a metric at a target (e.g. "keep average CPU at 50%") — simplest
STEP / SIMPLE SCALING → add/remove N instances when a metric crosses a threshold
SCHEDULED → scale at known times (e.g. more capacity during business hours)
PREDICTIVE → ML-based, anticipating load
→ Usually based on CloudWatch metrics (CPU, request count, custom metrics).
```

## Miksi se on tärkeää

```text
✓ RELIABILITY — handle traffic spikes automatically (no manual intervention, no overload)
✓ COST-EFFICIENCY — scale IN during low demand → don't pay for idle capacity
✓ SELF-HEALING — auto-replace failed instances (combined with health checks)
✓ Pairs with a LOAD BALANCER (distributes traffic across the scaled instances)
```

## Miksi se on tärkeää

Auto scalingin ymmärtäminen on arvokasta sovellusten rakentamiselle, jotka ovat sekä luotettavia että kustannustehokkaita, joten se on tärkeää käytännön AWS-osaamista.

Auto scaling ratkaisee perustavanlaatuisen pilvihaasteen: kapasiteetin sovittaminen **vaihtelevaan kysyntään** automaattisesti — **instanssien lisääminen kuorman kasvaessa** (liikenteen piikit käsitellään ilman manuaalista interventioita tai ylikuormitusta, varmistaen luotettavuuden) ja **poistaminen kuorman pienentyessä** (vältetään maksaminen tyhjäkäyvästä kapasiteetista, varmistaen kustannustehokkuuden).

Tämä kaksoishyöty (luotettavuus kuormituksen alla + kustannussäästöt käyttämättömällä kapasiteetilla) on keskeistä pilven joustavuuden hyödyntämisessä, ja se on paljon parempi kuin staattinen varustaminen huippukuormalle (tuhlaileva) tai keskimääräiselle kuormalle (epäonnistuu piikkeillä).

**Auto Scaling Groups** -ryhmien ymmärtäminen (EC2-instanssien laivuston hallinta min/max/desired-kapasiteetilla, launch-malleilla ja terveystarkistuksilla, jotka automaattisesti korvaavat epäterveita instansseja **itseparanemisen** osalta) ja niiden levittäminen **useiden AZ:iden** välille (skaalauksen yhdistäminen korkean saatavuuden kanssa) on ydinpraktinen osaaminen.

**Skaalausperiaatteiden** ymmärtäminen (tavoiteseuranta metriikan, kuten CPU:n, ylläpitoon tavoitetasolla — yksinkertainen ja yleisin; askelskaalaus kynnysarvoilla; ajoitettu skaalaus tunnetuille kaavioille; ennakoiva skaalaus) CloudWatch-metriikkojen perusteella on välttämätöntä skaalauksen asianmukaiselle konfiguroinnille.

Tieto siitä, että auto scaling **yhdistyy kuormantasaajaan** (joka jakaa liikenteen dynaamisesti muuttuvien instanssien välillä) täydentää skaalautuvaa, kestävää arkkitehtuuria.

Koska muuttuvan kysynnän luotettava ja kustannustehokas käsittely on pilvivaatimus, ja koska auto scaling (skaalausryhmillä, periaatteilla, terveystarkistuksilla ja kuormantasauksella) on mekanismi, joka sen saavuttaa, auto scalingin ymmärtäminen on arvokasta, käytännöllisesti tärkeää AWS-osaamista sovellusten rakentamiselle, jotka skaalautuvat kysynnän mukaan — perustavanlaatuinen kyky luotettavalle, kustannustehokkaalle pilviarkitehtuurille ja keskeinen aihe järjestelmien suunnittelussa, jotka käsittelevät todellisen maailman muutuvaa liikennettä.