U velikoj skali, kvarovi su neizbježni — serveri padaju, mreže se kvare, ovisnosti postaju nedostupne. Dizajniranje za kvarove znači izgradnja sustava koji toleriraju i obnavljaju se iz kvarova gracefully umjesto pretpostavljanja da sve funkcionira. To je esencijalno za pouzdane sustave.
Dizajniranje za kvarove (mentalitet)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
