Bij schaal zijn storingen onvermijdelijk — servers crashen, netwerken falen, afhankelijkheden worden onbereikbaar. Ontwerpen voor storingen betekent het bouwen van systemen die storingen tolereren en elegant herstellen in plaats van aan te nemen dat alles werkt. Dit is essentieel voor betrouwbare systemen.
Ontwerp voor storingen (de mentaliteit)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
