I stor skala är fel oundvikliga — servrar kraschar, nätverk fallerar, beroenden blir otillgängliga. Att designa för fel betyder att bygga system som tolererar och återhämtar sig från fel på ett elegant sätt snarare än att anta att allt fungerar. Detta är väsentligt för tillförlitliga system.
Designa för fel (mentaliteten)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
