Në shkallë të gjerë, dështimet janë të pashmangshme — serverët ranojnë, rrjetat dështojnë, varësitë bëhen të paarritshme. Dizajnimi për dështim nënkupton ndërtimin e sistemeve që tolerojnë dhe rikuperohen nga dështimet në mënyrë elegant në vend se të supozojnë se gjithçka funksionon. Kjo është thelbësore për sistemet e besueshme.
Dizajno për dështim (mentaliteti)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
