Nagyobb skálán a meghibásodások elkerülhetetlenek — a szerverek összeomlanak, a hálózatok meghibásodnak, a függőségek elérhetetlenné válnak. A meghibásodásra tervezés azt jelenti, hogy olyan rendszereket építesz, amelyek tolerálják és kegyelmes módon helyreállnak a meghibásodásokból, ahelyett, hogy azt feltételeznéd, hogy minden működik. Ez lényeges a megbízható rendszerekhez.
A meghibásodásra tervezés (a gondolkodásmód)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
