Suuressa mittakaavassa viat ovat väistämättömiä — palvelimet kaatuvat, verkot epäonnistuvat, riippuvuudet tulevat saavuttamattomiksi. Suunnittelu vioille tarkoittaa järjestelmien rakentamista, jotka toleroivat ja toipuvat vioista eleganttisesti sen sijaan, että olisivat olettamuksia kaiken toimivuudesta. Tämä on olennaista luotettavien järjestelmien kannalta.
Suunnittelu vioille (ajattelutapa)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
