Esant dideliam mastui, nesėkmos yra neišvengiamos — serveriai sugenda, tinklas nepavyksta, priklausomybės tampa neprieinamos. Projektuojant atsižvelgiant į nesėkmes, reikia kurti sistemas, kurios toleruoja ir atsistato iš nesėkmų gracingai, o ne darant prielaidą, kad viskas veikia. Tai yra nezbūtina patikimiems sistemoms.
Projektuoti atsižvelgiant į nesėkmes (nuomonė)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
