Σε μεγάλη κλίμακα, οι αστοχίες είναι αναπόφευκτες — οι διακομιστές καταρρέουν, τα δίκτυα αποτυγχάνουν, οι εξαρτήσεις γίνονται μη διαθέσιμες. Το σχεδιασμό για αστοχία σημαίνει τη δημιουργία συστημάτων που ανέχονται και ανάγονται από αστοχίες με χάρη παρά το να υποθέτουν ότι όλα λειτουργούν. Αυτό είναι απαραίτητο για αξιόπιστα συστήματα.
Σχεδιασμό για αστοχία (το νοοτροπία)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
