स्केलवर, अपयश अपरिहार्य आहे — सर्व्हर क्रॅश होतात, नेटवर्क अयोग्य होतात, डिपेंडेंसीज अनुपलब्ध होतात. अपयशासाठी डिजाईन करणे म्हणजे असे सिस्टम बांधणे जे अपयशांना सहन करते आणि सुंदरपणे पुनर्प्राप्त होते बजाय सर्व काही कार्य करते असे गृहीत धरण्याच्या. विश्वसनीय प्रणालीसाठी हे आवश्यक आहे.
अपयशासाठी डिजाईन (मानसिकता)
ASSUME things WILL fail → at scale, failures are NORMAL, not exceptional:
→ servers crash, networks partition, disks fail, dependencies go down, traffic spikes
→ design systems to EXPECT and HANDLE failures gracefully (not assume everything works)
→ "everything fails all the time" → build resilience in.
