ملحوظة. ترجمة: هذه ترجمة لتقرير عام بعد الوفاة من المدونة الهندسية للشركة بشكل مسبق. وهو يصف مشكلة في conntrack في مجموعة Kubernetes، مما أدى إلى توقف جزئي لبعض خدمات الإنتاج.
قد تكون هذه المقالة مفيدة لأولئك الذين يريدون معرفة المزيد عن عمليات التشريح بعد الوفاة أو منع بعض مشكلات DNS المحتملة في المستقبل.
هذه ليست DNS
لا يمكن أن يكون DNS
لقد كان DNS
القليل عن عمليات التشريح والعمليات في Preply
يصف تشريح الجثة وجود عطل أو حدث ما في الإنتاج. يتضمن التحليل بعد الوفاة جدولاً زمنيًا للأحداث وتأثير المستخدم والسبب الجذري والإجراءات المتخذة والدروس المستفادة.
في الاجتماعات الأسبوعية مع بيتزا، بين الفريق الفني، نتشارك المعلومات المختلفة. أحد أهم أجزاء هذه الاجتماعات هو تشريح الجثة، والذي غالبًا ما يكون مصحوبًا بعرض تقديمي مع شرائح وتحليل أكثر تعمقًا للحادث. على الرغم من أننا لا نصفق بعد الوفاة، إلا أننا نحاول تطوير ثقافة "لا لوم" (ثقافة بلا لوم). نحن نؤمن أن كتابة وتقديم التشريح بعد الوفاة يمكن أن يساعدنا (وغيرنا) في منع وقوع حوادث مماثلة في المستقبل، ولهذا السبب نقوم بمشاركتها.
يجب أن يشعر الأفراد المتورطون في حادث ما أن بإمكانهم التحدث علنًا بالتفصيل دون خوف من العقاب أو الانتقام. لا لوم! إن كتابة تقرير ما بعد الوفاة ليس عقابًا، بل هو فرصة للتعلم للشركة بأكملها.
باختصار: عدم توفر DNS الجزئي (26 دقيقة) لبعض الخدمات في مجموعة Kubernetes
تأثير: تم فقدان 15000 حدث للخدمات A وB وC
السبب الجذري: لم يتمكن Kube-proxy من إزالة الإدخال القديم بشكل صحيح من جدول conntrack، لذلك كانت بعض الخدمات لا تزال تحاول الاتصال بالبودات غير الموجودة
لتقليل استخدام وحدة المعالجة المركزية، تستخدم نواة Linux شيئًا يسمى conntrack. باختصار، هذه أداة مساعدة تحتوي على قائمة بسجلات NAT المخزنة في جدول خاص. عندما تصل الحزمة التالية من نفس الحافظة إلى نفس الحافظة كما كانت من قبل، لن تتم إعادة حساب عنوان IP النهائي، ولكن سيتم أخذه من جدول conntrack.
كيف يعمل كونتراك
نتائج
كان هذا مثالاً على إحدى عمليات التشريح التي قمنا بها مع بعض الروابط المفيدة. وفي هذه المقالة على وجه التحديد، نشارك المعلومات التي قد تكون مفيدة لشركات أخرى. لهذا السبب نحن لا نخاف من ارتكاب الأخطاء ولهذا السبب نعلن عن أحد نتائج تشريح الجثث لدينا. فيما يلي بعض عمليات التشريح العامة الأكثر إثارة للاهتمام: