نوټ ژباړه: دا د شرکت انجینري بلاګ څخه د عامه پوسټ مارټم ژباړه ده
دا مقاله ممکن د هغو کسانو لپاره ګټوره وي چې غواړي د پوسټ مارټم په اړه لږ څه زده کړي یا په راتلونکي کې د ځینې احتمالي DNS ستونزو مخه ونیسي.
دا DNS ندی
دا DNS نشي کیدی
دا DNS وه
په پریپلی کې د پوسټ مارټم او پروسو په اړه لږ څه
پوسټ مارټم په تولید کې خرابوالی یا ځینې پیښې بیانوي. په پوسټ مارټم کې د پیښو مهال ویش، د کارونکي اغیزې توضیحات، اصلي لامل، ترسره شوي اقدامات، او زده شوي درسونه شامل دي.
د پیزا سره په اونۍ کې غونډو کې، د تخنیکي ټیم په منځ کې، موږ مختلف معلومات شریکوو. د داسې غونډو یوه مهمه برخه د پوسټ مارټمونه دي، چې ډیری وختونه د سلایډونو سره د پریزنټشن او د پیښې ژور تحلیل سره وي. که څه هم موږ د پوسټ مارټم وروسته تالی نه وهو، موږ هڅه کوو د "نه ملامت" کلتور رامینځته کړو (
هغه کسان چې په پیښه کې ښکیل دي باید احساس وکړي چې دوی کولی شي په تفصیل سره خبرې وکړي پرته له دې چې د مجازاتو یا عذاب څخه ویره ولري. هیڅ ملامت نه! د پوسټ مارټم لیکل مجازات ندي ، مګر د ټول شرکت لپاره د زده کړې فرصت دی.
په Kubernetes کې د DNS سره ستونزې. پوسټ مارټم
نېټه: 28.02.2020
لیکوالان: امیت یو، اندری ایس، ایګور کی، الیکسی پی.
دريځ: ختم شو
لنډه: د Kubernetes کلستر کې د ځینو خدماتو لپاره د جزوي DNS نشتوالی (26 دقیقې).
نفوذ: د A، B او C خدماتو لپاره 15000 پیښې له لاسه ورکړې
عمده لامل: کیوب پراکسي نشي کولی په سمه توګه د کانټریک میز څخه یو زوړ ننوت لرې کړي، نو ځینې خدمتونه لاهم هڅه کوي چې غیر موجود پوډونو سره وصل شي
E0228 20:13:53.795782 1 proxier.go:610] Failed to delete kube-system/kube-dns:dns endpoint connections, error: error deleting conntrack entries for UDP peer {100.64.0.10, 100.110.33.231}, error: conntrack command returned: ...
محرک: د Kubernetes کلستر دننه د ټیټ بار له امله، CoreDNS-autoscaler په ګمارنه کې د پوډونو شمیر له دریو څخه دوه ته راکم کړ.
د حل لاره: د غوښتنلیک بل ځای پرځای کول د نوي نوډونو رامینځته کول پیل کړل، CoreDNS-autoscaler کلستر ته د خدمت کولو لپاره نور پوډونه اضافه کړل، کوم چې د کانټریک میز بیا لیکلو ته هڅول.
کشف: د پرومیتیوس څارنې د A، B او C خدماتو لپاره د 5xx لوی شمیر غلطۍ کشف کړې او د دندې انجینرانو ته یې زنګ وهلی دی
په کبانا کې 5xx تېروتنې
کړنې
اغېز
ډول
مسؤل
موخه
د CoreDNS لپاره اتوماتیک غیر فعال کړئ
مخنیوی
امیت یو.
DEVOPS-695
د کیشینګ DNS سرور تنظیم کړئ
کمول
ماکس وی.
DEVOPS-665
د کانټریک نظارت تنظیم کړئ
مخنیوی
امیت یو.
DEVOPS-674
درسونه زده کړل
څه ښه شول:
- نظارت ښه کار وکړ. ځواب ګړندی او منظم و
- موږ په نوډونو کې هیڅ محدودیت نه دی مات کړی
څه غلط وو:
- لا تر اوسه نامعلوم اصلي اصلي لامل، ورته ورته
ځانګړی بګ په مقابل کې - ټولې کړنې یوازې پایلې سموي، نه اصلي لامل (بګ)
- موږ پوهیږو چې ژر یا وروسته موږ ممکن د DNS سره ستونزې ولرو، مګر موږ کارونو ته لومړیتوب نه ورکوو
چیرته چې موږ بختور شو:
- راتلونکی ګمارنه د CoreDNS-autoscaler لخوا پیل شوې وه، کوم چې د کانټریک جدول له سره لیکلی و
- دې بګ یوازې ځینې خدمات اغیزمن کړي
مهال ویش (EET)
Время
اغېز
22:13
CoreDNS-autoscaler د پوډونو شمیر له دریو څخه دوه ته راکم کړ
22:18
انجنیرانو په دنده کې د څارنې سیسټم څخه تلیفونونه ترلاسه کول پیل کړل
22:21
انجنیرانو د دندې پر مهال د تېروتنې د لامل په موندلو پیل وکړ.
22:39
انجینرانو په دنده کې یو له وروستي خدماتو څخه پخوانۍ نسخې ته بیرته راګرځول پیل کړل
22:40
د 5xx تېروتنې څرګندیدل بند شوي، وضعیت ثبات لري
- د کشف وخت: 4 min
- د عمل دمخه وخت: 21 min
- د سمولو وخت: 1 min
اضافي معلومات
- د CoreDNS logs:
I0228 20:13:53.507780 1 event.go:221] Event(v1.ObjectReference{Kind:"Deployment", Namespace:"kube-system", Name:"coredns", UID:"2493eb55-3dc0-11ea-b3a2-02bb48f8c230", APIVersion:"apps/v1", ResourceVersion:"132690686", FieldPath:""}): type: 'Normal' reason: 'ScalingReplicaSet' Scaled down replica set coredns-6cbb6646c9 to 2
- د کبانا سره اړیکې (کټ)، ګرافانا (کټ)
چیرې چې لینکس کانټریک نور ستاسو ملګری ندی kube-proxy Subtleties: د متقابل پیوستون بیا تنظیم کول ریسي کانټریک او د DNS لټون وخت پای
د CPU کارول کمولو لپاره، د لینکس کرنل یو څه کاروي چې د کانټریک په نوم یادیږي. په لنډه توګه، دا یو افادیت دی چې د NAT ریکارډونو لیست لري چې په ځانګړي جدول کې زیرمه شوي. کله چې راتلونکی کڅوړه د پخوا په څیر ورته پوډ څخه ورته پوډ ته راشي، وروستی IP پته به بیا نه حسابیږي، مګر د کانټریک میز څخه به اخیستل کیږي.
کنټریک څنګه کار کوي
پایلې
دا زموږ د پوسټ مارټم یوه بیلګه وه چې د ځینې ګټورو لینکونو سره. په ځانګړې توګه پدې مقاله کې، موږ هغه معلومات شریکوو چې ممکن د نورو شرکتونو لپاره ګټور وي. له همدې امله موږ له تېروتنې نه ډارېږو او له همدې امله موږ خپل پوسټ مارټمونه عامه کوو. دلته ځینې نور په زړه پوري عامه پوسټ مارټمونه دي:
- GitLab:
د جنوري په 31 د ډیټابیس بندیدو پوسټ مارټم - Dropbox:
د مړیني پوسټ مارټم - Spotify:
د DNS سره د Spotify مینه / نفرت اړیکه - ډیری نورو څخه
دا لنډیز او ذخیرهد کوبرنیټس ناکامۍ کیسې - همداراز
مثال عامه پوسټ مارټم د SRE کتاب سره
سرچینه: www.habr.com