حماسه در مورد مدیران سیستم به عنوان یک گونه در معرض خطر

مدیران سیستم در سراسر جهان، تعطیلات حرفه ای شما را تبریک می گویم!

ما هیچ مدیر سیستمی نداریم (خوب، تقریبا). با این حال، افسانه در مورد آنها هنوز تازه است. به مناسبت عید این حماسه را آماده کرده ایم. خوانندگان عزیز راحت باشید.

حماسه در مورد مدیران سیستم به عنوان یک گونه در معرض خطر

روزی روزگاری دنیای Dodo IS در آتش بود. در آن دوران تاریک، وظیفه اصلی مدیران سیستم ما این بود که یک روز بیشتر زنده بمانند و گریه نکنند.

خیلی وقت پیش، برنامه نویسان کدها را کم و آهسته می نوشتند و فقط هفته ای یکبار آن را روی prod قرار می دادند. بنابراین مشکلات فقط هر هفت روز یک بار به وجود می آمد. اما سپس آنها شروع به نوشتن کدهای بیشتری کردند و آن را بیشتر پست کردند، مشکلات شروع به افزایش کردند، گاهی اوقات همه چیز شروع به از هم پاشیدگی می کرد و بازگشت به عقب بدتر می شد. مدیران سیستم آسیب دیدند، اما این مسخره را تحمل کردند.

غروب ها در خانه می نشستند و اضطراب در جانشان بود. و هر بار که این اتفاق افتاد "هرگز اتفاق نیفتاد، و در اینجا دوباره نظارت سیگنالی برای کمک می فرستد: رفیق، جهان در آتش است!". سپس مدیران سیستم ما بارانی قرمز خود را پوشیدند، شورت را روی ساق‌ها پوشیدند، پیشانی خود را فر کردند و برای نجات دنیای دودو پرواز کردند.

توجه، کمی توضیح هرگز مدیران سیستم کلاسیکی وجود نداشته اند که سخت افزار را در Dodo IS نگهداری کنند. ما بلافاصله روی ابرهای لاجوردی پیشروی کردیم.

آنها چه کردند:

  • اگر چیزی می شکست، آن را طوری می ساختند که تعمیر می شد.
  • سرورهای فریبنده در سطح متخصص.
  • مسئول شبکه مجازی در Azure بودند.
  • مسئول چیزهای سطح پایین بودند، برای مثال، فعل و انفعالات اجزاء (*زمزمه*هایی که در آن گاهی اوقات آنها اطراف را زیر و رو نمی کردند).
  • اتصال مجدد سرور؛
  • و بسیاری از وحشی های دیگر

زندگی تیمی از مهندسان زیرساخت (به قول ما مدیران سیستم خود) شامل خاموش کردن آتش و شکستن مداوم نیمکت های آزمایشی بود. آنها زندگی کردند و غمگین شدند و سپس تصمیم گرفتند فکر کنند: چرا اینقدر بد است یا شاید بتوانیم بهتر از این کار کنیم؟ به عنوان مثال، آیا ما مردم را به برنامه نویسان و مدیران سیستم تقسیم نمی کنیم؟

وظیفه

داده شده: یک مدیر سیستم وجود دارد که سرورهایی در حوزه مسئولیت خود دارد، شبکه ای که او را به سرورهای دیگر، برنامه های سطح زیرساخت (یک سرور وب که میزبان یک برنامه کاربردی، یک سیستم مدیریت پایگاه داده و غیره است) متصل می کند. و یک برنامه نویس وجود دارد که حوزه مسئولیتش کد کار است.

و چیزهایی هستند که در محل اتصال هستند. این مسئولیت کیست؟

معمولاً مدیران سیستم و برنامه نویسان ما دقیقاً در این محل ملاقات می کنند و شروع می شود:

"دوستان، هیچ چیز کار نمی کند، احتمالا به دلیل زیرساخت ها.
- رفیق، نه، توی کد هست.

یک روز در این لحظه، حصاری بین آنها شروع به رشد کرد که از طریق آن با خوشحالی مدفوع می انداختند. کار مثل مدفوع از این طرف حصار به طرف دیگر پرتاب می شد. در همان زمان، هیچ کس به حل و فصل اوضاع نزدیک نشد. شکلک غمگین.

زمانی که چند سال پیش در گوگل به این فکر افتادند که تکلیف رد و بدل نکنند، بلکه به جای انجام یک کار معمولی، پرتوی از آفتاب آسمان ابری را سوراخ کرد.

اما اگر همه چیز را به عنوان یک کد توصیف کنیم چه؟

در سال 2016، گوگل کتابی به نام "مهندسی قابلیت اطمینان سایت" در مورد تغییر نقش یک مدیر سیستم منتشر کرد: از استاد جادو به رویکرد مهندسی رسمی در استفاده از نرم افزار و اتوماسیون. آنها خودشان از تمام خارها و موانع گذشتند، به آن دست زدند و تصمیم گرفتند آن را با دنیا به اشتراک بگذارند. کتاب در مالکیت عمومی است اینجا.

این کتاب حاوی حقایق ساده است:

  • انجام هر کاری به صورت کد خوب است.
  • استفاده از یک رویکرد مهندسی - خوب؛
  • انجام نظارت خوب خوب است.
  • جلوگیری از انتشار سرویس در صورتی که ثبت و نظارت واضحی نداشته باشد نیز خوب است.

این تمرینات توسط گلب ما خوانده شد (واحد اندازهگیری ترمودینامیک) و ما می رویم. در حال اجرا! اکنون در مرحله انتقالی هستیم. تیم SRE تشکیل شده است (6 متخصص آماده وجود دارد، 6 نفر دیگر در حال نصب هستند) و آماده هستند تا جهان را که کاملاً از کد تشکیل شده است برای بهتر شدن تغییر دهند.

ما زیرساخت خود را به گونه ای ایجاد می کنیم که توسعه دهندگان را قادر می سازد تا محیط های خود را مدیریت کنند و به تنهایی با SRE همکاری کنند.

وانگ به جای نتیجه گیری

مدیر سیستم یک حرفه شایسته است. اما دانش بخش سیستم به مهارت های مهندسی نرم افزار عالی نیز نیاز دارد.

سیستم‌ها ساده‌تر و ساده‌تر می‌شوند و دانش فوق‌العاده منحصربه‌فرد مدیریت سرورهای آهنی هر سال کمتر تقاضا می‌شود. فناوری های ابری جایگزین نیاز به این دانش می شوند.

یک مدیر سیستم خوب در آینده نزدیک باید مهارت های مهندسی نرم افزار خوبی داشته باشد. حتی بهتر از آن، او باید مهارت های خوبی در این زمینه داشته باشد.

هیچ کس نمی داند که چگونه آینده را قبل از وقوع پیش بینی کند، اما ما معتقدیم که با گذشت زمان شرکت های کمتر و کمتری وجود خواهند داشت که بخواهند به کارکنان بی پایان مدیران سیستم اضافه کنند. اگرچه، البته، طرفداران باقی خواهند ماند. امروزه تعداد کمی اسب سواری می کنند، بیشتر از ماشین استفاده می کنند، اگرچه عاشقانی نیز وجود دارند ...

روز sysadmin به همه مبارک، کد برای همه!

منبع: www.habr.com

اضافه کردن نظر