ما پشتیبانی را ارزان تر می کنیم و سعی می کنیم کیفیت را از دست ندهیم

ما پشتیبانی را ارزان تر می کنیم و سعی می کنیم کیفیت را از دست ندهیمحالت بازگشتی (همچنین به عنوان IPKVM شناخته می شود)، که به شما امکان می دهد مستقیماً از لایه Hypervisor به VPS بدون RDP متصل شوید، 15 تا 20 دقیقه در هفته صرفه جویی می کند.

اولین و مهمترین چیز این است که مردم را عصبانی نکنید. در سراسر جهان، پشتیبانی به خطوط تقسیم می شود و کارمند اولین کسی است که راه حل های معمولی را امتحان می کند. اگر کار از حد آنها فراتر رفت، آن را به خط دوم منتقل کنید. بنابراین، در میان مدیران VDS اغلب افرادی وجود دارند که می دانند چگونه فکر کنند. بر خلاف بسیاری از پشتیبانی های دیگر. خوب، حداقل به طور قابل توجهی اغلب. و آنها بلیط را به خوبی ساختار می دهند و بلافاصله هر چیزی را که لازم است توصیف می کنند. اگر خط اول "تار" شود و به طور تصادفی از شما بخواهد در پاسخ به این موضوع آن را روشن و خاموش کنید، این یک شکست است.

کار بسیار ساده است: ارائه پشتیبانی کافی برای میزبانی VDS خود با حداقل هزینه. از آنجا که ما فست فود دنیای ارائه دهندگان هاست هستیم: بدون "لیسیدن" خاص، قیمت پایین، کیفیت معمولی. در اوایل قبلاً داستانی در مورد این واقعیت وجود داشت که با ظهور حرامزاده های اینستاگرام که سعی در خودکارسازی مدیریت حساب و صاحبان مشاغل کوچک با حسابداری از راه دور و سایر افرادی که در فناوری خیلی پیشرفته نیستند، ارتباط "به عنوان یک ادمین به یک ادمین" از کار افتاد. مجبور شدم زبان ارتباط را عوض کنم.

اکنون کمی بیشتر در مورد فرآیندها و مشکلات اجتناب ناپذیر آنها به شما خواهم گفت.

مردم شماره 1 را عصبانی نکنید

هر گونه پشتیبانی تولید خط مونتاژ است. یک برنامه از راه می رسد، کارمند خط اول بلافاصله سعی می کند یک موقعیت معمولی را تشخیص دهد که قبلاً هزار بار اتفاق افتاده است و هزاران بار دیگر اتفاق خواهد افتاد. به احتمال 90٪ این برنامه یک برنامه معمولی است و می توانید با فشار دادن چند دکمه به معنای واقعی کلمه به آن پاسخ دهید تا الگو جایگزین شود. معمولاً فقط باید چند کلمه در قالب بنویسید و کارتان تمام است. یا به رابط مدیریت بروید و چند دکمه را در آنجا فشار دهید. در موارد پیچیده تر (مثلاً انتقال از منطقه به منطقه)، باید الگوریتم را دنبال کنید.

آنچه مردم را بیش از همه، صرف نظر از سایر ویژگی های حمایت، آزار می دهد، واکنش معمول به یک درخواست غیر معمول است. بلیطی می رسد، جایی که همه چیز با جزئیات توضیح داده شده است، داده های لازم برای سه سوال در پیش است، مشتری پیش بینی یک گفتگو را می کند... و طبق اولین کلمات، کارمند پشتیبانی در خلبان خودکار یک آکورد را برای جایگزینی الگو تایپ می کند. "سعی کنید راه اندازی مجدد کنید، باید کمک کند."

این چیزی است که واقعاً ذهن مردم را باز می کند و پس از چنین موقعیت هایی است که منفی ترین نظرات و نظرات عصبانی باقی می ماند. واضح است که ما خیلی اشتباه کردیم، اینجاست که آمار را می دانیم. به طور کلی، ما به اشکال مختلف اشتباه کردیم، اما چنین مواردی همیشه وحشیانه هستند. از جمله برای خودمان. البته ما دوست داریم که اصلا این اتفاق نیفتد. اما این در عمل خیلی ممکن نیست: هر چند هفته یک بار، یک کارمند خسته از یکنواختی دکمه های خنده دار را فشار می دهد.

مردم شماره 2 را عصبانی نکنید

دومین چیزی که به همان اندازه ذهن را باز می کند زمانی است که هیچ کس به مدت کافی به بلیط پاسخ نمی دهد. در اروپا، این رفتار حمایتی طبیعی است: سه روز قبل از پذیرش یک حادثه برای کار، بیش از حد معمول است. حتی اگر خیلی فوری هستید و چیزی در حال سوختن است - بدون شبکه های اجتماعی، بدون تلفن، بدون پیام رسان، فقط ایمیل بزنید و منتظر نوبت خود باشید. در روسیه این بسیار کمتر رایج است، اما برخی از بلیط ها هنوز "فراموش شده اند". در همان ابتدای کار، یک SLA را برای اولین پاسخ 15 دقیقه ای تنظیم کردیم. و این صادقانه 24 ساعته است. واضح است که وقتی میزبانی VDS بزرگ می شود، این ظاهر می شود. اما ارائه دهندگان خدمات مشکوک این را ندارند. و ما در ابتدا مشکوک بودیم و تنها پس از آن کم و بیش بزرگ شدیم. خوب، کم و بیش متوسط.

خط اول اپراتورهایی هستند که به آنها اسکریپت داده شد و به آنها آموزش داده شد که به موقعیت های معمولی واکنش نشان دهند. آنها به سرعت مشکلات را حل می کنند و در عرض 15 دقیقه سعی می کنند یا با یک اقدام معمولی پاسخ دهند یا گزارش دهند که بلیط در حال انجام است و آن را به دومی منتقل می کنند.

خط دوم میزبانی مدیران است؛ آنها می دانند چگونه تقریباً همه چیز را با دست انجام دهند. همچنین یک مدیر پشتیبانی وجود دارد که می تواند همه کارها را انجام دهد و کمی بیشتر. خط سوم توسعه دهندگان هستند، آنها بلیط هایی مانند "این را در رابط اصلاح کنید" یا "فلان پارامتر اشتباه در نظر گرفته شده است" دریافت می کنند.

تعداد برنامه ها را کاهش دهید

به دلایل واضح، اگر می‌خواهید پشتیبانی ارزان‌تری ارائه کنید، نباید خط اول را افزایش دهید تا مردم بتوانند سریع‌تر اسکریپت‌ها را مدیریت کنند، بلکه باید اتوماسیون را افزایش دهید. به طوری که به جای افراد دارای فیلمنامه، فیلمنامه های واقعی وجود دارد. بنابراین، یکی از اولین کارهایی که انجام دادیم این بود که فرآیندهای افزایش یک ماشین مجازی، مقیاس بندی بر اساس منابع (از جمله با بالا و پایین کردن دیسک، اما نه بر اساس فرکانس پردازنده) و سایر موارد مشابه را خودکار کنیم. هرچه کاربر بیشتر بتواند از رابط انجام دهد، زندگی با خط اول آسان تر است و می تواند کوچکتر باشد. وقتی کاربر به چیزی که در حساب شخصی او است دسترسی پیدا می کند، باید آن را انجام دهد و به او بگوید که چگونه می تواند آن را خودش انجام دهد.

اگر به حمایت نیاز ندارید، پس او کار خوبی انجام می دهد.

ویژگی دوم که باعث صرفه جویی زیادی در زمان می شود، زمان زیادی است که برای تکمیل پایگاه دانش نیاز است. اگر کاربر مشکلی داشته باشد که در لیست اقدامات پشتیبانی شده گنجانده نشده است (اغلب اینها سوالاتی در سطح "نحوه نصب سرور Minecraft" یا "کجا می توان VPS را در سرور Win" تنظیم کرد) است. مقاله در پایگاه دانش نوشته شده است. همان مقاله مفصل برای همه درخواست های عجیب و غریب نوشته شده است. به عنوان مثال، اگر کاربری از پشتیبانی درخواست کند که فایروال ویندوز سرور داخلی را حذف کند، سپس ما آنها را می فرستیم تا در مورد اینکه اگر واقعاً غیرفعال شود چه اتفاقی می افتد و چگونه مجوزها را فقط برای نرم افزار انتخاب شده تغییر دهند، بخوانند. چون مشکل معمولاً از این است که چیزی به دلیل تنظیمات نمی تواند وصل شود و نه از خود فایروال. اما توضیح این موضوع هر بار در دیالوگ بسیار دشوار است. اما به نوعی نمی خواهم فایروال را غیرفعال کنم، زیرا به زودی یا ماشین مجازی یا مشتری را از دست خواهیم داد.

اگر چیزی در مورد نرم‌افزار کاربردی در پایگاه دانش بسیار محبوب شد، می‌توانید توزیع را به بازار اضافه کنید تا سرویس «راه‌اندازی سرور با این از قبل نصب شده» ظاهر شود. در واقع، این همان چیزی است که با Docker اتفاق افتاد و این همان چیزی است که در سرور Minecraft رخ داد. باز هم، یک دکمه "خوب مرا انجام بده" در رابط باعث صرفه جویی در صدها بلیط در سال می شود.

حالت اضطراری

پس از این مراحل، جدی ترین خرابی هایی که نیاز به کار دستی دارند با این واقعیت باقی می مانند که کاربر به دلایلی ابزار دسترسی از راه دور به سیستم عامل مهمان را در Hypervisor از دست داده است. رایج ترین مورد، تنظیمات نادرست فایروال است، دومین مورد رایج برخی از اشکالات است که مانع از شروع نرمال Win می شود و شما را مجبور می کند تا به حالت Safe Mode راه اندازی مجدد کنید. و در حالت امن، RDP به طور پیش فرض در دسترس نیست.

ما یک حالت اضطراری برای این مورد ایجاد کرده ایم. در واقع، معمولاً برای دسترسی به یک ماشین VDS باید نوعی کلاینت برای کار از راه دور داشته باشید. اغلب ما در مورد دسترسی کنسول، RDP، VNC یا موارد مشابه صحبت می کنیم. عیب این روش ها این است که بدون سیستم عامل کار نمی کنند. اما در سطح Hypervisor می توانیم تصویر را روی صفحه دریافت کنیم و فشارهای صفحه کلید را به آنجا منتقل کنیم! درست است، این پردازنده را بسیار بارگیری می کند (به دلیل پخش واقعی ویدیو)، اما به شما امکان می دهد به نتیجه دلخواه برسید.

بنابراین دسترسی به حالت اضطراری را به همه کاربران داده ایم اما از نظر مدت زمان استفاده مداوم محدود است. خوشبختانه، همانطور که تمرین نشان می دهد، این زمان برای راه اندازی مجدد و رفع مشکل کافی است.

نتیجه حتی بلیط های پشتیبانی کمتر است. و جایی که ادمین بتواند خودش بلیت را تعمیر کند، پشتیبانی لازم نیست وارد شود و آن را کشف کند.

مشکلات باقی مانده

اغلب، کاربران فکر می کنند که پشتیبانی چیزی را به آنها فشار می دهد. متأسفانه، هیچ کاری نمی توان در مورد این موضوع انجام داد (یا ما به چیزی نرسیدیم). دو نمونه رایج عبارتند از محدودیت منابع و حفاظت DDoS.

هر ماشین مجازی محدودیت هایی در بار دیسک، حافظه و ترافیک مجاز دارد. قابلیت تعیین محدودیت در پیشنهاد مشخص شده است، اما خود محدودیت‌ها به گونه‌ای انتخاب شده‌اند که اکثر کاربران بتوانند بدون اطلاع از آن‌ها بی‌صدا کار کنند. اما اگر به طور ناگهانی شروع به دست و پنجه نرم کردن با کانال و دیسک شدید، آنگاه الگوریتم ها به طور خودکار به کاربر هشدار می دهند. از فروردین سال گذشته قفل های اتوماتیک را حذف کرده ایم. در عوض، تعیین محدودیت های نرم برای یک دوره متغیر.

قبلاً به این صورت بود: یک هشدار، سپس، اگر کاربر توجه نکرد، مسدود کردن خودکار. و در آن لحظه مردم آزرده شدند: "در مورد چه چیزی صحبت می کنید، سیستم شما باگ است، هیچ اتفاقی نیفتاده است!" - و سپس می توانید سعی کنید نرم افزار کاربردی را درک کنید یا پیشنهاد افزایش طرح تعرفه را بدهید. ما فرصتی برای درک عملکرد نرم افزار کاربردی نداریم، زیرا این خارج از محدوده پشتیبانی است. اگرچه چند مورد اول همراه با کاربران مرتب شد. من مخصوصاً آن موردی را به یاد می‌آورم که در آن کلاهبردار بازدیدهای یوتیوب یک تروجان داخلی داشت و این تروجان در حال لو رفتن حافظه بود. در نهایت به این نتیجه رسیدیم که این‌ها Heisenbug نیستند، بلکه مشکلات کاربران هستند، در غیر این صورت ما با درخواست‌های مشابه غرق می‌شویم. اما هنوز حتی یک نفر اعتراف نکرده است که می تواند از تعرفه ها تجاوز کند.

یک داستان مشابه در مورد DDoS است: ما می نویسیم که شما کاربر عزیز مورد حمله قرار گرفته اید. محافظ را وصل کنید لطفا و کاربر: "بله، خودت به من حمله می کنی!" البته، ما فقط یک کاربر DDoS می کنیم تا از 300 روبل آنها را فریب دهیم. این یک تجارت سودآور است. بله، می دانم که بسیاری از سایت های میزبانی بزرگ در دسته بندی گران تر، این محافظت را در تعرفه گنجانده اند، اما ما نمی توانیم این کار را انجام دهیم: اقتصاد فست فود حداقل قیمت های دیگری را دیکته می کند.

به همان اندازه، کسانی که داده های آنها را حذف کرده ایم، از پشتیبانی ناراضی هستند. به این معنا که پس از پایان دوره پرداخت به طور مشروع حذف شد. اگر شخصی اجاره VDS خود را تمدید نکند، چندین نوتیفیکیشن ارسال می‌شود که توضیح می‌دهد چه اتفاقی خواهد افتاد. پس از اتمام پرداخت، ماشین مجازی متوقف می شود، اما تصویر آن ذخیره می شود. اعلان دیگری می رسد، و سپس چند اعلان دیگر. تصویر قبل از حذف دائمی به مدت هفت روز دیگر ذخیره می شود. بنابراین، دسته ای از افراد هستند که از این موضوع بسیار ناراضی هستند. از «استعفای مدیر، اعلان‌ها به ایمیل او ارسال شد، بازگرداندن» و با اتهامات کلاهبرداری و تهدید به آسیب فیزیکی پایان یافت. دلیل آن همین قیمت ها برای همه کاربران دیگر است. اگر آن را به مدت یک ماه ذخیره کنیم، به فضای ذخیره سازی بیشتری نیاز خواهیم داشت. این به معنای قیمت های بالاتر برای هر مشتری است. و اقتصاد فست فود ... خوب، شما ایده. و در نتیجه ، در انجمن ها ما نظراتی را به این روحیه دریافت می کنیم که "آنها پول گرفتند ، داده ها را حذف کردند ، کلاهبرداران".

من می خواهم توجه داشته باشم که ما یک ردیف تعرفه های حق بیمه داریم. البته در آنجا وضعیت متفاوت است، زیرا ما خواسته های مشتری را در نظر می گیریم و در صورت عدم پرداخت، محدودیت و حذف را به صورت انعطاف پذیر تنظیم می کنیم (ما آن را در منهای قرار می دهیم تا آن را مسدود نکنیم). در آنجا از نظر اقتصادی امکان پذیر است، زیرا واقعاً هر چیزی ممکن است اتفاق بیفتد و حفظ یک مشتری بزرگ دائمی گران است.

گاهی اوقات کاربران بدخواه هستند. چندین بار سیستم ما با خرابی صدها ماشین مجازی به دلیل برخی اقدامات آشکارا نامشروع مشتریان مواجه شد. در واقع، دقیقاً به دلیل چنین موقعیت هایی بود که ما به درایورهای شبکه خود نیاز داشتیم تا فعالیت شبکه را نظارت کنند و ببینیم که کاربر از سرور خود حمله ای را انجام نمی دهد. نظارت بر چنین طرحی بسیار مهم است تا مرزهای ماشین های مجازی همسایه توسط افراد مزاحم نقض نشود.

کسانی هستند که به سادگی پیشنهاد را هرزنامه می فرستند، مال من می کنند یا به شکل دیگری این پیشنهاد را نقض می کنند. سپس برای حمایت در می زند و می پرسد چه مشکلی رخ داده و چرا ماشین مسدود شده است. اگر فرآیند موجود در بلیط در اسکرین شات "spam sender.exe" نامیده می شود، احتمالاً مشکلی پیش می آید. تقریباً هر دو هفته یک بار شکایت هایی از سونی یا لوکاس فیلم (در حال حاضر دیزنی) دریافت می کنیم که فردی از ماشین مجازی ما از طیف آدرس های IP ما در حال پخش فیلم سوخته است. برای این، شما بلافاصله با توجه به پیشنهاد، پول باقی مانده در حساب را مسدود کرده و برمی گردانید (به شما یادآوری می کنم: کوانتیزاسیون ما در ثانیه است، یعنی همیشه یک تعادل وجود خواهد داشت). و برای پس گرفتن پول، طبق قانون، باید پاسپورت خود را نشان دهید: این ضد پولشویی است. دزدان دریایی به دلایلی به جای نشان دادن گذرنامه، می نویسند که ما از آنها پول برداشتیم و فراموش کردند که برخی از شرایط را روشن کنند.

آه بله. بهترین درخواست ما در سال این است: "آیا می توانم قبل از خرید یک ماشین مجازی را برای چند روز با نرخ 30 روبل در ماه تست کنم؟"

مجموع

خط اول بلیط ها را مرتب می کند و با اقدامات معمولی پاسخ می دهد. بیشترین نارضایتی در اینجاست. هنوز هم امکان رفع این مشکل وجود نخواهد داشت، زیرا اساس رفع آن در اتوماسیون میزبانی، یعنی در یک عقب ماندگی عظیم است. بله، ما بیش از بسیاری در بازار داریم، اما هنوز کافی نیست. بنابراین بهترین کاری که می توان انجام داد ایجاد نظارت خط اول است. نظارت بر میز کمک - اجرای KPI خط اول. تأخیر در SLA در زمان واقعی قابل مشاهده است: چه کسی، اغلب - چرا. به لطف چنین هشدارهایی، برنامه ها هرگز گم نمی شوند. بله، ممکن است بلیط با الگویی که در مورد موضوع نیست پاسخ داده شود، اما ما قبلاً این را از بازخورد دریافتیم.

اگر مشتری واقعاً بپرسد، متخصص خط دوم می تواند به سرور برود و آنچه را که مشتری نیاز دارد در آنجا انجام دهد (شرط تأیید نامه ای است که در آن اطلاعات ورود به سرور را ارائه می دهد).

ما این کار را به ندرت انجام می دهیم و چنین کاری را فقط به بهترین ها واگذار می کنیم، زیرا می خواهیم تضمین هایی داشته باشیم که به داده های کاربر آسیب نرسد. بهترین ها خط دوم پشتیبانی هستند.

خط اول دارای یک پایگاه دانش است که می توانید برای جستجوی چیزهای پیچیده ارسال کنید.

یک حساب شخصی سرشار از توابع به اضافه یک پایگاه دانش - و اکنون ما توانستیم تعداد درخواست ها را به طور متوسط ​​به 1-1,5 در سال برای هر مشتری کاهش دهیم.

خط دوم معمولاً برنامه های پیچیده ای را پردازش می کند که نیاز به کار دستی دارند. آنچه معمول است: هر چه طرح تعرفه گران تر باشد، چنین درخواست هایی برای هر ماشین مجازی کمتر است. معمولاً به این دلیل که کسانی که می توانند تعرفه های گران قیمت را بپردازند یا متخصصانی در کارمندان خود دارند یا به سادگی نیمی از مشکلات به دلیل وجود پیکربندی کافی برای همه چیز به وجود نمی آید. من هنوز قهرمانی را به یاد دارم که قدیمی ترین سرور ویندوز را روی پیکربندی با 256 مگابایت رم نصب کرد.

خط دوم دارای مجموعه ای از کیت های توزیع و مجموعه ای از اسکریپت های اتوماسیون است. هر دو می توانند در صورت نیاز به روز شوند.

خط دوم و مدیران شخصی تعرفه های VIP می توانند یادداشت هایی را به پروفایل مشتری اضافه کنند. اگر او یک ادمین لینوکس است، آن را یادداشت می کنیم. این اولین اشاره خط خواهد بود: کاربر با اطمینان می داند که این یک شلیک به پا نیست، بلکه تخریب کنترل شده است.

خط سوم عجیب ترین ها را حکم می کند. به عنوان مثال، ما یک باگ داشتیم که دسترسی به یکی از عملکردهای حساب شخصی شما در فایرفاکس را غیرممکن می کرد. کاربر مستقیماً باج خواهی کرد: "اگر در عرض 12 ساعت آن را برطرف نکنید، من در تمام نظرات میزبان می نویسم." همانطور که مشخص شد، مشکل در adblock سفارشی بود. در سمت کاربر، به اندازه کافی عجیب. اغلب خطاهای پیچیده بدون جزئیات رخ می دهند و دیگر نمی توان آنها را تکرار کرد. کارآگاهانی با یک اسکرین شات وجود دارند: "چرا یک ماهه درستش می کنی؟" - "بله، ما تمام این مدت به دنبال اشکال شما بودیم،" "اوه، خوب، امروز دوباره با آن برخورد کردم، اما نتوانستم دوباره آن را تکرار کنم" ...

به طور کلی، شما هرگز نمی دانید که یک اسکرین شات از یک دیالوگ با پشتیبانی به کجا می رسد و اگر فردی برای حمایت ضربه بزند، پس مشکل دارد. شما می توانید نگرش خود را بهبود بخشید. حداقل تلاش کن

بله، ما می دانیم که پشتیبانی ما کامل نیست، اما می خواهم باور کنم که سرعت کافی را با کیفیت کافی ترکیب می کند. و قیمت تعرفه را برای کسانی که می توانند بدون آن انجام دهند افزایش نمی دهد.

ما پشتیبانی را ارزان تر می کنیم و سعی می کنیم کیفیت را از دست ندهیم

منبع: www.habr.com

اضافه کردن نظر