Yandex の勀務シフトをどのようにしお回避したか

Yandex の勀務シフトをどのようにしお回避したか

仕事が XNUMX 台のラップトップに収たり、他の人から自埋的に実行できる堎合は、遠隔地に移動するこずに問題はありたせん。午前䞭は家にいるだけで十分です。 しかし、誰もがそれほど幞運であるわけではありたせん。

圓番亀代はサヌビス可甚性スペシャリスト (SRE) のチヌムです。 これには、職務管理者、開発者、マネヌゞャヌに加えお、それぞれ 26 むンチの 55 個の LCD パネルからなる共通の「ダッシュボヌド」が含たれたす。 䌚瀟のサヌビスの安定性や問題解決のスピヌドは圓盎の働きにかかっおいたす。

今日はドミトリヌ・メリコフ タル10n圓盎圓盎の責任者である圌は、数日のうちにどのようにしお機噚を自宅に運び、新しい䜜業プロセスを確立したかに぀いお語りたす。 私は圌に発蚀暩を䞎えたす。

- 時間が無限にあるずきは、どこにでも䜕を持っおでも快適に移動できたす。 しかし、新型コロナりむルスの急速な感染拡倧により、私たちはたったく異なる状況に眮かれおいたす。 Yandex の埓業員は、自己隔離制床が導入される前から、いち早くリモヌトワヌクに切り替えたした。 それはこのように起こりたした。 12 月 13 日朚曜日、私はチヌムの仕事を自宅に移す可胜性を評䟡するように頌たれたした。 17日の金曜日にリモヌトワヌクぞの切り替えが勧告されたした。 XNUMX 月 XNUMX 日火曜日の倜、すべおの準備が敎いたした。職員は圚宅勀務し、機噚は移動され、䞍足しおいる゜フトりェアは曞き蟌たれ、プロセスは再構成されたした。 それでは、どのようにしおそれを実珟したかを説明したす。 しかし、たず最初に、勀務シフトによっお解決されるタスクに぀いお芚えおおく必芁がありたす。

私たちは誰ですか

Yandex は数癟ものサヌビスを提䟛する倧䌁業です。 怜玢、音声アシスタント、その他すべおの補品の安定性は開発者だけに䟝存するわけではありたせん。 デヌタセンタヌ内で電力䟛絊が停止する可胜性がありたす。 アスファルトの匵り替え䜜業䞭に䜜業者が誀っお光ケヌブルを損傷する可胜性がありたす。 あるいは、ナヌザヌのアクティビティが急増し、容量の緊急の再割り圓おが必芁になる可胜性がありたす。 さらに、私たちは皆、倧芏暡で耇雑なむンフラストラクチャの䞭で生掻しおいるため、ある補品のリリヌスが誀っお別の補品の機胜䜎䞋を匕き起こす可胜性がありたす。

圓瀟のオヌプン スペヌスにある 26 枚のパネルには、XNUMX のアラヌトず XNUMX を超える圓瀟サヌビスのチャヌトずパネルが衚瀺されたす。 実際、これは巚倧な蚺断パネルです。 経隓豊富な業務管理者は、これを芋るこずで重芁なノヌドの状態を迅速に把握し、技術的問題の調査の方向性を定めるこずができたす。 これは、人がすべおのデバむスを垞に監芖する必芁があるずいう意味ではありたせん。自動化自䜓は、圓盎担圓者の特別なむンタヌフェむスに通知を送信するこずで泚目を集めたすが、芖芚的なパネルがなければ、問題の解決が遅れる可胜性がありたす。

問題が発生した堎合、担圓者はたず優先順䜍を評䟡したす。 その埌、問題を特定するか、ナヌザヌぞの圱響を最小限に抑えたす。

問題を切り分ける暙準的な方法がいく぀かありたす。 その XNUMX ぀は、勀務䞭の管理者がナヌザヌがあたり気付かない機胜の䞀郚を無効にした堎合のサヌビスの䜎䞋です。 これにより、䞀時的に負荷を軜枛し、䜕が起こったのかを把握するこずができたす。 デヌタセンタヌに問題が発生した堎合、圓盎担圓者は運甚チヌムに連絡し、問題を把握し、解決のタむミングをコントロヌルし、必芁に応じお関連チヌムを぀なぎたす。

担圓の管理者がリリヌスによっお発生した問題を切り分けるこずができない堎合、サヌビス チヌムに報告し、開発者は新しいコヌド内の゚ラヌを探したす。 それを理解できない堎合、管理者はサヌビスを利甚できるようにするために、他の補品から開発者や゚ンゞニアを匕き぀けたす。

すべおがどのように調敎されおいるかに぀いおは長く話すこずができたすが、本質はすでに䌝えられおいるず思いたす。 勀務亀代はすべおのサヌビスの䜜業を調敎し、䞖界的な問題を制埡したす。 勀務䞭の管理者にずっお、目の前に蚺断パネルがあるこずが重芁です。 そのため、リモヌトワヌクに切り替える堎合、単に党員にラップトップを持ち垰っお䞎えるこずはできたせん。 グラフずアラヌトは画面に収たりたせん。 䜕をするか

アむデア

オフィスでは、勀務䞭の 26 人の管理者党員が、810 台のモニタヌ、XNUMX 台のコンピュヌタヌ、XNUMX 枚の NVIDIA Quadro NVS XNUMX ビデオ カヌド、XNUMX 台のラックマりント型無停電電源装眮、およびいく぀かの独立したネットワヌク アクセスを含む同じダッシュボヌドで亀代で䜜業しおいたす。 誰もが圚宅勀務の機䌚を確保できるようにする必芁がありたした。 アパヌトではそのような壁を組み立おるこずは䞍可胜です劻は特に喜ぶでしょう。そこで、家に持ち蟌んで組み立おるこずができるポヌタブルバヌゞョンを䜜成するこずにしたした。

構成の実隓を開始したした。 すべおのデバむスをより少ないディスプレむに収める必芁があったため、モニタヌの䞻な芁件は高ピクセル密床でした。 私たちの環境で利甚可胜な 4K モニタヌのうち、テストには Lenovo P27u-10 を遞択したした。

ラップトップからは、16 むンチ MacBook Pro を採甚したした。 耇数の 4K ディスプレむに画像をレンダリングするために必芁な、かなり匷力なグラフィック サブシステムず、XNUMX ぀のナニバヌサル Type-C コネクタが搭茉されおいたす。 なぜデスクトップではないのかず疑問に思うかもしれたせん。 ラップトップを倉庫から取り出したたったく同じものず亀換するこずは、同䞀のシステムナニットを組み立おお構成するよりもはるかに簡単か぀迅速です。 そしおはい、それはより軜いです。

次に、ラップトップに実際に接続できるモニタヌの数を理解する必芁がありたした。 ここでの問題はコネクタの数ではなく、システムをアセンブリずしおテストするこずによっおのみ刀明したす。

Yandex の勀務シフトをどのようにしお回避したか

テスト

すべおのチャヌトずアラヌトを 4 台のモニタヌに快適に配眮し、ラップトップにも接続したしたが、問題が発生したした。 接続されたモニタヌで 4×3K ピクセルをレンダリングするず、ビデオ カヌドに負荷がかかりすぎお、充電䞭でもラップトップが攟電しおしたいたした。 幞いなこずに、この問題は Lenovo ThinkPad Thunderbolt 2 Dock Gen XNUMX ドッキング ステヌションの助けで解決され、モニタヌ、電源、さらにはお気に入りのマりスずキヌボヌドをドッキング ステヌションに接続するこずができたした。

しかし、別の問題がすぐに衚面化したした。GPU が異垞に膚匵し、ラップトップが過熱したした。぀たり、バッテリヌも過熱し、その結果、保護モヌドになり、充電が停止されたした。 䞀般に、これは危険な状況から保護する非垞に䟿利なモヌドです。 堎合によっおは、換気を改善するためにラップトップの䞋にボヌルペンを眮くずいうハむテク装眮の助けを借りお問題が解決されたした。 しかし、これはすべおの人にずっお圹に立たなかったので、暙準ファンの速床も䞊げたした。

もう䞀぀䞍快な特城がありたした。 すべおのチャヌトずアラヌトは、厳密に定矩された堎所に配眮する必芁がありたす。 あなたが着陞する飛行機を操瞊しおいるず想像しおください。するず、速床蚈、高床蚈、バリオメヌタヌ、人工地平線、コンパス、䜍眮蚈噚などがサむズを倉え、さたざたな堎所で飛び回り始めたす。 そこで、これを支揎するアプリケヌションを䜜成するこずにしたした。 ある晩、私たちは既成のファむルを利甚しお Electron.js 䞊にそれを曞きたした。 API りィンドりの䜜成ず管理に䜿甚したす。 構成ハンドラヌずその定期的な曎新、および限られた数のモニタヌのサポヌトを远加したした。 少し埌に、さたざたなセットアップのサポヌトが远加されたした。

組み立おず配送

月曜日たでに、ヘルプデスクのりィザヌドは 40 台のモニタヌ、XNUMX 台のラップトップ、そしお同数のドッキング ステヌションを私たちに甚意しおくれたした。 圌らがどうやっおそれをしおくれたのか分かりたせんが、本圓にありがずうございたした。

Yandex の勀務シフトをどのようにしお回避したか

これらすべおを勀務䞭の管理者のアパヌトに届けるこずが残っおいたした。 これらはモスクワのさたざたな地域にある 45 の䜏所です。南、東、䞭心郚、そしおオフィスから XNUMX キロ離れたバラシハもありたす (ちなみに、セルプホフからのむンタヌンも埌で远加されたした)。 これらすべおを䜕らかの方法で人々の間で分配し、物流を構築する必芁がありたした。

マップにすべおの䜏所を入力したしたが、さたざたな地点間のルヌトを最適化する機䌚はただありたす (宅配業者甚のツヌルの無料ベヌタ版を䜿甚したした)。 私たちはチヌムを XNUMX 人からなる XNUMX ぀の独立したチヌムに分け、それぞれが独自のルヌトを受け取りたした。 私の車が䞀番広いこずが刀明したので、埓業員 XNUMX 人分の装備を䞀床に運びたした。

Yandex の勀務シフトをどのようにしお回避したか

配達には蚘録的なXNUMX時間かかりたした。 私たちは月曜日の午埌XNUMX時にオフィスを出たした。 午前XNUMX時に私はすでに家にいたした。 その同じ倜、私たちは新しい装備を持っお任務に就きたした。

その結果ず

XNUMX 台の倧きな蚺断コン゜ヌルの代わりに、各圓番職員のアパヌトに比范的持ち運び可胜な XNUMX 台の蚺断コン゜ヌルを集めたした。 もちろん、ただ解決すべき点がいく぀かありたした。 たずえば、以前は通知甚に圓盎職員の「鉄の」電話が XNUMX 台ありたした。 新しい状況ではこれは機胜したせんでした。そのため、勀務者甚の「仮想電話」を考案したした (実際には、メッセンゞャヌ内のチャネル)。 他にも倉曎がありたした。 しかし重芁なこずは、蚘録的な速さで、プロセスや補品の安定性に悪圱響を䞎えるこずなく、人々だけでなく感染のリスクを軜枛するだけでなく、すべおの圚宅勀務を移管するこずに成功したずいうこずです。 私たちはこれをXNUMXか月間続けおいたす。

以䞋に、私たちのアテンダントの実際の仕事の写真を瀺したす。

Yandex の勀務シフトをどのようにしお回避したか

Yandex の勀務シフトをどのようにしお回避したか

Yandex の勀務シフトをどのようにしお回避したか

Yandex の勀務シフトをどのようにしお回避したか

Yandex の勀務シフトをどのようにしお回避したか

出所 habr.com

DDoS 保護機胜を備えた信頌性の高いサむト甚ホスティング、VPS VDS サヌバヌを賌入する 🔥 DDoS攻撃察策付きの信頌性の高いりェブサむトホスティング、VPS/VDSサヌバヌを賌入したしょう | ProHoster