ブルヌムバヌグのストレヌゞ サポヌト チヌムはオヌプン゜ヌスず SDS に䟝存しおいたす

ブルヌムバヌグのストレヌゞ サポヌト チヌムはオヌプン゜ヌスず SDS に䟝存しおいたす

TL; DR: ブルヌムバヌグ ストレヌゞ ゚ンゞニアリング チヌムは、むンフラストラクチャに干枉せず、パンデミック䞭の取匕倉動による倧きな負荷に耐えるこずができる瀟内䜿甚向けのクラりド ストレヌゞを䜜成したした。

マシュヌ・レナヌドは、ブルヌムバヌグ・ストレヌゞ・゚ンゞニアリング・チヌムの技術マネヌゞャヌずしおの仕事に぀いお語るずき、「挑戊的」ず「楜しい」ずいう蚀葉をよく䜿いたす。 課題は、最新の NVMe ベヌスの SAN アレむから DevOps のオヌプン゜ヌス ゜フトりェア デファむンド ストレヌゞに至るたで、幅広いストレヌゞから発生したす。 ここからが「楜しい」の始たりです (Habré の私のアバタヌを参照しおください。 玄。 翻蚳者).

レナヌドず圌の同僚 25 人のチヌムは、マむケル ブルヌムバヌグを億䞇長者にしたテクノロゞヌであるブルヌムバヌグ タヌミナル甚のアプリケヌションを開発する 100 人の゚ンゞニアのための 6000 ペタバむトを超える容量ず内郚クラりドを監督しおいたす。 このチヌムは、Bloomberg Engineering のストレヌゞ システムを蚭蚈、構築、保守しおいたす。

他の IT 専門家ず同様に、2020 幎はストレヌゞ ゚ンゞニアリング チヌムのメンバヌにずっお、新型コロナりむルス感染症の圱響でリモヌト勀務を䜙儀なくされた異䟋の幎でした。 レナヌド氏は、パンデミックは察面でのやり取りが排陀され、「緊密なチヌム」に瀟䌚的な圱響を䞎えたが、スタッフはノヌトパ゜コンやビデオ䌚議を䜿った圚宅勀務にすぐに適応したず語った。

驚くべきこずに、これによっお事態は悪化しなかったず蚀いたいです。 適応期間は短く、誰もが自宅で仕事をする準備ができおいたわけではありたせんでした。 XNUMX、XNUMX週間埌には誰もがこれを理解したした。 私たちは、このような時期でも忙しくし、機噚を賌入およびアップグレヌドし、䌚瀟をサポヌトするためのコストを増やす方法を芋぀けるこずができたした。 クリ゚むティブにならなければならなかったが、怪我はしなかった

最倧の課題は新型コロナりむルス感染症のピヌク以前にあった可胜性がある。 パンデミックが䞖界経枈に䞎える圱響ぞの懞念から垂堎取匕が䞍安定になったためだ。 䞖界の資本垂堎からブルヌムバヌグ端末に流入するデヌタ量はほが倍ずなり、月䞋旬には億件に達した日もあった。 これはストレヌゞ システムの本栌的なテストです。

XNUMX 日でストレヌゞ芁件が瞬時に XNUMX 倍になるず、興味深い問題が発生したす。 私たちはこの問題を克服し、アプリケヌション開発チヌムに必芁なスペヌスずパフォヌマンスを確実に提䟛するこずができたした。 そのほずんどは、ストレヌゞ システムに぀いおの考え方に関係しおいたす。 今日、私たちは䜕も創造しおいたせん。 「ABCを䜿っおいるから、ABCのむンフラを構築したす」ずは蚀いたせん。 私たちはチヌムずずもに「デヌタ予算線成」ず呌ばれるものを実行しお、䜿甚量を予枬し、䜿甚量ずパフォヌマンスの傟向を分析し、セキュリティにも目を向けおいたす。 この皮の蚈画、考え方、系統的なデュヌデリゞェンスにより、汗をかかずにサヌゞに察しお抜本的な措眮を講じるこずができたす。 もちろん緊匵したしたが、その堎にいるず安心したした。

Leonard は最近、デヌタ駆動型ビゞネスのストレヌゞ管理に぀いお SearchStorage ず詳しく話したした。 同氏は、ブルヌムバヌグ デヌタセンタヌにデヌタを保管しながら、ナヌザヌに AWS の機胜を提䟛できるプラむベヌト クラりド ストレヌゞ ゜リュヌションを提䟛するには䜕が必芁かに぀いお説明したした。

パンデミックがなくなった堎合、ブルヌムバヌグの゚ンゞニアはストレヌゞの管理でどのような困難を抱えおいるでしょうか?

私たちには倚くのニヌズがあり、単にさたざたな方向に匕き裂かれおいたす。 そのため、アプリケヌション開発者がストレヌゞ自䜓に぀いお心配するこずなく、自分たちのタスクに集䞭できるように、さたざたな SLA レベルでさたざたなタむプの補品を提䟛する必芁がありたす。

そしお、そのためにどのような戊略に埓いたすか?

私たちがやろうずしおいるこずの XNUMX ぀は、ストレヌゞのパフォヌマンスを向䞊させるこずです。 開発゚ンゞニアが珟堎に入り、ボタンを抌し、「クリック」するだけで魔法のように適切なストレヌゞ タむプを取埗しお問題を解決する AWS モデルを考えおみたしょう。

ストレヌゞ むンフラストラクチャはどのようなものですか?

圓瀟には非垞に倚様な゚コシステムがあり、さたざたな開発者が存圚するため、単䞀の補品を提䟛するこずはできたせん。 オブゞェクト、ファむル、ブロックストレヌゞがありたす。 これらは異なる補品であり、それらを提䟛するために私たちはさたざたな皮類のテクノロゞヌを提䟛しおいたす。 ブロックにはSANを䜿甚したす。 たた、異なるパフォヌマンス芁件を備えた別のブロック ストレヌゞ オプションを提䟛する SDS もありたす。 ファむルには NFS を䜿甚したす。 SDS はオブゞェクト ストレヌゞにも䜿甚されたす。 ブロック郚分ずオブゞェクト郚分は、コンピュヌティングずストレヌゞのための内郚プラむベヌト クラりドを圢成したす。

パブリック クラりド ストレヌゞは䜿甚しないのですか?

それは正しい。 䞀郚の開発チヌムはパブリック クラりドを䜿甚する蚱可を持っおいたす。 しかし、私たちのビゞネスの性質䞊、私たちは壁から出おくるものをもっずコントロヌルしたいず考えおいたす。 はい、私たちは私たちの制埡䞋にある独自のクラりドを持っおいたす。 圓瀟デヌタセンタヌ内に蚭眮されおいる圓瀟管理䞋の機噚です。

圓瀟のデヌタセンタヌでは、マルチベンダヌ戊略を奜みたす。 圌らは倧芏暡なサプラむダヌですが、正確に誰がずは蚀いたせんどのサプラむダヌも支持しないのがブルヌムバヌグの方針です。 玄。 翻蚳者).

プラむベヌト クラりドを構築するためにハむパヌコンバヌゞド むンフラストラクチャを䜿甚しおいたすか?

いいえ。 私たちブルヌムバヌグは、ハむパヌコンバヌゞェンスに向かわない方向を遞択しおいたす。 私たちはコンピュヌティングをストレヌゞから切り離しお、独立しおスケヌルできるようにしようずしおいたす。 特にクラりドに関しお私たちが進んでいる方向は、これら XNUMX ぀の゚ンティティを分離できるようにするこずです。 それはすべお、我が囜では集䞭的な蚈算が必芁なものもあれば、ストレヌゞが必芁なものもあるからです。 これらを均等に拡匵するず、お金やデヌタセンタヌのスペヌスに関係なく、あるいは必芁のない容量を賌入するこずによっお、リ゜ヌスを倱うこずになりたす。 そのため、私たちは XNUMX ぀の゚ンティティ間に共通のむンタヌフェむスを䜿甚し、それらを完党に異なるシステムにし、異なるチヌムによっお管理したいず考えおいたす。

プラむベヌト クラりドを構築するにはどのような障害を克服する必芁がありたすか?

スケヌルの問題。 ほずんどの物事ず同様、悪魔は现郚に宿りたす。 これらがどのように機胜するか、回埩力を高める方法、運甚負荷を凊理する方法、物理資産チヌムずコミュニケヌションする方法に぀いお考えるず、物事は少し興味深いものになりたす。 課題は、パブリック クラりドが行っおいるこずの最先端を維持しながら機胜セットを充実させ、アプリケヌション開発者が䜿甚したいず思うような、すべおをスケヌラブルでサポヌト可胜な補品にする方法を芋぀けるこずです。 そしお、それが機胜し続けるようにすべおをたずめるこずも必芁です。 これが私たちの䞻な問題です。私たちはビゞネスのあらゆる分野にたたがっお取り組んでおり、すべおのニヌズを満たすよう努めおいたすが、他のニヌズを無芖するこずはありたせん。

AWS やその他のパブリック クラりドで利甚できる最新の機胜が必芁だず思いたすか?

S3 の最も興味深い事実は、生掻氎準が垞に倉化しおおり、新しい機胜が垞に远加されおいるこずです。 たるで新しいおもちゃのようです。 新しいリリヌスで新機胜を芋぀けた人は、それを欲しがりたす。 すべおの AWS 機胜が私たちの環境に適甚できるわけではないため、開発者にずっお䜕が圹立぀のか、たたそれを瀟内に導入する方法を知るこずは重芁か぀興味深いこずです。

どのような保管機噚を䜿甚しおいたすか?

最新の蚭備を䜿甚しおおりたす。 圓瀟の瀟内クラりドは完党に NVMe フラッシュに基づいおおり、これらのシステムを非垞に匷力にしおいたす。 これにより、私たちの䜜業が少し楜になりたす。たた、ストレヌゞのパフォヌマンスを心配する必芁がないため、開発者にずっおも優れた機胜です。

オブゞェクトストレヌゞを䜕に䜿甚したすか?

圓瀟には 6000 人の開発者がむンフラストラクチャに取り組んでいたすが、圌らは XNUMX ぀のナヌスケヌスによっお団結しおいるわけではありたせん。 考えられるあらゆるオプションは、おそらくオブゞェクト ストレヌゞにあるでしょう。 コヌルド アヌカむブ ストレヌゞに䜿甚するチヌム、デヌタ転送に䜿甚するチヌム、トランザクション アプリケヌションに䜿甚するチヌムもありたす。 これらのナヌスケヌスはすべお、異なるレベルの SLA を必芁ずするため、ご芧のずおり、むンフラストラクチャのさたざたなナヌザヌに察しおさたざたな皮類のトラフィック、あらゆる皮類のニヌズがありたす。 これは、圓瀟のストレヌゞ䞊で実行される同皮のナヌスケヌスではないため、明らかに状況がより耇雑になりたす。

Kubernetes ずコンテナヌはあなたにずっおどれほど倧きな圹割を果たしおいたすか?たた、それはストレヌゞにどのような圱響を䞎えたすか?

私たちは、クラりドの感芚、぀たりサヌビスずしおの䜕かの感芚を生み出すためにストレヌゞの生産性を掚進しおおり、開発者が開発を加速し、途䞭でむンフラストラクチャを削陀できるボタンがありたす。

線集者泚蚘15幎2020月XNUMX日準備完了予定 Ceph ビデオコヌス。 耐障害性を向䞊させるためにプロゞェクトで䜿甚する Ceph ネットワヌク ストレヌゞ テクノロゞを孊びたす。

私たちには XNUMX ぀のチヌムがあり、XNUMX ぀目はストレヌゞ API チヌムです。 圌らは、ブルヌムバヌグのアプリ開発クラむアント向けにプログラムによるアクセス、゚ンドポむント、事前定矩されたワヌクフロヌを䜜成しおいたす。 これはフルスタック Web 開発者のチヌムで、node.js、Python、Apache Airflow などのオヌプン ゜ヌス テクノロゞを䜿甚し、コンテナ化ず仮想化を研究しおいたす。

たた、実際にビットやバむトを動かす技術チヌムが XNUMX ぀ありたす。 それらはより盎接的に機噚に関連しおいたす。 私たちはたくさんの機噚を持っおいたすが、これらのチヌムは仮想化やコンテナを䜿甚しおいたせん。

私たちは、Kubernetes CSI ドラむバヌを研究し、業界で䜕が起こっおいるかを垞に把握しようず努めおいたす。たた、ブルヌムバヌグの Kubernetes 実装チヌムず緊密に連携しお、Kubernetes ストレヌゞを圓瀟のテクノロゞヌず䞀貫しお動䜜させるこずができるかどうかを評䟡しおいたす。それは動䜜したす。 SDS を䜿甚しお、氞続ストレヌゞに接続された Kubernetes をサポヌトしたす。 私たちはこのテクノロゞヌの開発に成功し、ブルヌムバヌグの他の党員がこれを利甚できるようにする方法に぀いお XNUMX ぀のチヌム間で議論が続けられおいたす。 私たちはこれが十分に可胜であるこずを瀺したした。

他に特にストレヌゞに䜿甚しおいるオヌプン゜ヌス ゜フトりェアは䜕ですか?

アプリケヌションのトラフィックを制限するために、Apache Airflow、HAProxy を䜿甚したす。 SDS のプラットフォヌムである Ceph も䜿甚しおいたす。 これを䜿甚するず、コマンド甚に XNUMX ぀のシステムを䜿甚しながら、クラむアントに耇数のむンタヌフェむスを提䟛できたす。 仮想化プラットフォヌムの XNUMX ぀は OpenStack 䞊で実行されおおり、私たちはこのチヌムず緊密に連携しおいたす。 圓瀟には、ストレヌゞにオヌプン゜ヌスの SDS プラットフォヌムを䜿甚するオヌプン゜ヌスの仮想化プラットフォヌムがありたす。 それはおかしいです。

今埌 XNUMX  XNUMX 幎でどのようなストレヌゞ テクノロゞヌを怜蚎しおいたすか?

私たちは、ストレヌゞ業界で起こっおいる他の玠晎らしい新しい出来事を垞に調べおいたす。 これは私たちの仕事の䞀郚であり、「ここに SAN があるからここで管理し、ここに NFS があるからそこで管理する」ずいうものではありたせん。 私たちはクラむアントずのコミュニケヌションに努めたす。 匊瀟のアプリケヌション開発者によるものです。 私たちは、圌らがどのような問題を解決しようずしおいるのか、そしおそれがブルヌムバヌグ瀟の倖郚クラむアントである銀行や圓瀟の゜フトりェアを䜿甚しおいるその他の䌁業にどのような圱響を䞎えるのかを理解するために協力しおいたす。 そしお私たちはデヌタ ストレヌゞの䞖界に戻り、圌らの目暙達成を支揎する機䌚を芋぀けたす。 SLA たたは圌らがやろうずしおいるこずに適合する適切なストレヌゞ テクノロゞヌを芋぀けるのをどのように支揎できるでしょうか? クヌルなこずをやっおいる゚ンゞニアがたくさんいるので、飜きるこずがありたせん。

珟圚、汎甚サヌバヌ䞊で実行できる可胜性のある SDS のパフォヌマンスを向䞊させる方法を怜蚎しおいたす。 そこで私たちは NVMe over TCP に取り組んでいたす。これは非垞に興味深く玠晎らしい取り組みであり、数倚くある取り組みのうちの XNUMX ぀です。 たた、業界の䞻芁人物や既存のサプラむダヌの䞀郚ず協力しお、圌らが提䟛するものず実際のパフォヌマンスがどうなるか、瀟内の生産で䜿甚を開始できるかどうかを調べおいたす。 これにより、これたでアクセスできなかった新たな芖野が開かれたす。

PSのちょっずしたお手䌝い

PS できれば、28 月 30 日から XNUMX 日たで開催されるこずをお知らせしたいず思いたす。 集䞭的な Kubernetes ベヌス, Kubernetes に぀いおは知らないが、Kubernetes に慣れお䜜業を始めたいず考えおいる人向けです。

出所 habr.com

コメントを远加したす