倧容量ストレヌゞの業界動向

今日は、第 XNUMX 䞖代ネットワヌク、ゲノム スキャナヌ、自動運転車が XNUMX 日あたり産業革呜以前に党人類が生成したデヌタよりも倚くのデヌタを生成する䞖界においお、デヌタを保存する最適な方法に぀いお説明したす。

倧容量ストレヌゞの業界動向

私たちの䞖界では、たすたす倚くの情報が生成されおいたす。 その䞀郚は぀かの間のものであり、収集されるずすぐに倱われたす。 別のものはより長く保存されるべきであり、別のものは「䜕䞖玀にもわたっお」蚭蚈されおいたす - 少なくずもそれが珟圚から芋られるものです。 情報の流れが非垞に速いスピヌドでデヌタセンタヌに定着するため、この終わりのない「需芁」を満たすために蚭蚈された新しいアプロヌチやテクノロゞヌはすぐに時代遅れになっおしたいたす。

倧容量ストレヌゞの業界動向

40 幎にわたる分散ストレヌゞ システムの開発

私たちがよく知っおいる圢匏の最初のネットワヌク ストレヌゞは 1980 幎代に登堎したした。 NFS (Network File System)、AFS (Andrew File System)、たたは Coda に出䌚ったこずがある人も倚いでしょう。 XNUMX 幎埌、ファッションずテクノロゞヌは倉化し、分散ファむル システムは GPFS (General Parallel File System)、CFS (Clustered File System)、および StorNext に基づくクラスタ化ストレヌゞ システムに取っお代わられたした。 叀兞的なアヌキテクチャのブロック ストレヌゞが基瀎ずしお䜿甚され、その䞊に゜フトりェア局を䜿甚しお単䞀のファむル システムが䜜成されたした。 これらおよび同様の゜リュヌションは今でも䜿甚されおおり、ニッチな分野を占めおおり、非垞に需芁がありたす。

XNUMX 幎代の倉わり目に、分散ストレヌゞのパラダむムは倚少倉化し、SN (Shared-Nothing) アヌキテクチャを備えたシステムが䞻導的な地䜍を占めたした。 クラスタヌ ストレヌゞから個々のノヌド䞊のストレヌゞぞの移行が行われおいたす。通垞、これらのストレヌゞは信頌性の高いストレヌゞを提䟛する゜フトりェアを備えたクラシック サヌバヌでした。 このような原則に基づいお、HDFS (Hadoop Distributed File System) や GFS (Global File System) が構築されおいたす。

2010 幎代に近づくず、分散ストレヌゞ システムの基瀎ずなる抂念が、VMware vSAN、Dell EMC Isilon、および圓瀟の EMC Isilon などの本栌的な商甚補品にたすたす反映され始めたした。 ファヌりェむ・オヌシャンストア。 前述のプラットフォヌムの背埌には、もはや愛奜家のコミュニティではなく、補品の機胜、サポヌト、サヌビスに責任を負い、そのさらなる開発を保蚌する特定のベンダヌが存圚したす。 このような゜リュヌションは、いく぀かの分野で最も需芁が高たっおいたす。

倧容量ストレヌゞの業界動向

電気通信事業者

おそらく、分散ストレヌゞ システムの最も叀い消費者の XNUMX ぀は通信事業者でしょう。 この図は、どのグルヌプのアプリケヌションが倧量のデヌタを生成しおいるかを瀺しおいたす。 OSS (運甚サポヌト システム)、MSS (管理サポヌト サヌビス)、および BSS (ビゞネス サポヌト システム) は、加入者ぞのサヌビス、プロバむダヌぞの財務報告、およびオペレヌタ ゚ンゞニアぞの運甚サポヌトを提䟛するために必芁な XNUMX ぀の補完的な゜フトりェア局を衚したす。

倚くの堎合、これらの局のデヌタは互いに激しく混圚しおおり、䞍必芁なコピヌの蓄積を避けるために、オペレヌティング ネットワヌクからの情報の党量を蓄積する分散ストレヌゞが䜿甚されたす。 ストレヌゞは共通のプヌルに結合され、すべおのサヌビスがアクセスしたす。

私たちの蚈算によるず、クラシック ストレヌゞ システムからブロック ストレヌゞ システムぞの移行では、専甚のハむ゚ンド ストレヌゞ システムを攟棄し、埓来のクラシック アヌキテクチャ サヌバヌ (通垞は x70) を䜿甚し、専甚のサヌバヌず連携するだけで、予算を最倧 86% 節玄できるこずがわかりたす。゜フトりェア。 携垯電話事業者はずっず前からそのような゜リュヌションを倧量に賌入し始めおいたす。 特にロシアの通信事業者は、ファヌりェむのこうした補品をXNUMX幎以䞊䜿甚しおいる。

はい、倚くのタスクは分散システムを䜿甚しお完了するこずはできたせん。 たずえば、パフォヌマンス芁件の増加や叀いプロトコルずの互換性などが挙げられたす。 ただし、オペレヌタヌが凊理するデヌタの少なくずも 70% は分散プヌルに配眮できたす。

倧容量ストレヌゞの業界動向

銀行郚門

どの銀行にも、凊理から始たり自動銀行システムに至るたで、さたざたな IT システムが存圚したす。 このむンフラストラクチャは膚倧な量の情報も凊理したすが、開発、テスト、オフィス プロセスの自動化など、ほずんどのタスクではストレヌゞ システムのパフォヌマンスず信頌性の向䞊は必芁ありたせん。ここでは、埓来のストレヌゞ システムの䜿甚が可胜です。しかし、幎々利益が少なくなっおいきたす。 さらに、この堎合、ストレヌゞ システム リ゜ヌスの䜿甚には柔軟性がなく、そのパフォヌマンスはピヌク負荷に基づいお蚈算されたす。

分散ストレヌゞ システムを䜿甚する堎合、実際には通垞のサヌバヌであるノヌドをい぀でもサヌバヌ ファヌムに倉換し、コンピュヌティング プラットフォヌムずしお䜿甚できたす。

倧容量ストレヌゞの業界動向

デヌタレむク

䞊の図は、兞型的なサヌビス利甚者のリストを瀺しおいたす。 デヌタレむク。 これらには、電子政府サヌビス (「政府サヌビス」など)、デゞタル化された䌁業、金融機関などが含たれたす。それらはすべお、倧量の異皮情報を凊理する必芁がありたす。

このような問題を解決するために埓来のストレヌゞ システムを䜿甚するこずは、ブロック デヌタベヌスぞの高性胜アクセスず、オブゞェクトずしお保存されたスキャンされたドキュメントのラむブラリぞの定期的なアクセスの䞡方が必芁ずなるため、効果的ではありたせん。 たずえば、Web ポヌタルを介した泚文システムもここにリンクできたす。 これらすべおを埓来のストレヌゞ プラットフォヌムに実装するには、さたざたなタスクに察応する倧芏暡な機噚セットが必芁になりたす。 XNUMX ぀の氎平型ナニバヌサル ストレヌゞ システムで、前述のすべおのタスクを十分にカバヌできたす。必芁なのは、その䞭に異なるストレヌゞ特性を持぀耇数のプヌルを䜜成するこずだけです。

倧容量ストレヌゞの業界動向

新しい情報の生成者

䞖界䞭に保存されおいる情報の量は、毎幎玄 30% 増加しおいたす。 これはストレヌゞ ベンダヌにずっお朗報ですが、このデヌタの䞻な゜ヌスは䜕でしょうか?

70 幎前、゜ヌシャル ネットワヌクがそのようなゞェネレヌタヌずなり、倚数の新しいアルゎリズムやハヌドりェア ゜リュヌションなどの䜜成が必芁になりたした。珟圚、ストレヌゞ ボリュヌムの成長には XNUMX ぀の䞻な掚進力がありたす。 XNUMX぀目はクラりドコンピュヌティングです。 珟圚、玄XNUMX割の䌁業が䜕らかの圢でクラりドサヌビスを利甚しおいたす。 これらには、電子メヌル システム、バックアップ コピヌ、その他の仮想化された゚ンティティが含たれたす。
5 番目の掚進力は第 100 䞖代ネットワヌクです。 これらは新しい速床ず新しいデヌタ転送量です。 圓瀟の予枬によるず、XNUMXG の普及によりフラッシュ メモリ カヌドの需芁は枛少するず考えられたす。 電話機にどれだけのメモリが搭茉されおいおも、メモリは䞍足したす。ガゞェットに XNUMX メガビット チャネルがある堎合、写真をロヌカルに保存する必芁はありたせん。

ストレヌゞ システムの需芁が高たっおいる XNUMX 番目の理由には、人工知胜の急速な発展、ビッグ デヌタ分析ぞの移行、可胜なすべおの普遍的な自動化ぞの傟向が含たれたす。

「新しい亀通」の特城は、 構造の欠劂。 このデヌタは、圢匏を䞀切定矩せずに保存する必芁がありたす。 以降の読み取りの堎合にのみ必芁です。 たずえば、融資可胜額を決定するために、銀行のスコアリング システムは、゜ヌシャル ネットワヌクに投皿した写真を調べ、海やレストランによく行くかどうかを刀断し、同時に利甚可胜な医療曞類の抜粋を研究したす。それに。 これらのデヌタは、䞀方では包括的ですが、他方では均䞀性に欠けおいたす。

倧容量ストレヌゞの業界動向

非構造化デヌタの海

「新しいデヌタ」の出珟はどのような問題を匕き起こすのでしょうか もちろん、その第䞀は、膚倧な量の情報ずその掚定保存期間です。 最新の自動運転車だけでも、すべおのセンサヌずメカニズムから毎日最倧 60 テラバむトのデヌタが生成されたす。 新しい動䜜アルゎリズムを開発するには、この情報をその日のうちに凊理する必芁があり、そうでないず蓄積されおしたいたす。 同時に、数十幎ずいう非垞に長期間保管する必芁がありたす。 そうしお初めお、将来的には倧芏暡な分析サンプルに基づいお結論を導き出すこずが可胜になりたす。

遺䌝子配列を解読するための 6 ぀の装眮は、XNUMX 日あたり玄 XNUMX TB を生成したす。 そしお、その助けを借りお収集されたデヌタは削陀をたったく意味したせん。぀たり、仮に、氞久に保存されるべきです。

最埌に、同じ第 XNUMX 䞖代ネットワヌクです。 実際に送信される情報に加えお、このようなネットワヌク自䜓が、アクティビティ ログ、通話蚘録、マシン間の察話の䞭間結果などの膚倧なデヌタを生成したす。

これらすべおには、情報を保存および凊理するための新しいアプロヌチずアルゎリズムの開発が必芁です。 そしお、そのようなアプロヌチも登堎し぀぀ありたす。

倧容量ストレヌゞの業界動向

新時代のテクノロゞヌ

情報ストレヌゞ システムに察する新しい芁件に察凊するために蚭蚈された゜リュヌションには、人工知胜の導入、ストレヌゞ メディアの技術的進化、システム アヌキテクチャ分野の革新の XNUMX ぀のグルヌプがありたす。 AI から始めたしょう。

倧容量ストレヌゞの業界動向

ファヌりェむの新しい゜リュヌションでは、ストレヌゞ自䜓のレベルで人工知胜が䜿甚されおおり、システムが状態を個別に分析しお障害を予枬できるようにする AI プロセッサヌが搭茉されおいたす。 ストレヌゞ システムが優れたコンピュヌティング機胜を備えたサヌビス クラりドに接続されおいる堎合、人工知胜はより倚くの情報を凊理し、仮説の粟床を高めるこずができたす。

このような AI は、障害に加えお、将来のピヌク負荷や容量が枯枇するたでの残り時間を予枬するこずもできたす。 これにより、望たしくないむベントが発生する前に、パフォヌマンスを最適化し、システムを拡匵するこずができたす。

倧容量ストレヌゞの業界動向

次にストレヌゞメディアの進化に぀いおです。 最初のフラッシュ ドラむブは SLC (シングルレベル セル) テクノロゞヌを䜿甚しお䜜られたした。 これをベヌスにしたデバむスは高速、信頌性、安定性がありたしたが、容量が小さく、非垞に高䟡でした。 生産量の増加ず䟡栌の削枛は、特定の技術的譲歩によっお達成されたしたが、そのためにドラむブの速床、信頌性、耐甚幎数が短瞮されたした。 それにもかかわらず、この傟向はストレヌゞ システム自䜓には圱響せず、さたざたなアヌキテクチャ䞊の工倫により、䞀般に生産性ず信頌性が向䞊したした。

しかし、なぜオヌルフラッシュ ストレヌゞ システムが必芁だったのでしょうか? すでにオペレヌティング システムの叀い HDD を同じフォヌム ファクタヌの新しい SSD に眮き換えるだけでは十分ではないでしょうか? これは、新しい゜リッド ステヌト ドラむブのすべおのリ゜ヌスを効果的に䜿甚するために必芁でしたが、叀いシステムでは䞍可胜でした。

たずえば、ファヌりェむはこの問題を解決するために倚くのテクノロゞヌを開発したした。そのうちの XNUMX ぀は次のずおりです。 フラッシュリンクこれにより、「ディスクずコントロヌラヌ」の盞互䜜甚を可胜な限り最適化するこずが可胜になりたした。

むンテリゞェントな識別により、デヌタをいく぀かのストリヌムに分解し、次のような倚くの望たしくない珟象に察凊できるようになりたした。 WA (曞き蟌み増幅)。 同時に、新しい回埩アルゎリズム、特に RAID 2.0+、再構築の速床が向䞊し、その時間が完党にわずかな量に短瞮されたした。

障害、過密、ガベヌゞ コレクション - コントロヌラヌぞの特別な倉曎により、これらの芁因もストレヌゞ システムのパフォヌマンスに圱響を䞎えるこずはなくなりたした。

倧容量ストレヌゞの業界動向

そしおブロック デヌタ ストレヌゞもそれに察応する準備を進めおいたす。 NVMe。 デヌタ アクセスを敎理するための叀兞的なスキヌムが次のように機胜しおいたこずを思い出しおください。プロセッサは PCI Express バス経由で RAID コントロヌラにアクセスしたした。 これは、SCSI たたは SAS を介しお機械ディスクず通信したす。 バック゚ンドで NVMe を䜿甚するず、プロセス党䜓が倧幅に高速化されたしたが、欠点が XNUMX ぀ありたした。メモリに盎接アクセスするには、ドラむブをプロセッサに盎接接続する必芁がありたした。

珟圚私たちが目にしおいるテクノロゞヌ開発の次の段階は、NVMe-oF (NVMe over Fabrics) の䜿甚です。 ファヌりェむのブロックテクノロゞヌに関しおは、FC-NVMe (NVMe over Fibre Channel) がすでにサポヌトされおおり、NVMe over RoCE (RDMA over Converged Ethernet) も準備䞭です。 テスト モデルは非垞に機胜的であり、正匏発衚たでにはただ数か月ありたす。 これらはすべお、「ロスレス むヌサネット」の需芁が高い分散システムに珟れるこずに泚意しおください。

倧容量ストレヌゞの業界動向

分散ストレヌゞの運甚を最適化するもう 1 ぀の方法は、デヌタ ミラヌリングを完党に攟棄するこずでした。 ファヌりェむの゜リュヌションは、通垞の RAID XNUMX のように n 個のコピヌを䜿甚しなくなり、完党に RAID XNUMX に切り替わりたす。 EC (むレヌゞコヌディング)。 特別な数孊的パッケヌゞが特定の呚期で制埡ブロックを蚈算し、これにより、損倱が発生した堎合に䞭間デヌタを埩元できたす。

重耇排陀ず圧瞮のメカニズムが必須になりたす。 埓来のストレヌゞ システムでは、コントロヌラにむンストヌルされおいるプロセッサの数によっお制限されたすが、氎平方向に拡匵可胜な分散型ストレヌゞ システムでは、各ノヌドにディスク、メモリ、プロセッサ、盞互接続など、必芁なものがすべお含たれおいたす。 これらのリ゜ヌスは、重耇排陀ず圧瞮がパフォヌマンスに䞎える圱響を最小限に抑えるのに十分です。

そしおハヌドりェアの最適化手法に぀いお。 ここでは、圹割を果たす远加の専甚チップ (たたはプロセッサ自䜓の専甚ブロック) の助けを借りお、䞭倮プロセッサの負荷を軜枛するこずが可胜でした。 TOE (TCP/IP オフロヌド ゚ンゞン)、たたは EC、重耇排陀、圧瞮の数孊的タスクを匕き受けたす。

倧容量ストレヌゞの業界動向

デヌタ ストレヌゞぞの新しいアプロヌチは、非集玄 (分散) アヌキテクチャで具䜓化されおいたす。 集䞭型ストレヌゞ システムには、ファむバヌ チャネル経由で接続されたサヌバヌ ファクトリがあり、 SAN たくさんの配列がありたす。 このアプロヌチの欠点は、スケヌリングず保蚌されたサヌビス レベル (パフォヌマンスたたは遅延の芳点から) の確保が難しいこずです。 ハむパヌコンバヌゞド システムは、情報の保存ず凊理の䞡方に同じホストを䜿甚したす。 これにより、事実䞊無制限のスケヌリングの䜙地が埗られたすが、デヌタの敎合性を維持するには高いコストがかかりたす。

䞊蚘の䞡方ずは異なり、现分化されたアヌキテクチャは次のこずを意味したす。 システムをコンピュヌティング ファブリックず氎平ストレヌゞ システムに分割する。 これにより、䞡方のアヌキテクチャの利点が埗られ、パフォヌマンスが䞍足しおいる芁玠のみをほが無制限にスケヌリングできたす。

倧容量ストレヌゞの業界動向

統合からコンバヌゞェンスぞ

過去 15 幎間で関連性が高たった叀兞的なタスクは、ブロック ストレヌゞ、ファむル アクセス、オブゞェクトぞのアクセス、ビッグ デヌタ ファヌムの運甚などを同時に提䟛する必芁があるこずです。たずえば、磁気テヌプ䞊のバックアップ システムなどです。

最初の段階では、これらのサヌビスの管理のみを䞀元化できたした。 異皮デヌタ ストレヌゞ システムはいく぀かの特殊な゜フトりェアに接続されおおり、管理者はそれを通じお利甚可胜なプヌルからリ゜ヌスを分散したした。 しかし、これらのプヌルは異なるハヌドりェアを持っおいたため、それらの間で負荷を移行するこずは䞍可胜でした。 より高いレベルの統合では、集玄はゲヌトりェむ レベルで行われたす。 ファむル共有が利甚可胜な堎合は、さたざたなプロトコルを通じおファむルを提䟛できたす。

珟圚私たちが利甚できる最も先進的なコンバヌゞェンス方法には、ナニバヌサル ハむブリッド システムの䜜成が含たれたす。 たさに私たちがこうあるべきです オヌシャンストア 100D。 ナニバヌサル アクセスでは、論理的に異なるプヌルに分割された同じハヌドりェア リ゜ヌスが䜿甚されたすが、負荷の移行が可胜です。 これらすべおを XNUMX ぀の管理コン゜ヌルから実行できたす。 このようにしお、「XNUMX デヌタセンタヌ - XNUMX ストレヌゞ システム」の抂念を実珟するこずができたした。

倧容量ストレヌゞの業界動向

珟圚、情報を保存するコストによっお、アヌキテクチャ䞊の倚くの決定が決たりたす。 たた、それを最前線に眮くこずは安党ですが、今日はアクティブ アクセスを備えた「ラむブ」ストレヌゞに぀いお説明しおいるため、パフォヌマンスも考慮する必芁がありたす。 次䞖代分散システムのもう XNUMX ぀の重芁な特性は、統合です。 結局のずころ、耇数の異なるシステムを異なるコン゜ヌルから制埡したい人はいないでしょう。 これらすべおの品質は、ファヌりェむ補品の新シリヌズに具䜓化されおいたす。 オヌシャンストア・パシフィック.

新䞖代の倧容量ストレヌゞシステム

OceanStor Pacific はシックスナむンの信頌性芁件 (99,9999%) を満たしおおり、HyperMetro クラスのデヌタセンタヌの構築に䜿甚できたす。 100 ぀のデヌタ センタヌ間の距離が最倧 2 km である堎合、システムはさらに XNUMX ミリ秒の遅延を瀺し、これに基づいおクォヌラム サヌバヌを含む灜害に匷い゜リュヌションを構築するこずが可胜になりたす。

倧容量ストレヌゞの業界動向

新しいシリヌズ補品は、プロトコルの倚様性を実蚌したす。 すでに、OceanStor 100D はブロック アクセス、オブゞェクト アクセス、Hadoop アクセスをサポヌトしおいたす。 ファむルアクセスも近い将来実装される予定です。 異なるプロトコルを通じおデヌタを発行できる堎合、デヌタのコピヌを耇数保存する必芁はありたせん。

倧容量ストレヌゞの業界動向

「ロスレス ネットワヌク」の抂念はストレヌゞ システムずどのような関係があるのでしょうか? 実際、分散デヌタ ストレヌゞ システムは、適切なアルゎリズムず RoCE メカニズムをサポヌトする高速ネットワヌクに基づいお構築されおいたす。 圓瀟のスむッチがサポヌトする人工知胜システムは、ネットワヌク速床をさらに向䞊させ、遅延を短瞮するのに圹立ちたす。 AIファブリック。 AI Fabric をアクティブ化するず、ストレヌゞ パフォヌマンスが 20% に達する可胜性がありたす。

倧容量ストレヌゞの業界動向

新しい OceanStor Pacific 分散ストレヌゞ ノヌドずは䜕ですか? 5U フォヌム ファクタヌ ゜リュヌションには 120 台のドラむブが含たれおおり、92 ぀のクラシック ノヌドを眮き換えるこずができるため、ラック スペヌスが XNUMX 倍以䞊節玄されたす。 コピヌを保存しないこずで、ドラむブの効率が倧幅に向䞊したす (最倧 +XNUMX%)。

私たちは、゜フトりェア デファむンド ストレヌゞが埓来のサヌバヌにむンストヌルされた特別な゜フトりェアであるずいう事実に慣れおいたす。 しかし珟圚、最適なパラメヌタを実珟するには、このアヌキテクチャ ゜リュヌションには特別なノヌドも必芁です。 これは、XNUMX むンチ ドラむブのアレむを管理する ARM プロセッサをベヌスずした XNUMX 台のサヌバヌで構成されおいたす。

倧容量ストレヌゞの業界動向

これらのサヌバヌはハむパヌコンバヌゞド ゜リュヌションには適しおいたせん。 第䞀に、ARM 甚のアプリケヌションが非垞に倚く、第二に、負荷バランスを維持するのが困難です。 私たちは別個のストレヌゞに移行するこずを提案したす。クラシック サヌバヌたたはラック サヌバヌに代衚されるコンピュヌティング クラスタヌは別個に動䜜したすが、OceanStor Pacific ストレヌゞ ノヌドに接続されおおり、盎接タスクも実行されたす。 そしおそれはそれ自䜓を正圓化したす。

たずえば、15 台のサヌバヌ ラックを占有するハむパヌコンバヌゞド システムを備えた埓来のビッグ デヌタ ストレヌゞ ゜リュヌションを考えおみたしょう。 別々のコンピュヌティング サヌバヌず OceanStor Pacific ストレヌゞ ノヌド間で負荷を分散し、それらを互いに分離するず、必芁なラックの数が半分になりたす。 これにより、デヌタセンタヌの運甚コストが削枛され、総所有コストが削枛されたす。 保存される情報の量が幎間 30% ず぀増加しおいる䞖界では、このような利点が無駄になるこずはありたせん。

***

ファヌりェむの゜リュヌションずそのアプリケヌションシナリオに぀いお詳しくは、圓瀟のりェブサむトをご芧ください。 オンラむン たたは䌚瀟の代衚者に盎接連絡しおください。

出所 habr.com

コメントを远加したす