Wéi wielen ech Stockage ouni Iech selwer an de Fouss ze schéissen

Aféierung

Et ass Zäit Stockage ze kafen. Wéi eng ze huelen, op wien ze lauschteren? Verkeefer A schwätzt iwwer Verkeefer B, an dann gëtt et den Integrator C, deen de Géigendeel seet an de Verkeefer D beréit. An esou enger Situatioun wäert och de Kapp vun engem erfuerene Späicherarchitekt dréinen, besonnesch mat all den neien Ubidder an SDS an Hyperkonvergenz déi moudesch sinn haut.

Also, wéi fannt Dir dat alles eraus a schlussendlech net en Narr sinn? Mir (Anton Virtuell Anton Zhbankov an corp Evgeniy Elizarov) loosst eis probéieren iwwer dëst op einfach russesch ze schwätzen.
Den Artikel huet vill Ähnlechkeeten an ass tatsächlech eng Ausdehnung vun "Virtualiséierter Datenzenter Design" wat d'Auswiel vu Späichersystemer ugeet an d'Späichertechnologien iwwerpréift. Mir wäerte kuerz op déi allgemeng Theorie kucken, awer mir recommandéieren Iech och dësen Artikel ze liesen.

Wat fir

Dir kënnt dacks eng Situatioun gesinn, wou eng nei Persoun op e Forum oder e spezialiséierte Chat kënnt, wéi Storage Discussions, an d'Fro stellt: "Hei bidden se mir zwou Späicheroptiounen - ABC SuperStorage S600 an XYZ HyperOcean 666v4, wat empfehlen Dir ?"

An d'Verwirrung fänkt un iwwer wien huet wat Features vun der Ëmsetzung vu schrecklechen an onverständlechen Features, déi fir eng onpreparéiert Persoun komplett Chinesesch sinn.

Also, d'Schlëssel an déi éischt Fro, déi Dir Iech selwer laang froe musst ier Dir Spezifikatioune a kommerziellen Virschléi vergläicht, ass WAAROM? Firwat ass dëse Späichersystem gebraucht?

Wéi wielen ech Stockage ouni Iech selwer an de Fouss ze schéissen

D'Äntwert wäert onerwaart ginn, a ganz Tony Robbins Stil - Daten ze späicheren. Merci, Kapitän! An awer, heiansdo gi mir sou déif an d'Detailer ze vergläichen, datt mir vergiessen firwat mir dat alles iwwerhaapt maachen.

Also, d'Aufgab vun engem Datelagerungssystem ass et ze späicheren an Zougang zu DATA mat enger bestëmmter Leeschtung ze bidden. Mir fänken un mat Daten.

Donnéeën

Datentyp

Wéi eng Donnéeën plangen mir ze späicheren? Eng ganz wichteg Fro, déi vill Stockage Systemer aus souguer Iwwerleeung eliminéiert kann. Zum Beispill plangt Dir Videoen a Fotoen ze späicheren. Dir kënnt direkt Systemer entworf fir zoufälleg Zougang a klenge Blocken ausstrecken, oder Systemer mat propriétaire Funktiounen an der Kompressioun / Deduplikatioun. Dës kënnen einfach exzellent Systemer sinn, mir wëllen näischt Schlechtes soen. Awer an dësem Fall wäerten hir Stäerkten entweder schwaach ginn (Video a Fotoen sinn net kompriméiert) oder einfach d'Käschte vum System wesentlech erhéijen.

Ëmgekéiert, wann déi virgesinn Notzung e beschäftegten Transaktiouns-DBMS ass, da sinn exzellent Multimedia Streaming Systemer déi fäeg sinn Gigabytes pro Sekonn ze liwweren eng schlecht Wiel.

Daten Volumen

Wéi vill Daten plangen mir ze späicheren? D'Quantitéit entwéckelt sech ëmmer a Qualitéit; dëst däerf ni vergiess ginn, besonnesch an eiser Zäit vum exponentielle Wuesstum am Volume vun Daten. Petabyte-Klass Systemer sinn net méi ongewéinlech, mä déi méi grouss Petabyte Kapazitéit, déi méi spezifesch de System gëtt, déi manner zougänglech déi üblech Funktionalitéit vun klengen a mëttelgrousser zoufälleg Zougang Systemer ginn. Et ass trivial well d'Block Access Statistik Tabelle eleng méi grouss ginn wéi déi verfügbar Betrag u RAM op de Controller. Net ze ernimmen Kompressioun / Tiering. Loosst eis soen, mir wëllen de Kompressiounsalgorithmus op e méi mächtege wiesselen an 20 Petabytes vun Daten kompriméieren. Wéi laang dauert et: sechs Méint, e Joer?

Op der anerer Säit, firwat stierwen wann Dir 500 GB vun Daten späicheren a veraarbecht? Nëmmen 500. Stot SSDs (mat niddereg DWPD) vun dëser Gréisst kascht näischt. Firwat eng Fibre Channel Fabréck bauen an héich-Enn extern Stockage Systemer kafen, datt d'Äquivalent vun enger Goss Bréck kascht?

Wéi ee Prozentsaz vum Ganzen ass waarm Daten? Wéi ongläich ass d'Laascht a punkto Datevolumen? Dëst ass wou tiered Storage Technologie oder Flash Cache ganz hëllefräich kënne sinn wann d'Quantitéit u waarme Daten kleng ass am Verglach zum Gesamt. Oder vice versa, mat enger eenheetlecher Belaaschtung iwwer de ganze Volumen, wat dacks a Streamingsystemer (Videoiwwerwaachung, e puer Analytiksystemer) fonnt gëtt, sou Technologien ginn näischt a wäerten nëmmen d'Käschte/Komplexitéit vum System erhéijen.

IP

Déi aner Säit vun den Donnéeën ass den Informatiounssystem deen d'Daten benotzt. En IS huet eng Rei vun Ufuerderungen déi Daten ierwen. Fir méi Informatiounen iwwer den IS, kuckt "Virtualiséierter Data Center Design."

Widderstandsfäegkeet / Disponibilitéit Ufuerderunge

Ufuerderunge fir Feelertoleranz / Dateverfügbarkeet ginn vum IS geierft andeems se se benotzt a ginn an dräi Zuelen ausgedréckt - RPO, OTR, Accessibilitéit.

Disponibilitéit - den Undeel fir eng bestëmmten Zäit an där d'Donnéeën verfügbar sinn fir mat hinnen ze schaffen. Normalerweis ausgedréckt als Zuel vun 9. Zum Beispill, zwee néng pro Joer bedeit datt Disponibilitéit 99% ass, oder soss sinn 95 Stonnen Onverfügbarkeet pro Joer erlaabt. Dräi Néng - 9,5 Stonnen pro Joer.

RPO / RTO sinn net total Indicateuren, mee fir all Tëschefall (Accident), am Géigesaz zu Disponibilitéit.

RPO - d'Quantitéit un Daten déi während engem Accident verluer sinn (a Stonnen). Zum Beispill, wann Backups eemol am Dag optrieden, dann RPO = 24 Stonnen. Déi. Am Fall vun enger Katastroph a komplette Verloscht vum Späichersystem kënnen Daten bis zu 24 Stonnen verluer ginn (vum Moment vum Backup). Baséierend op der RPO spezifizéiert fir den IS, zum Beispill, sinn Backup-Reglementer geschriwwe ginn. Och, baséiert op RPO, kënnt Dir verstoen wéi vill synchron / asynchron Datereplikatioun gebraucht gëtt.

OTR - Zäit fir de Service (Datenzougang) no enger Katastroph ze restauréieren. Baséierend op de gegebene RTO Wäert kënne mir verstoen ob e Metro Cluster gebraucht gëtt, oder ob unidirektional Replikatioun genuch ass. Braucht Dir en Hi-End Klass Multi-Controller Späichersystem?

Wéi wielen ech Stockage ouni Iech selwer an de Fouss ze schéissen

Leeschtung Ufuerderunge

Och wann dëst eng ganz offensichtlech Fro ass, ass et wou déi meescht Schwieregkeeten entstinn. Ofhängeg dovun ob Dir schonn eng Aart vun Infrastruktur hutt oder net, wäerte Weeër gebaut ginn fir déi néideg Statistiken ze sammelen.

Dir hutt schonn e Späichersystem a sicht en Ersatz oder wëllt en aneren fir Expansioun kafen. Alles ass einfach hei. Dir verstitt wéi eng Servicer Dir scho hutt a wat Dir plangt an der nächster Zukunft ëmzesetzen. Baséiert op aktuell Servicer, hutt Dir d'Méiglechkeet Leeschtung Statistiken ze sammelen. Entscheed iwwer déi aktuell Zuel vun IOPS an aktuell Latenz - wat sinn dës Indikatoren a si si genuch fir Är Aufgaben? Dëst kann souwuel am Datespeichersystem selwer gemaach ginn wéi och vun den Hosten, déi domat verbonne sinn.

Ausserdeem musst Dir net nëmmen op déi aktuell Belaaschtung kucken, awer iwwer eng gewëssen Zäit (am léifsten e Mount). Kuckt wat déi maximal Peaks am Dag sinn, wéi eng Belaaschtung de Backup erstellt, asw. Wann Äre Späichersystem oder seng Software Iech net e komplette Set vun dësen Donnéeën ubitt, kënnt Dir de gratis RRDtool benotzen, dee mat de meeschte populärste Späichersystemer a Schalter funktionnéiere kann an Iech detailléiert Leeschtungsstatistiken ubidden. Et ass och derwäert ze kucken op d'Laascht op de Hosten déi mat dësem Späichersystem schaffen, fir spezifesch virtuell Maschinnen, oder wat genau op dësem Host leeft.

Wéi wielen ech Stockage ouni Iech selwer an de Fouss ze schéissen

Et ass derwäert getrennt ze notéieren datt wann d'Verspéidungen op de Volume an dem Datastore, deen op dësem Volume läit, zimlech däitlech ënnerscheeden, sollt Dir op Äre SAN-Netz oppassen, et ass eng héich Wahrscheinlechkeet datt et Probleemer domat gëtt a ier Dir en neit kaaft. System, ass et derwäert dëst Thema ze kucken, well et eng ganz héich Wahrscheinlechkeet ass fir d'Performance vum aktuelle System ze erhéijen.

Dir baut eng Infrastruktur vun Null un, oder kaaft e System fir e puer neie Service, d'Laascht vun deenen Dir net bewosst sidd. Et gi verschidde Méiglechkeeten: kommunizéiere mat Kollegen iwwer spezialiséiert Ressourcen fir ze probéieren d'Laascht erauszefannen an virauszesoen, kontaktéiert en Integrator deen Erfahrung huet mat der Ëmsetzung vun ähnlechen Servicer an deen d'Laascht fir Iech berechent. An déi drëtt Optioun (normalerweis déi schwieregst, besonnesch wann et hausgeschriwwe oder selten Uwendungen betrëfft) ass ze probéieren d'Leeschtungsfuerderunge vun de Systementwéckler erauszefannen.

An, notéiert w.e.g., déi korrekt Optioun aus der Siicht vun der praktescher Uwendung ass e Pilot op aktuell Ausrüstung, oder Ausrüstung fir Testen vun engem Verkeefer / Integrator.

Besonnesch Ufuerderunge

Besonnesch Ufuerderunge sinn alles wat net ënner den Ufuerderunge fir Leeschtung, Feelertoleranz a Funktionalitéit fir d'direkt Veraarbechtung an d'Versuergung vun Donnéeën falen.

Ee vun den einfachsten speziellen Ufuerderunge fir en Datelagerungssystem kann als "alienable Späichermedien" genannt ginn. An et gëtt direkt kloer datt dësen Datelagerungssystem eng Bandbibliothéik muss enthalen oder einfach e Tape Drive, op deem d'Backupkopie gedumpt gëtt. Duerno ënnerschreift eng speziell ausgebilte Persoun de Band an dréit se stolz an e spezielle Safe.
En anert Beispill vun engem speziellen Ufuerderung ass e geschützte schockbeständeg Design.

Wou

Déi zweet Haaptkomponent bei der Auswiel vun engem bestëmmte Späichersystem ass Informatioun iwwer WOU dëse Späichersystem wäert sinn. Ugefaange vu Geographie oder klimatesch Konditiounen, an ophalen mat Personal.

Client

Fir wien ass dëse Späichersystem geplangt? D'Fro huet déi folgend Grënn:

Regierung Client / kommerziell.
De kommerziellen Client huet keng Restriktiounen an ass net emol verpflicht fir Ausschreiwungen ze halen, ausser am Aklang mat hiren eegene internen Reglementer.

Eng Regierung Client ass eng aner Saach. 44 Bundesgesetz an aner Freed mat Ausschreiwungen an technesch Spezifikatioune déi erausgefuerdert ginn.

De Client ass ënner Sanktiounen
Gutt, d'Fro hei ass ganz einfach - d'Wiel ass nëmme limitéiert duerch d'Offeren, déi fir e bestëmmte Client verfügbar sinn.

Intern Reglementer / Ubidder / Modeller erlaabt ze kafen
D'Fro ass och extrem einfach, awer Dir musst et erënneren.

Wou kierperlech

An dësem Deel betruechte mir all Themen mat Geographie, Kommunikatiounskanäl, a Mikroklima an den Ënnerkunftsraimlechkeeten.

De Personal

Wien wäert mat dësem Stockage System schaffen? Dëst ass net manner wichteg wéi dat wat de Späichersystem selwer maache kann.
Egal wéi villverspriechend, cool a wonnerbar de Späichersystem vum Verkeefer A ass, et ass wahrscheinlech wéineg Sënn fir se z'installéieren wann d'Personal nëmme weess wéi se mam Verkeefer B schaffen, an et gi keng Pläng fir weider Akeef a weider Zesummenaarbecht mat A.

An natierlech ass déi aner Säit vun der Fro wéi disponibel ausgebilt Personal an enger bestëmmter geographescher Plaz direkt an der Firma an eventuell um Aarbechtsmaart ass. Fir Regiounen, d'Auswiel vu Späichersystemer mat einfachen Interfaces oder d'Fäegkeet fir d'Gestioun op afstand ze zentraliséieren ka vill Sënn maachen. Soss kann et iergendwann schmerzhaft schmerzhaf ginn. Den Internet ass voller Geschichten iwwer wéi en neie Mataarbechter deen ukomm ass, de Student vu gëschter, sou eppes konfiguréiert huet datt de ganze Büro zerstéiert gouf.

Wéi wielen ech Stockage ouni Iech selwer an de Fouss ze schéissen

D'Ëmwelt

An natierlech ass eng wichteg Fro a wéi engem Ëmfeld dëse Späichersystem funktionnéiert.

  • Wat iwwer Energieversuergung / Killmëttel?
  • Wéi eng Verbindung
  • Wou wäert et installéiert ginn?
  • An sou weider.

Dacks ginn dës Froe selbstverständlech geholl an net besonnesch betruecht, awer heiansdo sinn et déi, déi alles ëmdréie kënnen.

Wat

Verkeefer

Vun haut (Mëtt 2019) kann de russesche Späichermaart a 5 Kategorien opgedeelt ginn:

  1. Déi héchst Divisioun ass gutt etabléiert Firmen mat enger breet Palette vun Disk Regaler vum einfachsten bis Hi-End (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Zweet Divisioun - Firmen mat enger limitéierter Linn, Nischespiller, sérieux SDS Ubidder oder opkommende Newcomer (Fujitsu, Datacore, Infinidat, Huawei, Pure, etc.)
  3. Drëtt Divisioun - Nischléisungen am nidderegen Ennrang, bëlleg SDS, fortgeschratt Produkter baséiert op Ceph an aner oppe Projeten (Infortrend, Starwind, etc.)
  4. SOHO Segment - kleng an ultra-kleng Späichersystemer vum Heem / klenge Büro Niveau (Synology, QNAP, etc.)
  5. Import-ersat Späichersystemer - dëst enthält souwuel Hardware vun der éischter Divisioun mat nei-labeléierten Etiketten, a rare Vertrieder vun der zweeter (RAIDIX, mir ginn hinnen déi zweet am Viraus), awer haaptsächlech ass dëst déi drëtt Divisioun (Aerodisk, Baum, Depo, etc.)

D'Divisioun ass zimmlech arbiträr, a bedeit guer net datt den drëtten oder SOHO Segment schlecht ass a kann net benotzt ginn. A spezifesche Projete mat engem kloer definéierten Dateset a Laaschtprofil kënne se ganz gutt funktionnéieren, wäit iwwer déi éischt Divisioun a punkto Präis / Qualitéitsverhältnis. Et ass wichteg fir d'éischt iwwer Är Ziler, Wuesstumsperspektiven an erfuerderlech Funktionalitéit ze entscheeden - an da wäert Synology Iech trei déngen, an Är Hoer ginn mëll a seidlech.

Ee vun de wichtege Faktoren wann Dir e Verkeefer wielt ass déi aktuell Ëmfeld. Wéi vill Späichersystemer hutt Dir schonn a wéi eng Späichersystemer Är Ingenieuren kënne schaffen. Braucht Dir en anere Verkeefer, en anere Kontaktpunkt, wäert Dir graduell d'ganz Laascht vum Verkeefer A op de Verkeefer B migréieren?

Et sollt een net Entitéite produzéieren iwwer wat néideg ass.

iSCSI/FC/Datei

Et gëtt kee Konsens tëscht Ingenieuren iwwer d'Fro vun Zougangsprotokoller, an d'Debatt gläicht méi theologesch Diskussiounen wéi Ingenieuren. Awer am Allgemengen kënnen déi folgend Punkten notéiert ginn:

FCoE méi dout wéi lieweg.

FC vs iSCSI. Ee vun de Schlësselvirdeeler vum FC am Joer 2019 iwwer IP-Speicherung, eng engagéiert Fabréck fir Datenzougang, gëtt vun engem dedizéierten IP-Netz kompenséiert. FC huet keng global Virdeeler iwwer IP Netzwierker, an IP kann Stockage Systemer vun all Laascht Niveau ze bauen benotzt ginn, bis Systemer fir schwéier DBMS fir de Kär Bankesystem vun enger grousser Bank. Op der anerer Säit gëtt den Doud vum FC scho säit e puer Joer prophesieéiert, awer eppes verhënnert et ëmmer. Haut, zum Beispill, entwéckelen e puer Spiller um Stockage Maart aktiv den NVMEoF Standard. Ob hien d'Schicksal vum FCoE deelt - d'Zäit wäert soen.

Fichier Zougang ass och net eppes onwürdeg opmierksam. NFS / CIFS funktionéiert gutt an Produktivitéitsëmfeld an, wann richteg entworf, huet keng Reklamatioune méi wéi Blockprotokoller.

Hybrid / All Flash Array

Klassesch Späichersystemer kommen an 2 Typen:

  1. AFA (All Flash Array) - Systemer fir SSD benotzen optimiséiert.
  2. Hybrid - erlaabt Iech souwuel HDD an SSD ze benotzen oder eng Kombinatioun vun hinnen.

Hiren Haaptunterschied ass déi ënnerstëtzt Späichereffizienz Technologien an de maximalen Niveau vun der Leeschtung (héich IOPS a geréng latency). Béid Systemer (an de meeschte vun hire Modeller, net de Low-End-Segment zielen) kënne souwuel als Block- a Dateiegeräter funktionnéieren. Déi ënnerstëtzt Funktionalitéit hänkt vum Niveau vum System of, a fir méi jonk Modeller gëtt et meeschtens op e Minimum reduzéiert. Dëst ass derwäert opmierksam ze maachen wann Dir d'Charakteristike vun engem bestëmmte Modell studéiert, an net nëmmen d'Fäegkeeten vun der ganzer Linn als Ganzt. Och, natierlech, seng technesch Charakteristiken, wéi Prozessor, Quantitéit vun Erënnerung, Cache, Zuel an Zorte vun Häfen, etc., hänkt och op den Niveau vum System. Vun engem Gestioun Siicht ënnerscheeden AFA aus Hybrid (Disk) Systemer nëmmen an der Ëmsetzung vun Mechanismen fir eng Aarbecht mat SSD fiert, an och wann Dir eng SSD an engem Hybrid System benotzt, heescht dat guer net dass Dir wäert kënnen. den Niveau vun Leeschtung um Niveau vun engem AFA System erreechen. Och an de meeschte Fäll sinn inline effizient Späichermechanismen op Hybridsystemer behënnert, an hir Inklusioun féiert zu engem Verloscht vun der Leeschtung.

Special Stockage Systemer

Zousätzlech zu allgemeng Zwecker Späichersystemer, déi haaptsächlech op operationell Datenveraarbechtung fokusséiert sinn, ginn et speziell Späichersystemer mat Schlësselprinzipien, déi grondsätzlech anescht sinn wéi déi üblech (niddereg latency, héich IOPS):

Medien.

Dës Systemer sinn entwéckelt fir grouss Mediendateien ze späicheren an ze veraarbecht. bzw. d'Verspéidung gëtt praktesch onwichteg, an d'Fähigkeit fir Daten an enger breeder Band a ville parallele Stréim ze schécken an z'empfänken kënnt op de Virdergrond.

Deduplizéiere vu Späichersystemer fir Backups.

Zënter datt d'Backupkopien sech duerch hir Ähnlechkeet mateneen ënnerscheeden, wat ënner normalen Bedéngungen rar ass (déi duerchschnëttlech Backupkopie ënnerscheet sech vun der Kopie vu gëschter ëm 1-2%), packt dës Klass vu Systemer extrem effizient d'Daten, déi op hinnen opgeholl goufen, an engem zimlech klengen Zuel vu kierperleche Medien. Zum Beispill, an e puer Fäll kënnen d'Datekompressiounsverhältnisser 200 bis 1 erreechen.

Objet Stockage Systemer.

Dës Späichersystemer hunn net déi üblech Block-Zougängsvolumen an Dateideelen, a virun allem ähnelen se eng rieseg Datebank. Zougang zu engem Objet, deen an esou engem System gespäichert ass, gëtt duerch en eenzegaartegen Identifizéierer oder duerch Metadaten duerchgefouert (zum Beispill all JPEG-Formatobjekter mat engem Erstellungsdatum tëscht XX-XX-XXXX an YY-YY-YYYY).

Konformitéitssystem.

Si sinn net sou heefeg a Russland haut, awer si sinn derwäert ze ernimmen. Den Zweck vun esou Späichersystemer ass garantéiert Datelagerung fir d'Sécherheetspolitiken oder reglementaresche Viraussetzungen ze respektéieren. E puer Systemer (zum Beispill EMC Centera) hunn eng Funktioun implementéiert fir d'Dateläschung ze verbidden - soubal de Schlëssel ëmgedréint gëtt an de System an dëse Modus kënnt, kann weder den Administrateur nach en aneren physesch Daten läschen, déi schonn opgeholl goufen.

Proprietär Technologien

Flash Cache

Flash Cache ass e gemeinsame Numm fir all propriétaire Technologien fir Flash Memory als Second-Level Cache ze benotzen. Wann Dir e Flash Cache benotzt, gëtt de Späichersystem normalerweis berechent fir eng stänneg Belaaschtung vu magnetesche Placken ze bidden, während de Peak vum Cache servéiert gëtt.

An dësem Fall ass et néideg de Laaschtprofil an de Grad vun der Lokaliséierung vum Zougang zu Block vu Späichervolumen ze verstoen. Flash Cache ass eng Technologie fir Aarbechtslaascht mat héich lokaliséierten Ufroen, an ass praktesch net applicabel fir eenheetlech gelueden Volumen (wéi fir Analytiksystemer).

Et ginn zwou Flash Cache Implementatiounen um Maart verfügbar:

  • Nëmme liesen. An dësem Fall sinn nëmmen gelies Daten cache, a Schreiwen geet direkt op d'Disks. E puer Hiersteller, wéi NetApp, gleewen datt d'Schreiwen op hir Späichersystemer scho optimal ass, an de Cache wäert guer net hëllefen.
  • Liesen / Schreiwen. Net nëmmen d'Liesen, awer och d'Schreiwen gëtt cachéiert, wat Iech erlaabt de Stroum ze bufferen an den Impakt vun der RAID Penalty ze reduzéieren, an als Resultat d'Gesamtleistung fir Späichersystemer mat engem manner optimalen Schreifmechanismus erhéijen.

Tiering

Multi-Level Storage (middend) ass eng Technologie fir Niveauen mat verschiddene Leeschtungsniveauen, wéi SSD an HDD, an engem eenzegen Disk Pool ze kombinéieren. Am Fall vun ausgeschwat Ongläichheet vum Zougang zu Datenblocken, wäert de System automatesch Datenblocken ausbalancéieren, gelueden op e High-Performance-Niveau bewegt, a kal, am Géigendeel, op e méi luesen.

Hybrid Systemer vun den ënneschten a Mëttelklassen benotzen Multi-Niveau Späichere mat Daten, déi tëscht Niveauen op engem Zäitplang bewegen. Zur selwechter Zäit ass d'Gréisst vum Multi-Level Späicherblock fir déi bescht Modeller 256 MB. Dës Fonctiounen erlaben eis net d'Tiered Storage Technologie als Technologie fir d'Produktivitéit ze erhéijen, sou wéi vill Leit falsch gleewen. Multi-Level Stockage an niddereg- a Mëttelklass Systemer ass eng Technologie fir Optimisatioun vun Stockage Käschten fir Systemer mat ausgeschwat Laascht Ongläichheet.

Bléck

Egal wéi vill mir iwwer d'Zouverlässegkeet vun Stockage Systemer schwätzen, et gi vill Méiglechkeeten Daten ze verléieren, déi net op Hardware Problemer hänkt. Dëst kéint Viren, Hacker oder all aner onbewosst Läschen / Korruptioun vun Daten sinn. Aus dësem Grond ass d'Backup vun Produktiounsdaten en integralen Deel vun der Aarbecht vun engem Ingenieur.

E Snapshot ass e Snapshot vun engem Volume iergendwann an der Zäit. Wann Dir mat de meeschte Systemer schafft, wéi Virtualiséierung, Datenbanken, asw. mir mussen esou e Snapshot huelen, aus deem mir d'Donnéeën op eng Backupkopie kopéieren, während eisen IS fäeg ass sécher mat dësem Volume ze schaffen. Awer et ass derwäert ze erënneren datt net all Schnappschëss gläich nëtzlech sinn. Verschidde Verkeefer hu verschidden Approche fir Snapshots ze kreéieren am Zesummenhang mat hirer Architektur.

CoW (Copy-On-Write). Wann Dir probéiert en Dateblock ze schreiwen, gëtt säin ursprénglechen Inhalt an e spezielle Beräich kopéiert, duerno geet d'Schreiwen normal weider. Dëst verhënnert Datenkorruptioun am Snapshot. Natierlech verursaache all dës "parasitesch" Datemanipulatiounen zousätzlech Belaaschtung op de Späichersystem an aus dësem Grond empfeelen d'Verkeefer mat ähnlechen Implementatiounen net méi wéi eng Dose Schnappschëss ze benotzen, a se guer net op héich gelueden Bänn ze benotzen.

RoW (Redirect-on-Write). An dësem Fall freet d'Originalvolumen natierlech, a wann Dir probéiert en Dateblock ze schreiwen, schreift de Späichersystem Daten op e spezielle Gebitt am fräie Raum, ännert de Standort vun dësem Block an der Metadatentabell. Dëst erlaabt Iech d'Zuel vun de Rewrite Operatiounen ze reduzéieren, wat schlussendlech de Réckgang vun der Leeschtung eliminéiert an d'Restriktiounen op Snapshots an hir Zuel läscht.

Snapshots sinn och vun zwou Zorte a Relatioun zu Uwendungen:

Applikatioun Konsistenz. Am Moment vun der Schafung vun engem Snapshot zitt de Späichersystem en Agent am Betriebssystem vum Konsument, deen d'Diskcache vu Gedächtnis op Disk gezwongen spült an d'Applikatioun zwéngt dëst ze maachen. An dësem Fall, wann Dir vun engem Snapshot restauréiert, wäerten d'Donnéeën konsequent sinn.

Crash konsequent. An dësem Fall geschitt näischt wéi dat an de Snapshot gëtt erstallt wéi et ass. Am Fall vun der Erhuelung vun esou engem Snapshot ass d'Bild identesch mat deem wat geschitt wier wann d'Kraaft op eemol ausgeschalt gouf an e puer Datenverloscht méiglech ass, an de Cache hänke bliwwen an ni op d'Disk erreecht. Esou Snapshots si méi einfach ze implementéieren a verursaache keng Leeschtungsverschlechterung an Uwendungen, awer si manner zouverlässeg.

Firwat sinn Schnappschëss op Späichersystemer gebraucht?

  • Agentlos Backup direkt vum Späichersystem
  • Erstellt Testëmfeld baséiert op realen Donnéeën
  • Am Fall vun Dateispeichersystemer kann et benotzt ginn fir VDI Ëmfeld ze kreéieren duerch d'Benotzung vu Späichersystem Snapshots amplaz vun engem Hypervisor
  • Vergewëssert niddereg RPOs andeems Dir geplangte Schnappschëss mat enger Frequenz erstellt déi wesentlech méi héich ass wéi d'Backupfrequenz

Klonen

Volume Klonen - funktionnéiert op engem ähnleche Prinzip wéi Snapshots, awer gëtt net nëmme benotzt fir Daten ze liesen, awer fir voll ze schaffen. Mir kënnen eng exakt Kopie vun eisem Volume kréien, mat all den Donnéeën drop, ouni eng kierperlech Kopie ze maachen, wat Plaz spuert. Typesch gëtt Volumenklonen entweder am Test&Dev benotzt oder wann Dir d'Funktionalitéit vun e puer Updates op Ärem IS wëllt iwwerpréiwen. Klonen erlaabt Iech dëst esou séier a wirtschaftlech wéi méiglech a punkto Disk Ressourcen ze maachen, well Nëmme geännert Datenblocken ginn geschriwwe.

Replikatioun / Journaling

Replikatioun ass e Mechanismus fir eng Kopie vun Daten op engem anere kierperleche Späichersystem ze kreéieren. Typesch huet all Verkeefer eng propriétaire Technologie déi nëmme bannent senger eegener Linn funktionnéiert. Awer et ginn och Drëtt-Partei-Léisungen, och déi, déi um Hypervisor-Niveau funktionnéieren, wéi VMware vSphere Replication.

D'Funktionalitéit vun de propriétaire Technologien an d'einfach Benotzung vun hinnen sinn normalerweis vill besser wéi universell, awer si ginn als inapplicabel wann, zum Beispill, et néideg ass eng Replik vun NetApp op HP MSA ze maachen.

Replikatioun ass an zwou Ënnertypen opgedeelt:

Synchron. Am Fall vun der synchroner Replikatioun gëtt d'Schreifoperatioun direkt an den zweete Späichersystem geschéckt an d'Ausféierung gëtt net bestätegt bis de Fernspeichersystem bestätegt. Dowéinst klëmmt d'Zougangsverzögerung, awer mir hunn eng exakt Spigelkopie vun den Donnéeën. Déi. RPO = 0 am Fall vum Verloscht vum Haaptspeichersystem.

asynchron. Schreifoperatioune ginn nëmmen um Haaptspeichersystem ausgefouert a ginn direkt bestätegt, wärend gläichzäiteg an engem Puffer accumuléiert fir Batchübertragung zum Fernspeichersystem. Dës Zort Replikatioun ass relevant fir manner wäertvoll Donnéeën, oder fir Kanäl mat gerénger Bandbreedung oder héijer Latenz (typesch fir Distanzen iwwer 100 km). Deementspriechend, RPO = Paket Sendungsfrequenz.

Oft, zesumme mat Replikatioun, gëtt et e Mechanismus aloggen Scheif Operatiounen. An dësem Fall gëtt e spezielle Beräich fir Logbicher an Opnam Operatiounen vun enger gewësser Tiefe an der Zäit zougewisen, oder limitéiert duerch de Volume vum Logbuch, gespäichert. Fir bestëmmte propriétaire Technologien, wéi EMC RecoverPoint, gëtt et Integratioun mat Systemsoftware, déi Iech erlaabt verschidde Lieszeeche mat enger spezifescher Logeintrag ze verbannen. Dank dëser ass et méiglech den Zoustand vun engem Volume zréckzekréien (oder e Klon ze kreéieren) net nëmmen op den 23. Abrëll, 11 Stonnen 59 Sekonnen 13 Millisekonnen, mee op de Moment virun "ALL TABLES DROPEN; ENGAGEMENT."

Metro Cluster

Metro Cluster ass eng Technologie déi Iech erlaabt bidirektional Synchron Replikatioun tëscht zwee Späichersystemer ze kreéieren sou datt vu baussen dëst Paar wéi ee Späichersystem ausgesäit. Et gëtt benotzt fir Cluster mat geographesch getrennten Waffen op Metro-Distanz ze kreéieren (manner wéi 100 km).

Baséierend op d'Beispill vun der Notzung an engem Virtualiséierungsëmfeld, erlaabt de Metrocluster Iech en Datastore mat virtuelle Maschinnen ze kreéieren, zougänglech fir opzehuelen vun zwee Datenzenteren gläichzäiteg. An dësem Fall gëtt e Cluster um Hypervisorniveau erstallt, besteet aus Hosten a verschiddene kierperlechen Datenzenteren, verbonne mat dësem Datastore. Wat erlaabt Iech déi folgend ze maachen:

  • Voll Automatiséierung vum Erhuelungsprozess nom Doud vun engem vun den Datenzenteren. Ouni zousätzlech Fongen, ginn all VMs, déi am verstuerwenen Datenzenter lafen, automatesch an de Rescht gestart ginn. RTO = High Disponibilitéit Cluster Timeout (15 Sekonnen fir VMware) + Zäit fir de Betribssystem ze lueden an d'Servicer unzefänken.
  • Katastrophe vermeiden oder, op Russesch, Katastrophen vermeiden. Wann d'Energieversuergungsaarbecht am Rechenzentrum 1 geplangt ass, dann hu mir d'Méiglechkeet déi ganz wichteg Belaaschtung op den Rechenzentrum 2 non-stop am Viraus ze migréieren, ier d'Aarbecht ufänkt.

Virtualiséierung

Storage Virtualization ass technesch d'Benotzung vu Bänn vun engem anere Späichersystem als Disken. E Späichervirtualizer kann einfach de Volume vun engem aneren un de Konsument als säin eegene transferéieren, gläichzäiteg an en anere Späichersystem spigelen, oder souguer e RAID aus externe Bänn erstellen.
Klassesch Vertrieder an der Späichervirtualiséierungsklass sinn EMC VPLEX an IBM SVC. An natierlech, Stockage Systemer mat Virtualiséierung Funktionalitéit - NetApp, Hitachi, IBM / Lenovo Storwize.

Firwat kann et néideg sinn?

  • Redundanz um Niveau vum Späichersystem. E Spigel gëtt tëscht de Bänn erstallt, an eng Halschent kann op HP 3Par sinn, an déi aner op NetApp. An de Virtualizer ass vun EMC.
  • Beweegt Daten mat minimalem Ausdauer tëscht Späichersystemer vu verschiddene Hiersteller. Loosst eis dovun ausgoen datt Daten aus dem alen 3Par, deen ofgeschriwen gëtt, op déi nei Dell migréiert musse ginn. An dësem Fall sinn d'Konsumenten aus 3Par getrennt, d'Bänn ginn ënner VPLEX transferéiert a ginn de Konsumenten erëm presentéiert. Well net e bëssen um Volume geännert huet, geet d'Aarbecht weider. De Prozess fir de Volume op déi nei Dell ze spigelen fänkt am Hannergrond un, a beim Ofschloss ass de Spigel gebrach an 3Par ass behënnert.
  • Organisatioun vun Metrocluster.

Kompressioun / Deduplikatioun

Kompressioun an Deduplikatioun sinn Technologien déi Iech erlaben Disk Space op Ärem Späichersystem ze spueren. Et ass derwäert direkt ze ernimmen datt net all Donnéeën am Prinzip un Kompressioun an/oder Deduplikatioun ënnerleien, während e puer Zorte vun Daten besser kompriméiert an deduplizéiert sinn, an e puer - vice versa.

Et ginn 2 Aarte vu Kompressioun an Deduplikatioun:

An der Schlaang - Kompressioun an Deduplikatioun vun Dateblocken geschitt ier Dir dës Donnéeën op Disk schreift. Also berechent de System nëmmen den Hash vum Block a vergläicht et an der Tabell mat den existente. Éischtens ass et méi séier wéi just op Disk ze schreiwen, an zweetens verschwende mir keng extra Plaatz.

Post - wann dës Operatiounen op schonn opgeholl Daten op Disken duerchgefouert ginn. Deementspriechend ginn d'Donnéeën fir d'éischt op Disk geschriwwe, an nëmmen dann gëtt den Hash berechent an onnéideg Späre ginn geläscht an Diskressourcen befreit.

Et ass derwäert ze soen datt déi meescht Ubidder béid Aarte benotzen, wat et hinnen erlaabt dës Prozesser ze optimiséieren an doduerch hir Effizienz ze erhéijen. Déi meescht Stockage Ubidder hunn Utilities déi Iech erlaben Är Datesets ze analyséieren. Dës Utilities funktionnéieren no der selwechter Logik déi am Späichersystem implementéiert ass, sou datt de geschätzte Effizienzniveau d'selwecht wäert sinn. Bedenkt och datt vill Ubidder Leeschtungsgarantieprogrammer hunn déi op d'mannst esou gutt Leeschtung fir bestëmmten (oder all) Datentypen verspriechen. An Dir sollt dëse Programm net vernoléissegen, well andeems Dir de System fir Är Aufgaben berechnen, andeems Dir den Effizienzkoeffizient vun engem bestëmmte System berücksichtegt, kënnt Dir op de Volume spueren. Et ass och derwäert ze berücksichtegen datt dës Programmer fir AFA Systemer entworf sinn, awer dank dem Kaf vun engem méi klenge Volume vun SSDs wéi HDDs an klassesche Systemer, wäert dëst hir Käschten reduzéieren, a wann net gläich wéi d'Käschte vun engem Disk System, dann komm zimlech no.

De Modell

An hei komme mer zu der richteger Fro.

"Si bidden mir zwou Späicheroptiounen - ABC SuperStorage S600 an XYZ HyperOcean 666v4, wat recommandéieren Dir?"

Verwandelt an "Hei bidden se mir zwou Späicheroptiounen - ABC SuperStorage S600 an XYZ HyperOcean 666v4, wat empfeelt Dir?

D'Zilbelaaschtung ass gemëschte VMware virtuelle Maschinnen mat Produktioun / Test / Entwécklung Loops. Test = produktiv. 150 TB all mat engem Peak Leeschtung vun 80 IOPS 000kb Spär 8% zoufälleg Zougang 50/80 liesen-schreiwen. 20 TB fir Entwécklung, 300 IOPS ass genuch, 50 zoufälleg, 000 schreiwen.

Produktivitéit viraussiichtlech am Metrocluster RPO = 15 Minutten RTO = 1 Stonn, Entwécklung an asynchroner Replikatioun RPO = 3 Stonnen, Test op engem Site.

Et gëtt eng 50TB DBMS, Logged wier flott fir si.

Mir hunn iwwerall Dell Serveren, al Hitachi Späichersystemer, si kënne kaum eens ginn, mir plangen d'Laascht ëm 50% a punkto Volumen a Leeschtung ze erhéijen.

Wéi se soen, eng korrekt formuléiert Fro enthält 80% vun der Äntwert.

zousätzlech Informatioune

Wat Dir sollt zousätzlech liesen no den Auteuren

Bicher

  • Olifer an Olifer "Computer Netzwierker". D'Buch hëlleft fir ze systematiséieren a vläicht besser ze verstoen wéi d'Dateniwwerdroungsmedium fir IP / Ethernet Späichersystemer funktionnéiert
  • "EMC Informatiounslagerung a Management." En exzellent Buch iwwer d'Grondlage vu Späichersystemer, d'Whys, Hows a wherefores.

Forum'en an Chats

Allgemeng Recommandatiounen

Präislëscht

Elo, wéi fir Präisser - am Allgemengen, wann et Präisser fir Stockage Systemer sinn, si normalerweis Lëscht Präisser, aus deenen all Client eng individuell Remise kritt. D'Gréisst vun der Remise besteet aus enger grousser Zuel vu Parameteren, sou datt et einfach onméiglech ass virauszesoen, wéi en definitive Präis Är Firma kritt ouni den Distributeur ze froen. Awer gläichzäiteg hunn kierzlech Low-End Modeller ugefaang an normale Computergeschäfter ze gesinn, wéi z.B. nix.ru oder xcom-shop.ru. Hei kënnt Dir direkt de System an deem Dir interesséiert sidd zu engem fixen Präis kafen, wéi all Computerkomponenten.

Awer ech wéilt direkt feststellen datt en direkten Verglach duerch TB/$ net richteg ass. Wa mir et aus dëser Siicht ugoen, da wäert déi bëllegst Léisung en einfachen JBOD + Server sinn, deen weder d'Flexibilitéit oder d'Zouverlässegkeet gëtt, déi e vollwäertege Dual-Controller-Späichersystem ubitt. Dëst bedeit guer net datt JBOD Eekleges an e béisen dreckeg Trick ass, Dir musst just nach eng Kéier ganz kloer verstoen wéi a fir wéi eng Zwecker Dir dës Léisung benotzt. Dir kënnt dacks héieren datt et näischt am JBOD ze briechen ass, et gëtt nëmmen eng Backplane. Wéi och ëmmer, backplanes och heiansdo versoen. Alles brécht fréier oder spéider.

Total

Et ass noutwendeg fir Systemer mateneen ze vergläichen net nëmmen duerch Präis, oder net nëmmen duerch Leeschtung, mee duerch d'Totalitéit vun all Indikatoren.

Kaaft HDD nëmmen wann Dir sécher sidd datt Dir HDD braucht. Fir niddereg Lasten an onkompressibel Datentypen, soss ass et derwäert op SSD Späichereffizienz Garantie Programmer ze wenden, déi déi meescht Verkeefer elo hunn (a si schaffen wierklech, och a Russland), awer et hänkt alles vun den Uwendungen an Daten of, déi lokaliséiert sinn. op dësem Stockage System.

Gitt net fir bëlleg. Heiansdo verstoppen dës vill onsympathesch Momenter, ee vun deenen den Evgeniy Elizarov a sengen Artikelen iwwer beschriwwen huet. Infortrend. An datt um Enn dës Bëllegkeet op Iech zréckkënnt. Vergiesst net - "de Miser bezilt zweemol."

Source: www.habr.com

Setzt e Commentaire