Bagaimana untuk memilih storan tanpa menembak diri sendiri di kaki

Pengenalan

Sudah tiba masanya untuk membeli storan. Mana satu nak ambil, siapa nak dengar? Vendor A bercakap tentang vendor B, dan kemudian ada integrator C, yang memberitahu sebaliknya dan menasihati vendor D. Dalam keadaan sedemikian, walaupun kepala arkitek storan yang berpengalaman akan berputar, terutamanya dengan semua vendor baharu dan SDS dan hiperkonvergensi yang bergaya hari ini.

Jadi, bagaimana anda memikirkan semuanya dan tidak akhirnya menjadi bodoh? kami (AntonVirtual Anton Zhbankov dan corp Evgeniy Elizarov) mari kita cuba bercakap tentang ini dalam bahasa Rusia biasa.
Artikel tersebut mempunyai banyak persamaan dan sebenarnya merupakan lanjutan daripada “Reka bentuk pusat data termaya” dari segi memilih sistem storan dan menyemak teknologi storan. Kami akan melihat secara ringkas teori umum, tetapi kami mengesyorkan agar anda juga membaca artikel ini.

Apa untuk

Anda selalunya boleh melihat situasi di mana orang baharu datang ke forum atau sembang khusus, seperti Perbincangan Penyimpanan, dan bertanya soalan: “di sini mereka menawarkan saya dua pilihan storan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apakah yang anda cadangkan ?”

Dan kekeliruan bermula tentang siapa yang mempunyai ciri-ciri pelaksanaan ciri-ciri yang dahsyat dan tidak dapat difahami, yang bagi orang yang tidak bersedia sepenuhnya Cina.

Jadi, soalan utama dan pertama yang anda perlu tanya diri anda jauh sebelum membandingkan spesifikasi dalam cadangan komersial ialah MENGAPA? Mengapa sistem storan ini diperlukan?

Bagaimana untuk memilih storan tanpa menembak diri sendiri di kaki

Jawapannya akan menjadi tidak dijangka, dan sangat gaya Tony Robbins - untuk menyimpan data. Terima kasih, kapten! Namun, kadangkala kita terlalu mendalam untuk membandingkan butiran sehingga kita terlupa mengapa kita melakukan semua ini pada mulanya.

Jadi, tugas sistem storan data adalah untuk menyimpan dan menyediakan akses kepada DATA dengan prestasi yang diberikan. Kami akan mulakan dengan data.

Data

Jenis data

Apakah jenis data yang kami rancang untuk simpan? Soalan yang sangat penting yang boleh menghapuskan banyak sistem storan daripada pertimbangan yang sama. Contohnya, anda bercadang untuk menyimpan video dan foto. Anda boleh segera memotong sistem yang direka untuk akses rawak dalam blok kecil, atau sistem dengan ciri proprietari dalam pemampatan / penyahduplikasian. Ini mungkin sistem yang sangat baik, kami tidak mahu mengatakan apa-apa yang buruk. Tetapi dalam kes ini, kekuatan mereka sama ada akan menjadi lemah (video dan foto tidak dimampatkan) atau hanya meningkatkan kos sistem dengan ketara.

Sebaliknya, jika penggunaan yang dimaksudkan ialah DBMS transaksi yang sibuk, maka sistem penstriman multimedia yang sangat baik yang mampu menyampaikan gigabait sesaat akan menjadi pilihan yang tidak baik.

Jumlah data

Berapa banyak data yang kami merancang untuk menyimpan? Kuantiti sentiasa berkembang menjadi kualiti; ini tidak boleh dilupakan, terutamanya dalam masa pertumbuhan eksponen dalam jumlah data kita. Sistem kelas petabyte bukan lagi luar biasa, tetapi semakin besar kapasiti petabyte, semakin spesifik sistem itu, semakin kurang boleh diakses fungsi biasa sistem akses rawak bersaiz kecil dan sederhana. Ini remeh kerana jadual statistik akses blok sahaja menjadi lebih besar daripada jumlah RAM yang tersedia pada pengawal. Apatah lagi pemampatan/peringkat. Katakan kita mahu menukar algoritma pemampatan kepada yang lebih berkuasa dan memampatkan 20 petabait data. Berapa lama masa yang diperlukan: enam bulan, setahun?

Sebaliknya, mengapa perlu bersusah payah jika anda perlu menyimpan dan memproses 500 GB data? Hanya 500. SSD Isi Rumah (dengan DWPD rendah) saiz ini tidak berharga. Mengapa membina kilang Fiber Channel dan membeli sistem storan luaran mewah yang harganya setara dengan jambatan besi tuang?

Berapakah peratusan daripada jumlah itu adalah data panas? Sejauh manakah beban tidak sekata dari segi volum data? Di sinilah teknologi storan bertingkat atau Flash Cache boleh sangat membantu jika jumlah data panas adalah kecil berbanding dengan jumlah keseluruhan. Atau sebaliknya, dengan beban seragam sepanjang keseluruhan volum, yang sering ditemui dalam sistem penstriman (pengawasan video, beberapa sistem analitik), teknologi sedemikian tidak akan memberikan apa-apa dan hanya akan meningkatkan kos/kerumitan sistem.

IP

Bahagian lain data ialah sistem maklumat yang menggunakan data. IS mempunyai satu set keperluan yang mewarisi data. Untuk mendapatkan maklumat lanjut tentang IS, lihat "Reka Bentuk Pusat Data Maya."

Keperluan Ketahanan/Ketersediaan

Keperluan untuk toleransi kesalahan / ketersediaan data diwarisi daripada IS yang menggunakannya dan dinyatakan dalam tiga nombor - RPO, RTO, ketersediaan.

Ketersediaan — bahagian untuk tempoh masa tertentu di mana data tersedia untuk bekerja dengan mereka. Biasanya dinyatakan sebagai bilangan 9. Contohnya, dua sembilan setiap tahun bermakna ketersediaan adalah 99%, atau sebaliknya 95 jam ketidaktersediaan setahun dibenarkan. Tiga sembilan - 9,5 jam setahun.

RPO / RTO bukan penunjuk jumlah, tetapi untuk setiap kejadian (kemalangan), berbeza dengan ketersediaan.

RPO — jumlah data yang hilang semasa kemalangan (dalam jam). Contohnya, jika sandaran berlaku sekali sehari, maka RPO = 24 jam. Itu. Sekiranya berlaku bencana dan kehilangan sepenuhnya sistem storan, data sehingga 24 jam boleh hilang (dari saat sandaran). Berdasarkan RPO yang ditentukan untuk IS, sebagai contoh, peraturan sandaran ditulis. Selain itu, berdasarkan RPO, anda boleh memahami berapa banyak replikasi data segerak/tak segerak diperlukan.

RTO — masa untuk memulihkan perkhidmatan (akses data) selepas bencana. Berdasarkan nilai RTO yang diberikan, kita boleh memahami sama ada kumpulan metro diperlukan atau sama ada replikasi satu arah adalah mencukupi. Adakah anda memerlukan sistem storan berbilang pengawal kelas hi-end?

Bagaimana untuk memilih storan tanpa menembak diri sendiri di kaki

Keperluan Prestasi

Walaupun ini adalah soalan yang sangat jelas, di sinilah kebanyakan kesukaran timbul. Bergantung pada sama ada anda sudah mempunyai beberapa jenis infrastruktur atau tidak, cara untuk mengumpul statistik yang diperlukan akan dibina.

Anda sudah mempunyai sistem storan dan sedang mencari pengganti atau ingin membeli yang lain untuk pengembangan. Semuanya mudah di sini. Anda memahami perkhidmatan yang anda sudah ada dan yang anda merancang untuk melaksanakan dalam masa terdekat. Berdasarkan perkhidmatan semasa, anda berpeluang mengumpul statistik prestasi. Tentukan bilangan IOPS semasa dan kependaman semasa - apakah penunjuk ini dan adakah ia mencukupi untuk tugas anda? Ini boleh dilakukan pada sistem storan data itu sendiri dan dari hos yang disambungkan kepadanya.

Selain itu, anda perlu melihat bukan sahaja pada beban semasa, tetapi dalam tempoh tertentu (sebaik-baiknya sebulan). Lihat apakah puncak maksimum pada siang hari, beban yang dibuat oleh sandaran, dsb. Jika sistem storan anda atau perisiannya tidak memberikan anda set lengkap data ini, anda boleh menggunakan RRDtool percuma, yang boleh berfungsi dengan kebanyakan sistem storan dan suis paling popular dan boleh memberikan anda statistik prestasi terperinci. Ia juga bernilai melihat beban pada hos yang berfungsi dengan sistem storan ini, untuk mesin maya tertentu, atau apa sebenarnya yang sedang berjalan pada hos ini.

Bagaimana untuk memilih storan tanpa menembak diri sendiri di kaki

Perlu diperhatikan secara berasingan bahawa jika kelewatan pada volum dan stor data yang terletak pada volum ini berbeza dengan ketara, anda harus memberi perhatian kepada rangkaian SAN anda, terdapat kebarangkalian tinggi bahawa terdapat masalah dengannya dan sebelum membeli yang baru sistem, ia patut melihat isu ini, kerana terdapat kebarangkalian yang sangat tinggi untuk meningkatkan prestasi sistem semasa.

Anda sedang membina infrastruktur dari awal, atau membeli sistem untuk beberapa perkhidmatan baharu, beban yang anda tidak sedari. Terdapat beberapa pilihan: berkomunikasi dengan rakan sekerja mengenai sumber khusus untuk cuba mengetahui dan meramalkan beban, hubungi penyepadu yang mempunyai pengalaman dalam melaksanakan perkhidmatan serupa dan yang boleh mengira beban untuk anda. Dan pilihan ketiga (biasanya yang paling sukar, terutamanya jika ia berkaitan dengan aplikasi yang ditulis di rumah atau jarang berlaku) adalah untuk mencuba untuk mengetahui keperluan prestasi daripada pembangun sistem.

Dan, sila ambil perhatian, pilihan yang paling tepat dari sudut pandangan aplikasi praktikal ialah perintis pada peralatan semasa, atau peralatan yang disediakan untuk ujian oleh vendor/integrator.

Keperluan khas

Keperluan khas ialah segala-galanya yang tidak termasuk dalam keperluan prestasi, toleransi kesalahan dan kefungsian untuk pemprosesan langsung dan penyediaan data.

Salah satu keperluan khas yang paling mudah untuk sistem storan data boleh dipanggil "media storan boleh asing." Dan dengan serta-merta menjadi jelas bahawa sistem penyimpanan data ini mesti termasuk perpustakaan pita atau hanya pemacu pita ke mana salinan sandaran dibuang. Selepas itu orang yang terlatih khas menandatangani pita itu dan dengan bangganya membawanya ke peti keselamatan khas.
Satu lagi contoh keperluan khas ialah reka bentuk kalis kejutan yang dilindungi.

Где

Komponen utama kedua dalam memilih sistem storan tertentu ialah maklumat tentang DI MANA sistem storan ini akan ditempatkan. Bermula dari geografi atau keadaan iklim, dan berakhir dengan kakitangan.

Pelanggan

Untuk siapa sistem storan ini dirancang? Soalan itu mempunyai sebab berikut:

Pelanggan/komersial kerajaan.
Pelanggan komersial tidak mempunyai sekatan dan tidak juga diwajibkan untuk mengadakan tender, kecuali mengikut peraturan dalamannya sendiri.

Pelanggan kerajaan adalah perkara yang berbeza. 44 Undang-undang Persekutuan dan keseronokan lain dengan tender dan spesifikasi teknikal yang boleh dicabar.

Pelanggan di bawah sekatan
Nah, persoalannya di sini sangat mudah - pilihan hanya terhad oleh tawaran yang tersedia untuk pelanggan tertentu.

Peraturan dalaman / vendor / model yang dibenarkan untuk pembelian
Soalannya juga sangat mudah, tetapi anda perlu mengingatinya.

Di mana secara fizikal

Dalam bahagian ini kami mempertimbangkan semua isu dengan geografi, saluran komunikasi dan iklim mikro di premis penginapan.

kakitangan

Siapa yang akan bekerja dengan sistem storan ini? Ini tidak kurang pentingnya daripada apa yang boleh dilakukan oleh sistem storan itu sendiri.
Tidak kira betapa menjanjikan, hebat dan hebatnya sistem storan daripada vendor A, mungkin tidak ada gunanya memasangnya jika kakitangan hanya tahu cara bekerja dengan vendor B, dan tiada rancangan untuk pembelian selanjutnya dan kerjasama berterusan dengan A.

Dan sudah tentu, sisi lain persoalannya ialah bagaimana kakitangan terlatih yang ada di lokasi geografi tertentu secara langsung dalam syarikat dan berpotensi di pasaran buruh. Untuk wilayah, memilih sistem storan dengan antara muka mudah atau keupayaan untuk memusatkan pengurusan dari jauh boleh masuk akal. Jika tidak, pada satu ketika ia mungkin menjadi sangat menyakitkan. Internet penuh dengan cerita tentang bagaimana seorang pekerja baru yang tiba, pelajar semalam, mengkonfigurasi perkara sedemikian sehingga seluruh pejabat dimusnahkan.

Bagaimana untuk memilih storan tanpa menembak diri sendiri di kaki

Persekitaran

Dan sudah tentu, persoalan penting ialah dalam persekitaran apakah sistem storan ini akan beroperasi.

  • Bagaimana pula dengan bekalan kuasa/penyejukan?
  • kaitan apa
  • Di mana ia akan dipasang?
  • Dan lain-lain.

Selalunya soalan-soalan ini diambil mudah dan tidak dipertimbangkan secara khusus, tetapi kadang-kadang mereka adalah soalan yang boleh mengubah segala-galanya.

Itu

Penjual

Sehingga hari ini (pertengahan 2019), pasaran storan Rusia boleh dibahagikan kepada 5 kategori:

  1. Bahagian tertinggi ialah syarikat yang mantap dengan pelbagai jenis rak cakera daripada yang paling mudah kepada hi-end (HPE, DellEMC, Hitachi, NetApp, IBM / Lenovo)
  2. Bahagian kedua - syarikat dengan barisan terhad, pemain khusus, vendor SDS yang serius atau pendatang baharu yang semakin meningkat (Fujitsu, Datacore, Infinidat, Huawei, Pure, dll.)
  3. Bahagian ketiga - penyelesaian khusus dalam peringkat rendah, SDS murah, produk termaju berdasarkan ceph dan projek terbuka lain (Infortrend, Starwind, dll.)
  4. Segmen SOHO - sistem storan kecil dan ultra kecil di peringkat rumah/pejabat kecil (Synology, QNAP, dsb.)
  5. Sistem storan gantian import - ini termasuk kedua-dua perkakasan bahagian pertama dengan label yang dilabel semula, dan wakil yang jarang berlaku bagi yang kedua (RAIDIX, kami akan memberikan mereka yang kedua terlebih dahulu), tetapi terutamanya ini adalah bahagian ketiga (Aerodisk, Baum, Depo, dll.)

Pembahagian itu agak sewenang-wenangnya, dan tidak bermakna sama sekali segmen ketiga atau SOHO adalah buruk dan tidak boleh digunakan. Dalam projek tertentu dengan set data yang jelas dan profil beban, mereka boleh berfungsi dengan baik, jauh mengatasi bahagian pertama dari segi nisbah harga/kualiti. Adalah penting untuk membuat keputusan terlebih dahulu mengenai matlamat anda, prospek pertumbuhan dan fungsi yang diperlukan - dan kemudian Synology akan melayani anda dengan setia, dan rambut anda akan menjadi lembut dan selembut sutera.

Salah satu faktor penting semasa memilih vendor ialah persekitaran semasa. Berapa banyak sistem storan yang sudah anda miliki dan sistem storan yang boleh digunakan oleh jurutera anda. Adakah anda memerlukan vendor lain, satu lagi titik hubungan, adakah anda akan memindahkan keseluruhan muatan secara beransur-ansur daripada vendor A ke vendor B?

Seseorang tidak seharusnya menghasilkan entiti melebihi apa yang diperlukan.

iSCSI/FC/Fail

Tiada konsensus di kalangan jurutera mengenai isu protokol akses, dan perbahasan itu lebih menyerupai perbincangan teologi daripada perbincangan kejuruteraan. Tetapi secara umum, perkara berikut boleh diperhatikan:

FCoE lebih mati daripada hidup.

FC lwn iSCSI. Salah satu kelebihan utama FC pada tahun 2019 berbanding storan IP, kilang khusus untuk akses data, diimbangi oleh rangkaian IP khusus. FC tidak mempunyai kelebihan global berbanding rangkaian IP, dan IP boleh digunakan untuk membina sistem storan pada sebarang tahap beban, sehingga sistem untuk DBMS berat untuk sistem perbankan teras bank besar. Sebaliknya, kematian FC telah diramalkan selama beberapa tahun sekarang, tetapi sesuatu sentiasa menghalangnya. Hari ini, sebagai contoh, beberapa pemain dalam pasaran storan sedang giat membangunkan standard NVMEoF. Sama ada dia akan berkongsi nasib FCoE - masa akan menentukan.

Akses fail juga bukanlah sesuatu yang tidak patut diberi perhatian. NFS/CIFS berfungsi dengan baik dalam persekitaran produktiviti dan, jika direka dengan betul, tidak mempunyai aduan lebih daripada protokol blok.

Hibrid / Semua Susunan Denyar

Sistem storan klasik terdapat dalam 2 jenis:

  1. AFA (All Flash Array) - sistem yang dioptimumkan untuk penggunaan SSD.
  2. Hibrid - membolehkan anda menggunakan kedua-dua HDD dan SSD atau gabungan keduanya.

Perbezaan utama mereka ialah teknologi kecekapan storan yang disokong dan tahap prestasi maksimum (IOPS tinggi dan kependaman rendah). Kedua-dua sistem (dalam kebanyakan model mereka, tidak mengira segmen rendah) boleh beroperasi sebagai peranti blok dan fail. Fungsi yang disokong bergantung pada tahap sistem, dan untuk model yang lebih muda ia paling kerap dikurangkan kepada tahap minimum. Ini patut diberi perhatian apabila anda mengkaji ciri-ciri model tertentu, dan bukan hanya keupayaan keseluruhan baris secara keseluruhan. Juga, sudah tentu, ciri teknikalnya, seperti pemproses, jumlah memori, cache, nombor dan jenis port, dsb., juga bergantung pada tahap sistem. Dari sudut pandangan pengurusan, AFA berbeza daripada sistem hibrid (cakera) hanya dalam pelaksanaan mekanisme untuk bekerja dengan pemacu SSD, dan walaupun anda menggunakan SSD dalam sistem hibrid, ini sama sekali tidak bermakna anda akan dapat untuk mencapai tahap prestasi pada tahap sistem AFA . Juga, dalam kebanyakan kes, mekanisme storan cekap sebaris dilumpuhkan pada sistem hibrid, dan kemasukannya membawa kepada kehilangan prestasi.

Sistem storan khas

Selain sistem storan tujuan am, tertumpu terutamanya pada pemprosesan data operasi, terdapat sistem storan khas dengan prinsip utama yang pada asasnya berbeza daripada yang biasa (pendaman rendah, IOPS tinggi):

media.

Sistem ini direka untuk menyimpan dan memproses fail media besar. Resp. kelewatan menjadi hampir tidak penting, dan keupayaan untuk menghantar dan menerima data dalam jalur lebar dalam banyak aliran selari muncul di hadapan.

Menyahduplikasi sistem storan untuk sandaran.

Oleh kerana salinan sandaran dibezakan oleh persamaannya antara satu sama lain, yang jarang berlaku dalam keadaan biasa (purata salinan sandaran berbeza daripada salinan semalam sebanyak 1-2%), kelas sistem ini membungkus data yang direkodkan padanya dengan sangat cekap dalam tempoh yang agak kecil. bilangan media fizikal. Sebagai contoh, dalam beberapa kes, nisbah mampatan data boleh mencapai 200 hingga 1.

Sistem penyimpanan objek.

Sistem storan ini tidak mempunyai volum akses blok dan perkongsian fail biasa, dan kebanyakannya ia menyerupai pangkalan data yang besar. Akses kepada objek yang disimpan dalam sistem sedemikian dijalankan oleh pengecam unik atau oleh metadata (contohnya, semua objek format JPEG dengan tarikh penciptaan antara XX-XX-XXXX dan YY-YY-YYYY).

Sistem pematuhan.

Mereka tidak begitu biasa di Rusia hari ini, tetapi mereka patut disebut. Tujuan sistem storan sedemikian adalah storan data terjamin untuk mematuhi dasar keselamatan atau keperluan kawal selia. Sesetengah sistem (contohnya EMC Centera) telah melaksanakan fungsi untuk melarang pemadaman data - sebaik sahaja kunci dihidupkan dan sistem memasuki mod ini, pentadbir mahupun orang lain tidak boleh memadamkan data yang telah direkodkan secara fizikal.

Teknologi proprietari

Cache flash

Cache Flash ialah nama biasa untuk semua teknologi proprietari untuk menggunakan memori flash sebagai cache peringkat kedua. Apabila menggunakan cache denyar, sistem storan biasanya dikira untuk memberikan beban yang stabil daripada cakera magnetik, manakala puncak dilayan oleh cache.

Dalam kes ini, adalah perlu untuk memahami profil beban dan tahap penyetempatan akses kepada blok volum storan. Cache kilat ialah teknologi untuk beban kerja dengan pertanyaan yang sangat setempat, dan boleh dikatakan tidak boleh digunakan untuk volum yang dimuatkan secara seragam (seperti untuk sistem analitik).

Terdapat dua pelaksanaan cache kilat tersedia di pasaran:

  • Baca sahaja. Dalam kes ini, hanya data baca yang dicache, dan penulisan pergi terus ke cakera. Sesetengah pengeluar, seperti NetApp, percaya bahawa menulis ke sistem storan mereka sudah optimum, dan cache tidak akan membantu sama sekali.
  • Baca tulis. Bukan sahaja membaca, tetapi juga menulis dicache, yang membolehkan anda menampan strim dan mengurangkan kesan Penalti RAID, dan akibatnya meningkatkan prestasi keseluruhan untuk sistem storan dengan mekanisme penulisan yang kurang optimum.

Meningkat

Storan berbilang peringkat (memenatkan) ialah teknologi untuk menggabungkan tahap dengan tahap prestasi yang berbeza, seperti SSD dan HDD, ke dalam kumpulan cakera tunggal. Sekiranya terdapat ketidaksamaan akses kepada blok data, sistem akan dapat mengimbangi blok data secara automatik, memindahkan yang dimuatkan ke tahap prestasi tinggi, dan yang sejuk, sebaliknya, ke yang lebih perlahan.

Sistem hibrid kelas bawah dan pertengahan menggunakan storan berbilang peringkat dengan data bergerak antara tahap mengikut jadual. Pada masa yang sama, saiz blok storan berbilang peringkat untuk model terbaik ialah 256 MB. Ciri ini tidak membenarkan kami menganggap teknologi storan berperingkat sebagai teknologi untuk meningkatkan produktiviti, kerana ramai orang tersilap percaya. Storan berbilang peringkat dalam sistem kelas rendah dan sederhana ialah teknologi untuk mengoptimumkan kos storan untuk sistem dengan ketidaksamaan beban yang ketara.

Tangkapan

Tidak kira berapa banyak kita bercakap tentang kebolehpercayaan sistem storan, terdapat banyak peluang untuk kehilangan data yang tidak bergantung pada masalah perkakasan. Ini mungkin virus, penggodam atau sebarang pemadaman/rasuah data lain yang tidak disengajakan. Atas sebab ini, membuat sandaran data pengeluaran adalah bahagian penting dalam tugas jurutera.

Syot kilat ialah syot kilat kelantangan pada suatu masa. Apabila bekerja dengan kebanyakan sistem, seperti virtualisasi, pangkalan data, dsb. kita perlu mengambil petikan sebegitu dari mana kita akan menyalin data ke salinan sandaran, manakala IS kita akan dapat terus bekerja dengan jilid ini dengan selamat. Tetapi perlu diingat bahawa tidak semua syot kilat adalah sama berguna. Vendor yang berbeza mempunyai pendekatan yang berbeza untuk mencipta syot kilat yang berkaitan dengan seni bina mereka.

CoW (Salin Atas Tulis). Apabila anda cuba menulis blok data, kandungan asalnya disalin ke kawasan khas, selepas itu penulisan diteruskan seperti biasa. Ini menghalang rasuah data dalam syot kilat. Sememangnya, semua manipulasi data "parasit" ini menyebabkan beban tambahan pada sistem storan dan atas sebab ini, vendor dengan pelaksanaan yang serupa tidak mengesyorkan menggunakan lebih daripada sedozen syot kilat, dan tidak menggunakannya sama sekali pada volum yang sangat dimuatkan.

RoW (Redirect-on-Write). Dalam kes ini, volum asal secara semula jadi membeku, dan apabila cuba menulis blok data, sistem storan menulis data ke kawasan khas dalam ruang kosong, menukar lokasi blok ini dalam jadual metadata. Ini membolehkan anda mengurangkan bilangan operasi tulis semula, yang akhirnya menghapuskan penurunan prestasi dan mengalih keluar sekatan pada syot kilat dan bilangannya.

Syot kilat juga terdiri daripada dua jenis berhubung dengan aplikasi:

Konsistensi permohonan. Pada saat mencipta syot kilat, sistem storan menarik ejen dalam sistem pengendalian pengguna, yang secara paksa membuang cache cakera dari memori ke cakera dan memaksa aplikasi untuk melakukan ini. Dalam kes ini, apabila memulihkan daripada syot kilat, data akan konsisten.

Ranap konsisten. Dalam kes ini, tiada perkara seperti itu berlaku dan syot kilat dicipta sebagaimana adanya. Dalam kes pemulihan daripada syot kilat sedemikian, gambar adalah sama dengan apa yang akan berlaku jika kuasa tiba-tiba dimatikan dan beberapa kehilangan data mungkin, tersekat dalam cache dan tidak pernah sampai ke cakera. Syot kilat sedemikian lebih mudah untuk dilaksanakan dan tidak menyebabkan kemerosotan prestasi dalam aplikasi, tetapi kurang dipercayai.

Mengapa syot kilat diperlukan pada sistem storan?

  • Sandaran tanpa agen terus daripada sistem storan
  • Cipta persekitaran ujian berdasarkan data sebenar
  • Dalam kes sistem storan fail, ia boleh digunakan untuk mencipta persekitaran VDI melalui penggunaan syot kilat sistem storan dan bukannya hipervisor.
  • Pastikan RPO rendah dengan mencipta syot kilat berjadual pada frekuensi yang jauh lebih tinggi daripada kekerapan sandaran

Pengklonan

Pengklonan volum - berfungsi pada prinsip yang sama seperti syot kilat, tetapi digunakan bukan sahaja untuk membaca data, tetapi untuk bekerja sepenuhnya dengannya. Kami boleh mendapatkan salinan tepat volum kami, dengan semua data di atasnya, tanpa membuat salinan fizikal, yang akan menjimatkan ruang. Biasanya, pengklonan volum digunakan sama ada dalam Test&Dev atau jika anda ingin menyemak kefungsian beberapa kemas kini pada IS anda. Pengklonan akan membolehkan anda melakukan ini secepat dan ekonomi yang mungkin dari segi sumber cakera, kerana Hanya blok data yang diubah akan ditulis.

Replikasi / Jurnal

Replikasi ialah mekanisme untuk mencipta salinan data pada sistem storan fizikal yang lain. Biasanya, setiap vendor mempunyai teknologi proprietari yang berfungsi hanya dalam taliannya sendiri. Tetapi terdapat juga penyelesaian pihak ketiga, termasuk penyelesaian yang berfungsi pada tahap hipervisor, seperti VMware vSphere Replication.

Kefungsian teknologi proprietari dan kemudahan penggunaannya biasanya jauh lebih baik daripada yang universal, tetapi ia ternyata tidak dapat digunakan apabila, sebagai contoh, perlu membuat replika dari NetApp ke HP MSA.

Replikasi dibahagikan kepada dua subtipe:

segerak. Dalam kes replikasi segerak, operasi tulis dihantar ke sistem storan kedua serta-merta dan pelaksanaan tidak disahkan sehingga sistem storan jauh mengesahkan. Disebabkan ini, kelewatan akses meningkat, tetapi kami mempunyai salinan cermin yang tepat bagi data tersebut. Itu. RPO = 0 sekiranya berlaku kehilangan sistem storan utama.

tak segerak. Operasi tulis dilaksanakan hanya pada sistem storan utama dan disahkan serta-merta, sambil secara serentak terkumpul dalam penimbal untuk penghantaran kelompok ke sistem storan jauh. Jenis replikasi ini adalah berkaitan untuk data yang kurang berharga, atau untuk saluran dengan lebar jalur rendah atau kependaman tinggi (biasa untuk jarak lebih 100 km). Oleh itu, RPO = kekerapan penghantaran paket.

Selalunya, bersama dengan replikasi, terdapat mekanisme pembalakan operasi cakera. Dalam kes ini, kawasan khas diperuntukkan untuk operasi pembalakan dan rakaman pada kedalaman tertentu dalam masa, atau dihadkan oleh volum log, disimpan. Untuk teknologi proprietari tertentu, seperti EMC RecoverPoint, terdapat penyepaduan dengan perisian sistem yang membolehkan anda memautkan penanda halaman tertentu ke entri log tertentu. Terima kasih kepada ini, adalah mungkin untuk melancarkan semula keadaan volum (atau mencipta klon) bukan sahaja pada 23 April, 11 jam 59 saat 13 milisaat, tetapi pada saat sebelum “LEPASKAN SEMUA JADUAL; KOMITED.”

Kluster Metro

Kluster Metro ialah teknologi yang membolehkan anda mencipta replikasi segerak dua arah antara dua sistem storan dengan cara yang dari luar pasangan ini kelihatan seperti satu sistem storan. Ia digunakan untuk mencipta kelompok dengan lengan yang dipisahkan secara geografi pada jarak metro (kurang daripada 100 km).

Berdasarkan contoh penggunaan dalam persekitaran virtualisasi, metrocluster membolehkan anda mencipta stor data dengan mesin maya, boleh diakses untuk rakaman daripada dua pusat data sekaligus. Dalam kes ini, gugusan dibuat pada peringkat hipervisor, yang terdiri daripada hos dalam pusat data fizikal yang berbeza, disambungkan ke stor data ini. Yang membolehkan anda melakukan perkara berikut:

  • Automasi penuh proses pemulihan selepas kematian salah satu pusat data. Tanpa sebarang dana tambahan, semua VM yang berjalan di pusat data yang telah mati akan dimulakan semula secara automatik dalam baki yang lain. RTO = tamat masa kluster ketersediaan tinggi (15 saat untuk VMware) + masa untuk memuatkan sistem pengendalian dan memulakan perkhidmatan.
  • Pengelakan bencana atau, dalam bahasa Rusia, mengelakkan bencana. Jika kerja bekalan kuasa dirancang di pusat data 1, maka kami berpeluang untuk memindahkan keseluruhan beban penting ke pusat data 2 tanpa henti lebih awal, sebelum kerja bermula.

Virtualisasi

Maya storan secara teknikalnya ialah penggunaan volum daripada sistem storan lain sebagai cakera. Virtualizer storan hanya boleh memindahkan volum orang lain kepada pengguna sebagai miliknya, pada masa yang sama mencerminkannya ke sistem storan lain, atau bahkan mencipta RAID daripada volum luaran.
Wakil klasik dalam kelas virtualisasi storan ialah EMC VPLEX dan IBM SVC. Dan sudah tentu, sistem storan dengan fungsi virtualisasi - NetApp, Hitachi, IBM / Lenovo Storwize.

Mengapa ia mungkin diperlukan?

  • Lebihan di peringkat sistem storan. Cermin dicipta di antara volum, dan separuh boleh berada pada HP 3Par, dan satu lagi pada NetApp. Dan virtualizer adalah dari EMC.
  • Alihkan data dengan masa henti minimum antara sistem storan daripada pengeluar yang berbeza. Mari kita anggap bahawa data perlu dipindahkan daripada 3Par lama, yang akan dihapus kira, kepada Dell baharu. Dalam kes ini, pengguna diputuskan sambungan daripada 3Par, volum dipindahkan di bawah VPLEX dan dibentangkan kepada pengguna sekali lagi. Memandangkan tidak sedikit pun yang berubah pada kelantangan, kerja diteruskan. Proses pencerminan kelantangan kepada Dell baharu bermula di latar belakang, dan setelah selesai, cermin itu rosak dan 3Par dinyahdayakan.
  • Organisasi metrocluster.

Mampatan/penduplikasi

Mampatan dan deduplikasi ialah teknologi yang membolehkan anda menjimatkan ruang cakera pada sistem storan anda. Perlu dinyatakan dengan segera bahawa tidak semua data tertakluk kepada pemampatan dan/atau penyahduplikasian pada dasarnya, manakala beberapa jenis data dimampatkan dan dinyahduplikasi dengan lebih baik, dan beberapa - sebaliknya.

Terdapat 2 jenis pemampatan dan penyahduplikasian:

Dalam barisan — pemampatan dan penyahduplikasian blok data berlaku sebelum menulis data ini ke cakera. Oleh itu, sistem hanya mengira cincang blok dan membandingkannya dalam jadual dengan yang sedia ada. Pertama, ia lebih pantas daripada sekadar menulis ke cakera, dan kedua, kami tidak membazir ruang cakera tambahan.

Post - apabila operasi ini dijalankan pada data yang telah direkodkan terletak pada cakera. Sehubungan itu, data pertama kali ditulis ke cakera, dan hanya kemudian cincangan dikira dan blok yang tidak perlu dipadamkan dan sumber cakera dibebaskan.

Perlu dikatakan bahawa kebanyakan vendor menggunakan kedua-dua jenis, yang membolehkan mereka mengoptimumkan proses ini dan dengan itu meningkatkan kecekapan mereka. Kebanyakan vendor storan mempunyai utiliti yang membolehkan anda menganalisis set data anda. Utiliti ini berfungsi mengikut logik yang sama yang dilaksanakan dalam sistem storan, jadi anggaran tahap kecekapan adalah sama. Selain itu, perlu diingat bahawa banyak vendor mempunyai program jaminan prestasi yang menjanjikan sekurang-kurangnya prestasi yang baik untuk jenis data tertentu (atau semua). Dan anda tidak sepatutnya mengabaikan program ini, kerana dengan mengira sistem untuk tugas anda, dengan mengambil kira pekali kecekapan sistem tertentu, anda boleh menjimatkan volum. Perlu juga dipertimbangkan bahawa program ini direka untuk sistem AFA, tetapi terima kasih kepada pembelian jumlah SSD yang lebih kecil daripada HDD dalam sistem klasik, ini akan mengurangkan kosnya, dan jika tidak sama dengan kos sistem cakera, maka cukup dekat dengannya.

Model

Dan di sini kita datang kepada soalan yang betul.

“Mereka menawarkan saya dua pilihan storan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apakah yang anda cadangkan?”

Berubah menjadi “Di sini mereka menawarkan saya dua pilihan storan - ABC SuperStorage S600 dan XYZ HyperOcean 666v4, apakah yang anda cadangkan?

Beban sasaran ialah mesin maya VMware bercampur dengan gelung pengeluaran/ujian/pembangunan. Ujian = produktif. 150 TB setiap satu dengan prestasi puncak 80 IOPS 000kb blok 8% akses rawak 50/80 baca-tulis. 20 TB untuk pembangunan, 300 IOPS sudah cukup, 50 rawak, 000 tulis.

Produktiviti mungkin dalam RPO metrocluster = 15 minit RTO = 1 jam, pembangunan dalam replikasi tak segerak RPO = 3 jam, ujian di satu tapak.

Akan ada DBMS 50TB, pembalakan adalah bagus untuk mereka.

Kami mempunyai pelayan Dell di mana-mana, sistem storan Hitachi lama, mereka hampir tidak dapat mengatasinya, kami merancang untuk meningkatkan beban sebanyak 50% dari segi volum dan prestasi.”

Seperti yang mereka katakan, soalan yang dirumus dengan betul mengandungi 80% jawapan.

maklumat tambahan

Apa yang anda patut baca tambahan menurut pengarang

buku

  • Olifer dan Olifer "Rangkaian komputer". Buku ini akan membantu untuk mensistematikkan dan mungkin lebih memahami cara medium penghantaran data untuk sistem storan IP / Ethernet berfungsi
  • "Penyimpanan dan Pengurusan Maklumat EMC." Buku yang sangat baik tentang asas sistem storan, sebab, bagaimana dan sebabnya.

Forum dan sembang

Cadangan am

harga

Sekarang, bagi harga - secara amnya, jika terdapat harga untuk sistem storan, ia biasanya Senarai harga, yang mana setiap pelanggan menerima diskaun individu. Saiz diskaun terdiri daripada sejumlah besar parameter, jadi adalah mustahil untuk meramalkan harga akhir yang akan diterima oleh syarikat anda tanpa bertanya kepada pengedar. Tetapi pada masa yang sama, baru-baru ini model kelas rendah telah mula muncul di kedai komputer biasa, seperti, contohnya nix.ru atau xcom-shop.ru. Di sini anda boleh segera membeli sistem yang anda minati pada harga tetap, seperti mana-mana komponen komputer.

Tetapi saya ingin ambil perhatian segera bahawa perbandingan langsung oleh TB/$ adalah tidak betul. Jika kita mendekatinya dari sudut pandangan ini, maka penyelesaian yang paling murah ialah pelayan JBOD + yang mudah, yang tidak akan memberikan sama ada fleksibiliti atau kebolehpercayaan yang disediakan oleh sistem storan dwi-pengawal sepenuhnya. Ini tidak bermakna sama sekali bahawa JBOD adalah menjijikkan dan helah kotor yang jahat, anda hanya perlu sekali lagi memahami dengan jelas bagaimana dan untuk tujuan apa anda akan menggunakan penyelesaian ini. Anda sering mendengar bahawa tiada apa-apa untuk dipecahkan di JBOD, hanya ada satu backplane. Walau bagaimanapun, pesawat belakang juga kadangkala gagal. Semuanya cepat atau lambat.

Dalam jumlah

Ia adalah perlu untuk membandingkan sistem antara satu sama lain bukan sahaja dengan harga, atau bukan sahaja dengan prestasi, tetapi dengan keseluruhan semua penunjuk.

Beli HDD hanya jika anda pasti anda memerlukan HDD. Untuk beban rendah dan jenis data yang tidak boleh dimampatkan, jika tidak, ia patut beralih kepada program jaminan kecekapan storan SSD, yang kebanyakan vendor kini ada (dan mereka benar-benar berfungsi, walaupun di Rusia), tetapi semuanya bergantung pada aplikasi dan data yang akan ditempatkan pada sistem storan ini.

Jangan pergi murah. Kadang-kadang ini menyembunyikan banyak detik yang tidak menyenangkan, salah satunya Evgeniy Elizarov menerangkan dalam artikelnya tentang Infortrend. Dan itu, pada akhirnya, kemurahan ini boleh menjadi bumerang kepada anda. Jangan lupa - "orang kikir membayar dua kali."

Sumber: www.habr.com

Tambah komen