Pelanggan menginginkan VDI. Saya benar-benar melihat kombinasi SimpliVity + VDI Citrix Virtual Desktop. Untuk semua operator, pegawai kantor kota, dan lain sebagainya. Ada lima ribu pengguna dalam gelombang pertama migrasi saja, dan oleh karena itu mereka bersikeras melakukan pengujian beban. VDI mungkin mulai melambat, ia dapat berbaring dengan tenang - dan ini tidak selalu terjadi karena masalah pada saluran. Kami membeli paket pengujian yang sangat kuat khusus untuk VDI dan memuat infrastruktur hingga menjadi terlalu berat pada disk dan prosesor.
Jadi, kita memerlukan botol plastik dan software LoginVSI untuk tes VDI yang canggih. Kami memilikinya dengan lisensi untuk 300 pengguna. Kemudian kami mengambil perangkat keras HPE SimpliVity 380 dalam paket yang sesuai untuk tugas kepadatan pengguna maksimum per server, memotong mesin virtual dengan kelebihan permintaan yang baik, menginstal perangkat lunak perkantoran pada Win10 pada mesin tersebut dan mulai menguji.
Sistem
Dua node (server) HPE SimpliVity 380 Gen10. Pada setiap:
- 2 x Intel Xeon Platinum 8170 26c 2.1Ghz.
- RAM: 768GB, 12 x 64GB LRDIMM DDR4 2666MHz.
- Pengontrol disk utama: HPE Smart Array P816i-a SR Gen10.
- Hard drive: 9 x 1.92 TB SATA 6 Gb/s SSD (dalam konfigurasi RAID6 7+2, yaitu model Medium dalam istilah HPE SimpliVity).
- Kartu jaringan: 4 x 1Gb Eth (data pengguna), 2 x 10Gb Eth (backend SimpliVity dan vMotion).
- Kartu FPGA bawaan khusus di setiap node untuk deduplikasi/kompresi.
Node-node tersebut terhubung satu sama lain melalui interkoneksi Ethernet 10Gb secara langsung tanpa sakelar eksternal, yang digunakan sebagai backend SimpliVity dan untuk mentransfer data mesin virtual melalui NFS. Data mesin virtual dalam sebuah cluster selalu dicerminkan antara dua node.
Node digabungkan menjadi cluster Vmware vSphere yang dikelola oleh vCenter.
Untuk pengujian, pengontrol domain dan broker koneksi Citrix dikerahkan. Pengontrol domain, broker dan vCenter ditempatkan pada cluster terpisah.
Sebagai infrastruktur pengujian, 300 desktop virtual dikerahkan dalam konfigurasi Dedicated – Full Copy, yaitu setiap desktop adalah salinan lengkap dari gambar asli mesin virtual dan menyimpan semua perubahan yang dilakukan oleh pengguna.
Setiap mesin virtual memiliki 2vCPU dan 4GB RAM:
Perangkat lunak berikut yang diperlukan untuk pengujian telah diinstal pada mesin virtual:
- Windows 10 (64-bit), versi 1809.
- Adobe Reader XI.
- Agen Pengiriman Virtual Citrix 1811.1.
- Doro PDF 1.82.
- Pembaruan Java 7 13.
- Microsoft Office Professional Plus 2016.
Antar node - replikasi sinkron. Setiap blok data di cluster memiliki dua salinan. Artinya, sekarang terdapat satu set data lengkap pada setiap node. Dengan cluster yang terdiri dari tiga node atau lebih, salinan blok berada di dua tempat berbeda. Saat membuat VM baru, salinan tambahan dibuat di salah satu node cluster. Ketika satu node gagal, semua VM yang sebelumnya berjalan di node tersebut secara otomatis dimulai ulang di node lain yang memiliki replikanya. Jika sebuah node gagal untuk waktu yang lama, maka pemulihan redundansi secara bertahap dimulai, dan klaster kembali ke redundansi N+1.
Penyeimbangan dan penyimpanan data terjadi pada tingkat penyimpanan perangkat lunak SimpliVity itu sendiri.
Mesin virtual menjalankan kluster virtualisasi, yang juga menempatkannya pada penyimpanan perangkat lunak. Meja-meja itu sendiri diambil sesuai dengan templat standar: meja pemodal dan petugas operasi datang untuk ujian (ini adalah dua templat yang berbeda).
Pengujian
Untuk pengujian, rangkaian pengujian perangkat lunak LoginVSI 4.1 digunakan. Kompleks LoginVSI, yang terdiri dari server kontrol dan 12 mesin untuk koneksi pengujian, dikerahkan pada host fisik terpisah.
Pengujian dilakukan dalam tiga mode:
Mode benchmark - memuat kasus 300 pekerja Pengetahuan dan 300 pekerja Penyimpanan.
Mode standar - memuat case 300 Pekerja listrik.
Untuk memungkinkan Powerworker bekerja dan meningkatkan keragaman beban, perpustakaan file Power Library tambahan ditambahkan ke kompleks LoginVSI. Untuk memastikan pengulangan hasil, semua pengaturan bangku tes dibiarkan sebagai Default.
Tes Pengetahuan dan Kekuatan pekerja menyimulasikan beban kerja nyata pengguna yang bekerja di stasiun kerja virtual.
Tes pekerja Penyimpanan dibuat khusus untuk menguji sistem penyimpanan data; ini jauh dari beban kerja nyata dan sebagian besar melibatkan pengguna yang bekerja dengan sejumlah besar file dengan ukuran berbeda.
Selama pengujian, pengguna login ke stasiun kerja selama 48 menit dengan kecepatan sekitar satu pengguna setiap 10 detik.
Temuan
Hasil utama dari pengujian LoginVSI adalah metrik VSImax, yang disusun dari waktu eksekusi berbagai tugas yang diluncurkan oleh pengguna. Misalnya: waktu membuka file di Notepad, waktu mengompres file di 7-Zip, dll.
Penjelasan rinci tentang penghitungan metrik tersedia di dokumentasi resmi untuk
Dengan kata lain, LoginVSI mengulangi pola pemuatan yang umum, menyimulasikan tindakan pengguna di office suite, membaca PDF, dan sebagainya, serta mengukur berbagai latensi. Ada tingkat penundaan yang kritis “semuanya melambat, tidak mungkin berfungsi”), yang sebelumnya dianggap bahwa jumlah maksimum pengguna belum tercapai. Jika waktu respons 1 ms lebih cepat dari status “semuanya lambat”, maka sistem dianggap bekerja normal, dan lebih banyak pengguna dapat ditambahkan.
Berikut adalah metrik utama:
Metrik
Tindakan yang diambil
Detail описание
Komponen yang dimuat
N.S.L.D.
Waktu pembukaan teks
file seberat 1 KB
Buku catatan terbuka dan
membuka dokumen acak berukuran 1 KB yang disalin dari kumpulan
sumber daya
CPU dan I/O
informasi
Waktu pembukaan dialog
jendela di notepad
Membuka file VSI-Notepad [Ctrl+O]
CPU, RAM, dan I/O
ZHC*
Saatnya membuat file Zip yang sangat terkompresi
Kompresi lokal
file .pst 5MB acak disalin dari
kolam sumberdaya
CPU dan I/O
ZLC*
Saatnya membuat file Zip yang terkompresi dengan lemah
Kompresi lokal
file .pst 5MB acak disalin dari
kolam sumberdaya
I / O
CPU
Menghitung besar
susunan data acak
Membuat Array Besar
data acak yang akan digunakan pada input/output timer (I/O timer)
CPU
Saat pengujian dilakukan, metrik dasar VSIbase pada awalnya dihitung, yang menunjukkan kecepatan pelaksanaan pekerjaan tanpa beban pada sistem. Berdasarkan itu, VSImax Threshold ditentukan, yaitu sebesar VSIbase + 1ms.
Kesimpulan mengenai performa sistem dibuat berdasarkan dua metrik: VSIbase, yang menentukan kecepatan sistem, dan ambang batas VSImax, yang menentukan jumlah maksimum pengguna yang dapat ditangani sistem tanpa penurunan signifikan.
300 patokan pekerja pengetahuan
Pekerja pengetahuan adalah pengguna yang secara teratur memuat memori, prosesor, dan IO dengan berbagai puncak kecil. Perangkat lunak ini mengemulasi beban kerja pengguna kantor yang menuntut, seolah-olah mereka terus-menerus mencari sesuatu (PDF, Java, office suite, melihat foto, 7-Zip). Saat Anda menambahkan pengguna dari nol hingga 300, penundaan untuk setiap pengguna meningkat secara bertahap.
Data statistik VSImax:
VSIbase = 986ms, VSI Threshold tidak tercapai.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Dengan jenis beban ini, sistem dapat menahan peningkatan beban tanpa penurunan kinerja. Waktu yang diperlukan untuk menyelesaikan tugas pengguna meningkat dengan lancar, waktu respons sistem tidak berubah selama pengujian dan mencapai 3 ms untuk menulis dan hingga 1 ms untuk membaca.
Kesimpulan: 300 pengguna pengetahuan bekerja pada cluster saat ini tanpa masalah dan tidak mengganggu satu sama lain, mencapai kelebihan permintaan pCPU/vCPU sebesar 1 hingga 6. Penundaan keseluruhan meningkat secara merata seiring dengan meningkatnya beban, namun batas yang ditentukan belum tercapai.
300 patokan pekerja penyimpanan
Ini adalah pengguna yang terus-menerus menulis dan membaca dengan rasio masing-masing 30 banding 70. Pengujian ini dilakukan lebih untuk kepentingan eksperimen. Data statistik VSImax:
VSIbase = 1673, VSI Threshold tercapai pada 240 pengguna.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Jenis beban ini pada dasarnya adalah uji tekanan pada sistem penyimpanan. Ketika dijalankan, setiap pengguna menulis banyak file acak dengan ukuran berbeda ke disk. Dalam hal ini, terlihat bahwa ketika ambang batas beban tertentu terlampaui untuk beberapa pengguna, waktu yang diperlukan untuk menyelesaikan tugas penulisan file meningkat. Pada saat yang sama, beban pada sistem penyimpanan, prosesor, dan memori host tidak berubah secara signifikan, sehingga saat ini tidak mungkin untuk menentukan secara pasti apa yang menyebabkan penundaan tersebut.
Kesimpulan tentang kinerja sistem yang menggunakan pengujian ini hanya dapat dibuat dengan membandingkan hasil pengujian pada sistem lain, karena beban tersebut bersifat sintetik dan tidak realistis. Namun secara keseluruhan tes tersebut berjalan dengan baik. Semuanya berjalan baik hingga sesi 210, dan kemudian respons aneh dimulai, yang tidak terlacak di mana pun kecuali Login VSI.
300 pekerja listrik
Ini adalah pengguna yang menyukai CPU, memori, dan IO tinggi. “Pengguna yang mahir” ini secara teratur menjalankan tugas-tugas kompleks dengan jangka waktu yang lama, seperti menginstal perangkat lunak baru dan membongkar arsip besar. Data statistik VSImax:
VSIbase = 970, VSI Threshold tidak tercapai.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Selama pengujian, ambang batas beban prosesor tercapai pada salah satu node sistem, tetapi hal ini tidak berdampak signifikan pada pengoperasiannya:
Dalam hal ini, sistem dapat menahan peningkatan beban tanpa penurunan kinerja yang signifikan. Waktu yang diperlukan untuk menyelesaikan tugas pengguna meningkat dengan lancar, waktu respons sistem tidak berubah selama pengujian dan mencapai 3 ms untuk menulis dan hingga 1 ms untuk membaca.
Pengujian rutin tidak cukup bagi pelanggan, dan kami melangkah lebih jauh: kami meningkatkan karakteristik VM (jumlah vCPU untuk mengevaluasi peningkatan kelebihan permintaan dan ukuran disk) dan menambahkan beban tambahan.
Saat melakukan pengujian tambahan, konfigurasi dudukan berikut digunakan:
300 desktop virtual dikerahkan dalam konfigurasi 4vCPU, RAM 4 GB, dan HDD 80 GB.
Konfigurasi salah satu mesin uji:
Mesin dikerahkan dalam opsi Dedicated – Full Copy:
300 Benchmark pekerja pengetahuan dengan kelebihan permintaan 12
Data statistik VSImax:
VSIbase = 921 ms, VSI Threshold tidak tercapai.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Hasil yang diperoleh serupa dengan pengujian konfigurasi VM sebelumnya.
300 pekerja listrik dengan 12 kelebihan permintaan
Data statistik VSImax:
VSIbase = 933, VSI Threshold tidak tercapai.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Selama pengujian ini, ambang batas beban prosesor juga tercapai, namun hal ini tidak berdampak signifikan terhadap kinerja:
Hasil yang diperoleh serupa dengan pengujian konfigurasi sebelumnya.
Apa yang terjadi jika Anda menjalankan beban selama 10 jam?
Sekarang mari kita lihat apakah akan ada “efek akumulasi” dan jalankan pengujian selama 10 jam berturut-turut.
Pengujian dan deskripsi jangka panjang dari bagian tersebut harus ditujukan pada fakta bahwa kami ingin memeriksa apakah akan timbul masalah dengan rangka di bawah beban yang berkepanjangan.
300 patokan pekerja pengetahuan + 10 jam
Selain itu, kasus beban yang terdiri dari 300 pekerja pengetahuan telah diuji, diikuti dengan pekerjaan pengguna selama 10 jam.
Data statistik VSImax:
VSIbase = 919 ms, VSI Threshold tidak tercapai.
Data statistik terperinci VSImax:
Grafik menunjukkan bahwa tidak ada penurunan kinerja yang diamati selama keseluruhan pengujian.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Performa sistem penyimpanan tetap sama selama pengujian.
Pengujian tambahan dengan penambahan beban sintetik
Pelanggan meminta untuk menambahkan beban liar ke disk. Untuk melakukan ini, tugas ditambahkan ke sistem penyimpanan di setiap mesin virtual pengguna untuk menjalankan beban sintetis pada disk saat pengguna masuk ke sistem. Pemuatan disediakan oleh utilitas fio, yang memungkinkan Anda membatasi beban pada disk berdasarkan jumlah IOPS. Di setiap mesin, tugas diluncurkan untuk meluncurkan beban tambahan sebesar 22 IOPS 70%/30% Baca/Tulis Acak.
300 patokan pekerja pengetahuan + 22 IOPS per pengguna
Dalam pengujian awal, fio ditemukan membebankan overhead CPU yang signifikan pada mesin virtual. Hal ini menyebabkan kelebihan CPU yang cepat pada host dan sangat mempengaruhi pengoperasian sistem secara keseluruhan.
Beban CPU tuan rumah:
Pada saat yang sama, penundaan sistem penyimpanan juga meningkat secara alami:
Kurangnya daya komputasi menjadi kritis bagi 240 pengguna:
Karena hasil yang diperoleh, diputuskan untuk melakukan pengujian yang tidak terlalu intensif CPU.
230 patokan pekerja kantor + 22 IOPS per pengguna
Untuk mengurangi beban pada CPU, jenis beban pekerja Office dipilih, dan 22 IOPS beban sintetis juga ditambahkan ke setiap sesi.
Pengujian dibatasi hingga 230 sesi agar tidak melebihi beban CPU maksimum.
Pengujian dijalankan dengan pengguna berjalan selama 10 jam untuk memeriksa stabilitas sistem selama pengoperasian jangka panjang mendekati beban maksimum.
Data statistik VSImax:
VSIbase = 918 ms, VSI Threshold tidak tercapai.
Data statistik terperinci VSImax:
Grafik menunjukkan bahwa tidak ada penurunan kinerja yang diamati selama keseluruhan pengujian.
Statistik beban CPU:
Saat melakukan pengujian ini, beban pada CPU host hampir maksimal.
Statistik beban sistem penyimpanan dari pemantauan SimpliVity:
Performa sistem penyimpanan tetap sama selama pengujian.
Beban pada sistem penyimpanan selama pengujian adalah sekitar 6 IOPS dengan rasio 500/60 (40 IOPS baca, 3 IOPS tulis), yaitu sekitar 900 IOPS per stasiun kerja.
Waktu respons rata-rata 3 ms untuk menulis dan hingga 1 ms untuk membaca.
Total
Saat mensimulasikan beban nyata pada infrastruktur HPE SimpliVity, diperoleh hasil yang mengonfirmasi kemampuan sistem untuk mendukung desktop virtual setidaknya 300 mesin Klon Penuh pada sepasang node SimpliVity. Pada saat yang sama, waktu respons sistem penyimpanan dipertahankan pada tingkat optimal selama seluruh pengujian.
Kami sangat terkesan dengan pendekatan pengujian yang panjang dan perbandingan solusi sebelum implementasi. Kami juga dapat menguji kinerja beban kerja Anda jika Anda mau. Termasuk solusi hiperkonvergensi lainnya. Pelanggan yang disebutkan sekarang sedang menyelesaikan pengujian pada solusi lain secara paralel. Infrastrukturnya saat ini hanyalah armada PC, domain, dan perangkat lunak di setiap tempat kerja. Pindah ke VDI tanpa tes tentu saja cukup sulit. Secara khusus, sulit untuk memahami kemampuan nyata dari sebuah peternakan VDI tanpa memigrasikan pengguna sebenarnya ke sana. Dan pengujian ini memungkinkan Anda dengan cepat mengevaluasi kemampuan sebenarnya dari sistem tertentu tanpa perlu melibatkan pengguna biasa. Dari sinilah penelitian ini berasal.
Pendekatan penting kedua adalah pelanggan segera berkomitmen pada penskalaan yang tepat. Di sini Anda dapat membeli server tambahan dan menambahkan peternakan, misalnya untuk 100 pengguna, semuanya dapat diprediksi dengan harga pengguna. Misalnya, ketika mereka perlu menambah 300 pengguna lagi, mereka akan mengetahui bahwa mereka memerlukan dua server dalam konfigurasi yang sudah ditentukan, daripada mempertimbangkan kembali untuk meningkatkan seluruh infrastruktur mereka.
Kemungkinan federasi HPE SimpliVity menarik. Bisnis ini terpisah secara geografis, jadi masuk akal untuk memasang perangkat keras VDI Anda sendiri yang terpisah di kantor yang jauh. Di federasi SimpliVity, setiap mesin virtual direplikasi sesuai jadwal dengan kemampuan untuk mereplikasi antara cluster yang jauh secara geografis dengan sangat cepat dan tanpa beban pada saluran - ini adalah cadangan bawaan dengan tingkat yang sangat baik. Saat mereplikasi VM antar situs, saluran digunakan seminimal mungkin, dan ini memungkinkan untuk membangun arsitektur DR yang sangat menarik dengan adanya satu pusat kendali dan sekumpulan situs penyimpanan terdesentralisasi.
Semua hal ini memungkinkan untuk mengevaluasi sisi keuangan dengan sangat rinci, dan untuk menempatkan biaya VDI pada rencana pertumbuhan perusahaan, dan untuk memahami seberapa cepat solusi tersebut akan membuahkan hasil dan bagaimana cara kerjanya. Karena VDI apa pun adalah solusi yang pada akhirnya menghemat banyak sumber daya, namun pada saat yang sama, kemungkinan besar, tanpa peluang hemat biaya untuk mengubahnya dalam waktu 5-7 tahun penggunaan.
Secara umum, jika Anda memiliki pertanyaan yang tidak perlu dikomentari, tulislah kepada saya melalui email [email dilindungi].
Sumber: www.habr.com