Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
Cara memperbarui peralatan jaringan di perusahaan besar tanpa menghentikan produksi? Dia berbicara tentang proyek skala besar dalam mode “operasi jantung terbuka”. Manajer manajemen proyek Linxdatacenter Oleg Fedorov. 

Selama beberapa tahun terakhir, kami telah mencatat peningkatan permintaan pelanggan terhadap layanan yang berkaitan dengan komponen jaringan infrastruktur TI. Kebutuhan akan konektivitas sistem TI, layanan, aplikasi, pemantauan dan tugas operasional manajemen bisnis di hampir semua bidang memaksa perusahaan saat ini untuk lebih memperhatikan jaringan.  

Kisaran permintaan berkisar dari memastikan toleransi kesalahan jaringan hingga membuat dan mengelola sistem otonom klien dengan membeli blok alamat IP, menyiapkan protokol perutean, dan mengelola lalu lintas sesuai dengan kebijakan organisasi.

Ada juga peningkatan permintaan akan solusi komprehensif untuk membangun dan memelihara infrastruktur jaringan, terutama dari pelanggan yang infrastruktur jaringannya dibuat dari awal atau sudah usang, sehingga memerlukan modifikasi serius. 

Tren ini bertepatan dengan periode pengembangan dan kompleksitas infrastruktur jaringan Linxdatacenter sendiri. Kami memperluas geografi kehadiran kami di Eropa dengan menghubungkan ke lokasi-lokasi terpencil, yang pada gilirannya memerlukan peningkatan infrastruktur jaringan. 

Perusahaan telah meluncurkan layanan baru untuk klien, Network-as-a-Service: kami menangani semua masalah jaringan klien, memungkinkan mereka untuk fokus pada bisnis inti mereka.

Pada musim panas tahun 2020, proyek besar pertama ke arah ini telah selesai, yang ingin saya bicarakan. 

Pada awalnya 

Sebuah kompleks industri besar meminta kami untuk memodernisasi bagian jaringan infrastruktur di salah satu perusahaannya. Peralatan lama perlu diganti dengan peralatan baru, termasuk inti jaringan.

Modernisasi peralatan terakhir di perusahaan tersebut terjadi sekitar 10 tahun yang lalu. Manajemen perusahaan yang baru memutuskan untuk meningkatkan konektivitas, dimulai dengan memperbarui infrastruktur pada tingkat fisik yang paling dasar. 

Proyek ini dibagi menjadi dua bagian: peningkatan taman server dan peralatan jaringan. Kami bertanggung jawab untuk bagian kedua. 

Persyaratan dasar untuk pekerjaan tersebut termasuk meminimalkan waktu henti di jalur produksi perusahaan selama pelaksanaan pekerjaan (dan di beberapa area, menghilangkan waktu henti sepenuhnya). Penghentian apa pun berarti kerugian finansial langsung bagi klien, yang seharusnya tidak terjadi dalam keadaan apa pun. Karena mode pengoperasian fasilitas 24x7x365, serta mempertimbangkan tidak adanya periode waktu henti yang direncanakan dalam praktik perusahaan, kami diberi tugas untuk melakukan operasi jantung terbuka. Ini menjadi ciri pembeda utama dari proyek ini.

Pergilah

Pekerjaan tersebut direncanakan berdasarkan prinsip perpindahan dari node jaringan yang jauh dari inti ke node yang lebih dekat, serta dari node yang kurang mempengaruhi pekerjaan jalur produksi ke node yang secara langsung mempengaruhi pekerjaan ini. 

Misalnya, jika kita mengambil node jaringan di departemen penjualan, maka gangguan komunikasi akibat pekerjaan di departemen ini tidak akan mempengaruhi produksi dengan cara apapun. Pada saat yang sama, kejadian seperti itu akan membantu kami, sebagai kontraktor, untuk memeriksa kebenaran pendekatan yang dipilih untuk mengerjakan unit-unit tersebut dan, setelah menyesuaikan tindakan, mengerjakan tahap proyek selanjutnya. 

Penting tidak hanya untuk mengganti node dan kabel di jaringan, tetapi juga untuk mengkonfigurasi semua komponen dengan benar agar solusi secara keseluruhan berfungsi dengan benar. Konfigurasi inilah yang diuji dengan cara ini: mulai bekerja jauh dari inti, kami seolah memberikan diri kami “hak untuk membuat kesalahan” tanpa menempatkan area risiko yang penting bagi operasional perusahaan. 

Kami mengidentifikasi area yang tidak mempengaruhi proses produksi, serta area kritis - bengkel, unit bongkar muat, gudang, dll. Di area utama, waktu henti yang dapat diterima untuk setiap node jaringan secara terpisah disepakati dengan klien: dari 1 hingga 15 menit. Tidak mungkin untuk sepenuhnya menghindari pemutusan node jaringan individu, karena kabel harus dialihkan secara fisik dari peralatan lama ke yang baru, dan selama proses peralihan, "janggut" kabel yang terbentuk selama beberapa tahun beroperasi juga perlu diurai tanpa benar. perawatan (salah satu akibat dari pekerjaan outsourcing untuk pemasangan jalur kabel).

Pekerjaan tersebut dibagi menjadi beberapa tahap.

tahap 1 – Audit. Persiapan dan koordinasi pendekatan perencanaan kerja dan penilaian kesiapan tim: klien, kontraktor instalasi, dan tim kami.

tahap 2 – Pengembangan format pelaksanaan pekerjaan, dengan analisis dan perencanaan yang mendalam dan rinci. Kami memilih format daftar periksa dengan indikasi yang tepat tentang urutan dan urutan tindakan, hingga urutan peralihan kabel patch berdasarkan port.

tahap 3 – Melaksanakan pekerjaan di lemari yang tidak mempengaruhi produksi. Estimasi dan penyesuaian downtime untuk tahapan pekerjaan selanjutnya.

tahap 4 – Melaksanakan pekerjaan di lemari yang mempengaruhi produksi secara langsung. Estimasi dan penyesuaian downtime untuk pekerjaan tahap akhir.

tahap 5 – Melaksanakan pekerjaan di ruang server untuk mengganti peralatan yang tersisa. Luncurkan perutean pada kernel baru.

tahap 6 – Peralihan inti sistem secara berurutan dari konfigurasi jaringan lama ke konfigurasi baru untuk kelancaran transisi seluruh kompleks sistem (VLAN, perutean, dll.). Pada tahap ini, kami menghubungkan semua pengguna dan mentransfer semua layanan ke perangkat keras baru, memverifikasi bahwa koneksi sudah benar, memastikan tidak ada layanan perusahaan yang dihentikan, memastikan bahwa jika terjadi masalah, layanan tersebut akan terhubung langsung ke kernel, yang membuatnya lebih mudah untuk memecahkan masalah yang mungkin terjadi dan pengaturan akhir. 

Gaya rambut jenggot kawat

Proyek tersebut ternyata sulit juga karena kondisi awal yang sulit. 

Pertama, terdapat sejumlah besar node dan bagian jaringan, dengan topologi yang rumit dan klasifikasi kabel sesuai dengan tujuannya. “Jenggot” seperti itu harus dikeluarkan dari lemari dan “disisir” dengan susah payah, mencari tahu kawat mana yang berasal dari mana dan ke mana arahnya. 

Itu terlihat seperti ini:

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
sebagai berikut:

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
atau lebih: 

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
Kedua, untuk setiap tugas tersebut perlu menyiapkan file yang menjelaskan prosesnya. “Kita ambil kabel X dari port 1 peralatan lama, sambungkan ke port 18 peralatan baru.” Kedengarannya sederhana, tetapi ketika Anda memiliki 48 port yang benar-benar tersumbat di data sumber Anda, dan tidak ada opsi waktu henti (kita ingat sekitar 24x7x365), satu-satunya jalan keluar adalah bekerja dalam blok. Semakin banyak kabel yang dapat Anda keluarkan dari peralatan lama pada satu waktu, semakin cepat Anda dapat menyisirnya dan memasukkannya ke dalam perangkat keras jaringan baru, menghindari kegagalan dan downtime dalam jaringan. 

Oleh karena itu, pada tahap persiapan, kami membagi jaringan menjadi beberapa blok - yang masing-masing milik VLAN tertentu. Setiap port (atau subsetnya) pada peralatan lama adalah salah satu VLAN dalam topologi jaringan baru. Kami mengelompokkannya seperti ini: port pertama dari switch menampung jaringan pengguna, port tengah – jaringan produksi, dan yang terakhir – titik akses dan uplink. 

Pendekatan ini memungkinkan untuk mencabut dan menyisir dari peralatan lama tidak hanya 1 kawat, tetapi 10-15, sekaligus. Ini mempercepat proses kerja beberapa kali.  

Omong-omong, seperti inilah tampilan kabel di lemari setelah disisir: 

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
atau, misalnya, seperti ini: 

Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
Setelah menyelesaikan tahap ke-2, kami beristirahat sejenak untuk menganalisis kesalahan dan dinamika proyek. Misalnya, cacat kecil segera muncul karena ketidakakuratan dalam diagram jaringan yang diberikan kepada kami (konektor yang salah pada diagram berarti kabel patch yang dibeli salah dan perlu diganti). 

Jeda diperlukan, karena ketika bekerja dari sisi server, bahkan kesalahan kecil dalam proses tidak dapat diterima. Jika tujuannya adalah untuk memastikan waktu henti pada suatu bagian jaringan tidak lebih dari 5 menit, maka hal tersebut tidak dapat dilampaui. Setiap kemungkinan penyimpangan dari jadwal harus disetujui oleh klien. 

Namun, perencanaan awal dan pembagian proyek menjadi beberapa blok memungkinkan waktu henti yang direncanakan terpenuhi di semua area, dan dalam banyak kasus, menghindarinya sama sekali. 

Tantangan zaman - proyek di bawah COVID 

Namun, hal ini bukannya tanpa kesulitan tambahan. Tentu saja virus corona menjadi salah satu kendalanya. 

Pekerjaan ini menjadi rumit karena pandemi telah dimulai, dan tidak mungkin semua spesialis yang terlibat dalam proses tersebut hadir selama pekerjaan di lokasi klien. Hanya karyawan organisasi instalasi yang diizinkan masuk ke situs, dan kontrol dilakukan melalui ruang Zoom - di dalamnya terdapat insinyur jaringan dari Linxdatacenter, saya sendiri sebagai manajer proyek, insinyur jaringan dari klien yang bertanggung jawab atas pekerjaan tersebut, dan tim yang melakukan pekerjaan instalasi.

Masalah-masalah yang belum terselesaikan muncul selama pekerjaan, dan penyesuaian harus dilakukan dengan cepat. Dengan cara ini, pengaruh faktor manusia (kesalahan sirkuit, kesalahan dalam menentukan status aktivitas antarmuka, dll.) dapat dengan cepat dicegah.

Meskipun format kerja jarak jauh tampak tidak biasa pada awal proyek, kami dengan cepat beradaptasi dengan kondisi baru dan mencapai tahap akhir pekerjaan. 

Kami telah meluncurkan konfigurasi sementara pengaturan jaringan untuk memungkinkan dua inti jaringan - lama dan baru - berjalan secara paralel untuk mencapai transisi yang lancar. Namun, ternyata satu baris tambahan tidak dihapus dari file konfigurasi kernel baru, dan transisi tidak terjadi. Hal ini memaksa kami meluangkan waktu untuk mencari masalahnya. 

Ternyata lalu lintas utama ditransmisikan dengan benar, dan lalu lintas kontrol tidak mencapai node melalui inti baru. Berkat pembagian proyek yang jelas menjadi beberapa tahap, dimungkinkan untuk dengan cepat mengidentifikasi bagian jaringan tempat masalah muncul, mengidentifikasi masalah, dan menghilangkannya. 

Dan sebagai hasil

Hasil teknis proyek 

Pertama-tama, inti baru dari jaringan perusahaan baru telah dibuat, yang untuknya kami membangun cincin fisik/logis. Hal ini dilakukan sedemikian rupa sehingga setiap saklar dalam jaringan mempunyai “lengan kedua”. Di jaringan lama, banyak switch yang terhubung ke inti sepanjang satu rute, satu lengan (uplink). Jika rusak, saklar menjadi tidak dapat diakses sama sekali. Dan jika beberapa sakelar dihubungkan melalui satu uplink, maka kecelakaan itu akan melumpuhkan seluruh departemen atau lini produksi di perusahaan tersebut. 

Dalam jaringan baru, bahkan insiden jaringan yang cukup serius, dalam skenario apa pun, tidak akan mampu melumpuhkan seluruh jaringan atau sebagian besar jaringan tersebut. 

90% dari semua peralatan jaringan telah diperbarui, konverter media (konverter media propagasi sinyal) telah dinonaktifkan, dan kebutuhan saluran listrik khusus untuk memberi daya pada peralatan telah dihilangkan dengan menghubungkan ke sakelar PoE, di mana daya disuplai melalui kabel Ethernet. 

Selain itu, semua koneksi optik di ruang server dan lemari lapangan ditandai - di semua node komunikasi utama. Hal ini memungkinkan untuk menyiapkan diagram topologi peralatan dan koneksi dalam jaringan, yang mencerminkan keadaan sebenarnya saat ini. 

Diagram jaringan
Jaringan sebagai Layanan untuk perusahaan besar: kasus non-standar
Hasil yang paling penting dari segi teknis: pekerjaan infrastruktur berskala cukup besar dilakukan dengan cepat, tanpa menimbulkan gangguan apa pun dalam pekerjaan perusahaan dan hampir tanpa disadari oleh personelnya. 

Hasil bisnis proyek

Menurut saya, proyek ini menarik terutama bukan dari sisi teknisnya, tetapi dari sisi organisasinya. Kesulitannya terutama terletak pada perencanaan dan memikirkan langkah-langkah untuk melaksanakan tugas-tugas proyek. 

Keberhasilan proyek ini memungkinkan kami untuk mengatakan bahwa inisiatif kami untuk mengembangkan area jaringan dalam portofolio layanan Linxdatacenter adalah pilihan yang tepat untuk vektor pengembangan perusahaan. Pendekatan yang bertanggung jawab terhadap manajemen proyek, strategi yang kompeten, dan perencanaan yang jelas memungkinkan kami menyelesaikan pekerjaan pada tingkat yang tepat. 

Konfirmasi kualitas pekerjaan adalah permintaan dari klien untuk terus menyediakan layanan modernisasi jaringan di lokasi lainnya di Rusia.

Sumber: www.habr.com

Tambah komentar