Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
Bagaimana untuk mengemas kini peralatan rangkaian dalam perusahaan besar tanpa menghentikan pengeluaran? Mengenai projek berskala besar dalam mod "pembedahan jantung terbuka" memberitahu Pengurus projek Linxdatacenter Oleg Fedorov. 

Sejak beberapa tahun kebelakangan ini, kami telah melihat peningkatan permintaan daripada pelanggan untuk perkhidmatan yang berkaitan dengan komponen rangkaian infrastruktur IT. Keperluan untuk ketersambungan sistem IT, perkhidmatan, aplikasi, tugas pemantauan dan pengurusan perniagaan operasi di hampir mana-mana kawasan memaksa syarikat hari ini untuk memberi perhatian yang lebih kepada rangkaian.  

Permintaan terdiri daripada menyediakan toleransi kesalahan rangkaian kepada mencipta dan mengurus sistem autonomi pelanggan dengan pemerolehan blok alamat IP, mengkonfigurasi protokol penghalaan dan mengurus trafik mengikut dasar organisasi.

Terdapat juga permintaan yang semakin meningkat untuk penyelesaian bersepadu untuk pembinaan dan penyelenggaraan infrastruktur rangkaian, terutamanya daripada pelanggan yang infrastruktur rangkaiannya dicipta dari awal atau sudah lapuk, memerlukan pengubahsuaian yang serius. 

Trend ini bertepatan dengan tempoh pembangunan dan komplikasi infrastruktur rangkaian Linxdatacenter sendiri. Kami mengembangkan geografi kehadiran kami di Eropah dengan menyambung ke tapak terpencil, yang seterusnya memerlukan penambahbaikan infrastruktur rangkaian. 

Syarikat itu telah melancarkan perkhidmatan baharu untuk pelanggan, Network-as-a-Service: kami menjaga semua tugas rangkaian untuk pelanggan, membolehkan mereka menumpukan pada perniagaan teras mereka.

Pada musim panas 2020, projek besar pertama ke arah ini telah siap, yang saya ingin bincangkan. 

Pada permulaannya 

Kompleks perindustrian besar berpaling kepada kami untuk pemodenan bahagian rangkaian infrastruktur di salah satu perusahaannya. Ia dikehendaki menggantikan peralatan lama dengan yang baru, termasuk teras rangkaian.

Pemodenan terakhir peralatan di perusahaan itu berlaku kira-kira 10 tahun yang lalu. Pengurusan baharu perusahaan memutuskan untuk meningkatkan ketersambungan, bermula dengan peningkatan infrastruktur pada tahap fizikal yang paling asas. 

Projek ini dibahagikan kepada dua bahagian: menaik taraf taman pelayan dan peralatan rangkaian. Kami bertanggungjawab untuk bahagian kedua. 

Keperluan asas untuk kerja itu termasuk meminimumkan masa henti bagi barisan pengeluaran perusahaan semasa pelaksanaan kerja (dan di sesetengah kawasan, penghapusan masa henti sepenuhnya). Sebarang perhentian adalah kerugian kewangan langsung pelanggan, yang tidak sepatutnya berlaku dalam apa jua keadaan. Sehubungan dengan mod operasi kemudahan 24x7x365, serta mengambil kira ketiadaan lengkap tempoh masa henti yang dirancang dalam amalan perusahaan, kami diberi tugas, sebenarnya, untuk melakukan pembedahan jantung terbuka. Ini menjadi ciri membezakan utama projek.

Pergi

Kerja-kerja telah dirancang mengikut prinsip pergerakan dari nod rangkaian yang jauh dari teras kepada yang lebih dekat, serta dari barisan pengeluaran yang kurang memberi kesan kepada kerja kepada yang menjejaskan kerja ini secara langsung. 

Sebagai contoh, jika anda mengambil nod rangkaian di jabatan jualan, maka kegagalan komunikasi akibat kerja di jabatan ini tidak akan menjejaskan pengeluaran dalam apa cara sekalipun. Pada masa yang sama, kejadian sedemikian akan membantu kami, sebagai kontraktor, untuk mengesahkan ketepatan pendekatan yang dipilih untuk bekerja pada nod tersebut dan, setelah membetulkan tindakan, bekerja pada peringkat projek seterusnya. 

Ia adalah perlu bukan sahaja untuk menggantikan nod dan wayar dalam rangkaian, tetapi juga untuk mengkonfigurasi semua komponen dengan betul untuk operasi penyelesaian yang betul secara keseluruhan. Konfigurasi yang disemak dengan cara ini: memulakan kerja jauh dari teras, kami memberikan diri kami "hak untuk membuat kesilapan", tanpa mendedahkan kawasan kritikal untuk operasi perusahaan kepada risiko. 

Kami telah mengenal pasti kawasan yang tidak menjejaskan proses pengeluaran, serta kawasan kritikal - bengkel, unit pemunggahan dan pemunggahan, gudang, dll. Di kawasan utama, kami bersetuju dengan pelanggan masa henti yang dibenarkan untuk setiap nod rangkaian secara berasingan: dari 1 hingga 15 minit. Adalah mustahil untuk mengelak sepenuhnya memutuskan sambungan nod rangkaian individu, kerana kabel mesti ditukar secara fizikal dari peralatan lama ke yang baru, dan dalam proses menukar, ia juga perlu untuk membongkar "janggut" wayar yang telah terbentuk selama beberapa tahun beroperasi tanpa penjagaan yang betul (salah satu akibat pemasangan kerja penyumberan luar talian kabel).

Kerja itu dibahagikan kepada beberapa peringkat.

Peringkat 1 - Audit. Penyediaan dan penyelarasan pendekatan kepada perancangan kerja dan penilaian kesediaan pasukan: pelanggan, kontraktor yang melaksanakan pemasangan, dan pasukan kami.

Peringkat 2 – Pembangunan format untuk menjalankan kerja, dengan analisis dan perancangan terperinci yang mendalam. Kami memilih format senarai semak dengan petunjuk tepat susunan dan urutan tindakan, sehingga urutan menukar kord tampalan mengikut port.

Peringkat 3 – Menjalankan kerja dalam kabinet yang tidak menjejaskan pengeluaran. Anggaran dan pelarasan masa henti untuk peringkat kerja berikutnya.

Peringkat 4 – Menjalankan kerja dalam kabinet yang menjejaskan pengeluaran secara langsung. Anggaran dan pelarasan masa henti untuk peringkat akhir kerja.

Peringkat 5 – Menjalankan kerja di bilik pelayan untuk menukar peralatan yang tinggal. Berjalan pada penghalaan pada kernel baharu.

Peringkat 6 – Penukaran berurutan teras sistem daripada konfigurasi rangkaian lama kepada yang baharu untuk peralihan yang lancar bagi keseluruhan kompleks sistem (VLAN, penghalaan, dll.). Pada peringkat ini, kami menyambungkan semua pengguna dan memindahkan semua perkhidmatan ke perkakasan baharu, menyemak sambungan yang betul, memastikan tiada perkhidmatan perusahaan berhenti, menjamin bahawa sekiranya berlaku sebarang masalah ia akan disambungkan terus ke kernel, yang menjadikannya lebih mudah untuk menghapuskan kemungkinan penyelesaian masalah dan persediaan akhir. 

Gaya rambut janggut dawai

Projek itu ternyata sukar juga kerana keadaan awal yang sukar. 

Pertama, ini adalah sejumlah besar nod dan bahagian rangkaian, dengan topologi yang rumit dan klasifikasi wayar mengikut tujuannya. "Janggut" sedemikian terpaksa dikeluarkan dari kabinet dan "disikat" dengan susah payah, memikirkan wayar dari mana dan ke mana ia membawa. 

Ia kelihatan seperti ini:

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
seperti ini:

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
atau sebagainya: 

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
Kedua, untuk setiap tugas sedemikian, perlu menyediakan fail dengan penerangan proses. "Kami mengambil wayar X dari port 1 peralatan lama, kami memasangkannya ke port 18 peralatan baharu." Bunyinya mudah, tetapi apabila anda mempunyai 48 port tersumbat sepenuhnya dalam data awal, dan tiada pilihan terbiar (kami ingat kira-kira 24x7x365), satu-satunya jalan keluar ialah bekerja dalam blok. Lebih banyak wayar yang anda boleh cabut daripada peralatan lama pada satu-satu masa, lebih cepat anda boleh membersihkannya dan memasangkannya ke dalam perkakasan rangkaian baharu, mengelakkan kegagalan rangkaian dan masa henti. 

Oleh itu, pada peringkat persediaan, kami membahagikan rangkaian kepada blok - setiap daripada mereka adalah milik VLAN tertentu. Setiap port (atau subset daripadanya) pada peralatan lama adalah salah satu daripada VLAN dalam topologi rangkaian baharu. Kami mengumpulkannya seperti berikut: port pertama suis menempatkan rangkaian pengguna, di tengah - rangkaian pengeluaran, dan di yang terakhir - titik akses dan pautan naik. 

Pendekatan ini memungkinkan untuk menarik keluar dan menyikat keluar dari peralatan lama bukan 1 wayar, tetapi 10-15 pada satu masa. Ini mempercepatkan aliran kerja beberapa kali.  

Ngomong-ngomong, ini adalah cara wayar dalam kabinet kelihatan selepas menyikat: 

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
atau, sebagai contoh, seperti ini: 

Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
Selepas selesai peringkat ke-2, kami berehat untuk menganalisis ralat dan dinamik projek. Sebagai contoh, kecacatan kecil serta-merta muncul disebabkan oleh ketidaktepatan dalam rajah rangkaian yang diberikan kepada kami (penyambung yang salah pada rajah ialah kord tampalan yang salah dibeli dan keperluan untuk menggantikannya). 

Jeda adalah perlu, kerana apabila bekerja dengan hak pelayan, walaupun kegagalan kecil dalam proses itu tidak boleh diterima. Jika matlamatnya adalah untuk memastikan masa henti pada bahagian rangkaian tidak lebih daripada 5 minit, maka masa itu tidak boleh dilampaui. Sebarang kemungkinan penyelewengan daripada jadual perlu dipersetujui dengan pelanggan. 

Walau bagaimanapun, perancangan awal dan penyekatan projek memungkinkan untuk memenuhi masa henti yang dirancang di semua tapak, dan dalam kebanyakan kes, untuk melakukannya tanpa itu sama sekali. 

Cabaran masa - projek di bawah COVID 

Walau bagaimanapun, ia bukan tanpa kesulitan tambahan. Sudah tentu, coronavirus adalah salah satu halangan. 

Kerja itu rumit kerana wabak bermula, dan adalah mustahil untuk hadir semasa kerja di tapak pelanggan untuk semua pakar yang terlibat dalam proses itu. Hanya pemasang dibenarkan masuk ke tapak, dan kawalan adalah melalui bilik Zoom yang termasuk jurutera rangkaian dari bahagian Linxdatacenter, saya sendiri sebagai pengurus projek, jurutera rangkaian dari pihak pelanggan yang bertanggungjawab ke atas kerja, dan pasukan yang melakukan kerja pemasangan.

Dalam perjalanan kerja, masalah yang tidak diambil kira timbul, dan pelarasan terpaksa dibuat dengan cepat. Oleh itu, adalah mungkin untuk menghalang pengaruh faktor manusia dengan cepat (ralat dalam skema, ralat dalam menentukan status aktiviti antara muka, dll.).

Walaupun format kerja jauh kelihatan luar biasa pada permulaan projek, kami cepat menyesuaikan diri dengan keadaan baharu dan memasuki peringkat akhir kerja. 

Kami telah menjalankan konfigurasi tetapan rangkaian sementara untuk menjalankan dua teras rangkaian, yang lama dan yang baharu, secara selari untuk mencapai peralihan yang lancar. Walau bagaimanapun, ternyata satu baris tambahan tidak dialih keluar dari fail konfigurasi kernel baru, dan peralihan tidak berlaku. Ini memaksa kami meluangkan sedikit masa mencari masalah tersebut. 

Ternyata trafik utama dihantar dengan betul, dan trafik kawalan tidak mencapai nod melalui teras baru. Oleh kerana pembahagian projek yang jelas secara berperingkat, adalah mungkin untuk mengenal pasti bahagian rangkaian dengan cepat di mana kesukaran timbul, mengenal pasti masalah dan menghapuskannya. 

Dan akibatnya

Keputusan teknikal projek 

Pertama sekali, teras baharu rangkaian perusahaan baharu telah dicipta, yang mana kami membina gelang fizikal/logik. Ini dilakukan sedemikian rupa sehingga setiap suis dalam rangkaian mempunyai "bahu kedua". Dalam rangkaian lama, banyak suis disambungkan ke teras di sepanjang satu laluan, satu bahu (uplink). Jika ia koyak, suis menjadi tidak boleh diakses sepenuhnya. Dan jika beberapa suis disambungkan melalui satu pautan atas, maka kemalangan itu melumpuhkan seluruh jabatan atau barisan pengeluaran di perusahaan. 

Dalam rangkaian baharu, walaupun insiden rangkaian yang agak serius dalam apa jua keadaan tidak akan dapat "meletakkan" keseluruhan rangkaian atau bahagian pentingnya. 

90% daripada semua peralatan rangkaian telah dikemas kini, penukar media (penukar medium perambatan isyarat) telah dinyahaktifkan, dan keperluan untuk talian kuasa khusus kepada peralatan kuasa dengan menyambung kepada suis PoE, di mana kuasa dibekalkan melalui wayar Ethernet, telah dihapuskan. 

Juga, semua sambungan optik dalam bilik pelayan dan dalam kabinet medan ditandakan - di semua nod komunikasi utama. Ini membolehkan untuk menyediakan gambarajah topologi peralatan dan sambungan dalam rangkaian, mencerminkan keadaan sebenar hari ini. 

Gambarajah rangkaian
Rangkaian-sebagai-Perkhidmatan untuk perusahaan besar: kes bukan standard
Keputusan yang paling penting dari segi teknikal: kerja infrastruktur berskala besar telah dijalankan dengan cepat, tanpa menimbulkan sebarang gangguan dalam kerja perusahaan dan hampir tidak dapat dilihat untuk kakitangannya. 

Hasil perniagaan projek

Pada pendapat saya, projek ini menarik terutamanya bukan dari segi teknikal, tetapi dari sisi organisasi. Kesukaran adalah terutamanya dalam merancang dan memikirkan langkah-langkah untuk melaksanakan tugas-tugas projek. 

Kejayaan projek itu membolehkan kami mengatakan bahawa inisiatif kami untuk membangunkan hala tuju rangkaian dalam portfolio perkhidmatan Linxdatacenter adalah pilihan yang tepat untuk vektor pembangunan syarikat. Pendekatan yang bertanggungjawab terhadap pengurusan projek, strategi yang cekap dan perancangan yang jelas membolehkan kami melaksanakan kerja pada tahap yang sepatutnya. 

Pengesahan kualiti kerja - permintaan daripada pelanggan untuk meneruskan penyediaan perkhidmatan untuk pemodenan rangkaian di tapak lain di Rusia.

Sumber: www.habr.com

Tambah komen