เรื่องราวของสวิตช์ตัวหนึ่ง

เรื่องราวของสวิตช์ตัวหนึ่ง
ในการรวมเครือข่ายท้องถิ่นของเรา เรามีสวิตช์ Arista DCS-7050CX3-32S หกคู่ และสวิตช์ Brocade VDX 6940-36Q หนึ่งคู่ ไม่ใช่ว่าเราเครียดมากเกินไปกับสวิตช์ Brocade ในเครือข่ายนี้ พวกมันทำงานและทำหน้าที่ของมัน แต่เรากำลังเตรียมการทำงานอัตโนมัติเต็มรูปแบบสำหรับการดำเนินการบางอย่าง และเราไม่มีความสามารถเหล่านี้บนสวิตช์เหล่านี้ ฉันยังต้องการเปลี่ยนจากอินเทอร์เฟซ 40GE เป็นความเป็นไปได้ในการใช้ 100GE เพื่อสำรองไว้สำหรับ 2-3 ปีข้างหน้า ดังนั้นเราจึงตัดสินใจเปลี่ยน Brocade เป็น Arista

สวิตช์เหล่านี้เป็นสวิตช์การรวม LAN สำหรับศูนย์ข้อมูลแต่ละแห่ง สวิตช์การกระจาย (ระดับที่สองของการรวมกลุ่ม) เชื่อมต่อโดยตรงกับสวิตช์เหล่านั้น ซึ่งประกอบสวิตช์เครือข่ายท้องถิ่นระดับ Top-of-Rack ในชั้นวางพร้อมเซิร์ฟเวอร์แล้ว

เรื่องราวของสวิตช์ตัวหนึ่ง
แต่ละเซิร์ฟเวอร์เชื่อมต่อกับสวิตช์การเข้าถึงหนึ่งหรือสองตัว สวิตช์การเข้าถึงเชื่อมต่อกับสวิตช์การกระจายคู่หนึ่ง (สวิตช์การกระจายสองตัวและการเชื่อมต่อทางกายภาพสองตัวจากสวิตช์การเข้าถึงไปยังสวิตช์การกระจายที่แตกต่างกันจะใช้สำหรับการสำรอง)

แต่ละเซิร์ฟเวอร์สามารถใช้งานได้โดยไคลเอนต์ของตัวเอง ดังนั้นไคลเอนต์จึงได้รับการจัดสรร VLAN แยกต่างหาก จากนั้น VLAN เดียวกันจะถูกลงทะเบียนบนเซิร์ฟเวอร์อื่นของไคลเอ็นต์นี้ในแร็คใดๆ ศูนย์ข้อมูลประกอบด้วยแถวดังกล่าว (POD) หลายแถว โดยชั้นวางแต่ละแถวมีสวิตช์การกระจายของตัวเอง จากนั้นสวิตช์การกระจายเหล่านี้จะเชื่อมต่อกับสวิตช์การรวมกลุ่ม

เรื่องราวของสวิตช์ตัวหนึ่ง
ลูกค้าสามารถสั่งซื้อเซิร์ฟเวอร์ในแถวใดก็ได้ ซึ่งเป็นไปไม่ได้ที่จะคาดการณ์ล่วงหน้าว่าเซิร์ฟเวอร์จะได้รับการจัดสรรหรือติดตั้งในแถวใดแถวหนึ่งในแร็คเฉพาะ ซึ่งเป็นสาเหตุว่าทำไมจึงมี VLAN ประมาณ 2500 VLAN บนสวิตช์รวมในแต่ละศูนย์ข้อมูล

อุปกรณ์สำหรับ DCI (Data-Center Interconnect) เชื่อมต่อกับสวิตช์การรวม มีไว้สำหรับการเชื่อมต่อ L2 (สวิตช์คู่ที่สร้างอุโมงค์ VXLAN ไปยังศูนย์ข้อมูลอื่น) หรือสำหรับการเชื่อมต่อ L3 (เราเตอร์ MPLS สองตัว)

เรื่องราวของสวิตช์ตัวหนึ่ง
ดังที่ฉันได้เขียนไปแล้ว เพื่อรวมกระบวนการกำหนดค่าบริการบนอุปกรณ์ในศูนย์ข้อมูลแห่งเดียวให้เป็นหนึ่งเดียวกัน จำเป็นต้องเปลี่ยนสวิตช์การรวมส่วนกลาง เราติดตั้งสวิตช์ใหม่ถัดจากสวิตช์ที่มีอยู่ รวมเข้าด้วยกันเป็นคู่ MLAG และเริ่มเตรียมพร้อมสำหรับการทำงาน พวกเขาเชื่อมต่อกับสวิตช์การรวมกลุ่มที่มีอยู่ทันที เพื่อให้มีโดเมน L2 ร่วมกันทั่วทั้ง VLAN ของไคลเอ็นต์ทั้งหมด

รายละเอียดวงจร

สำหรับข้อมูลเฉพาะ เรามาตั้งชื่อสวิตช์การรวมแบบเก่ากันดีกว่า A1 и A2, ใหม่ - N1 и N2. ลองจินตนาการดูว่าใน POD1 и POD4 เซิร์ฟเวอร์ของไคลเอนต์หนึ่งถูกโฮสต์ S1,ไคลเอ็นต์ VLAN จะแสดงเป็นสีน้ำเงิน ไคลเอ็นต์นี้ใช้บริการการเชื่อมต่อ L2 กับศูนย์ข้อมูลอื่น ดังนั้น VLAN จึงถูกป้อนเข้ากับสวิตช์ VXLAN คู่หนึ่ง

ลูกค้า S2 โฮสต์เซิร์ฟเวอร์ใน POD2 и POD3,ไคลเอนต์ VLAN แสดงด้วยสีเขียวเข้ม ไคลเอนต์นี้ยังใช้บริการเชื่อมต่อกับศูนย์ข้อมูลอื่น แต่เป็น L3 ดังนั้น VLAN ของมันจึงถูกป้อนเข้ากับเราเตอร์ L3VPN หนึ่งคู่

เรื่องราวของสวิตช์ตัวหนึ่ง
เราต้องการไคลเอนต์ VLAN เพื่อทำความเข้าใจว่าขั้นตอนใดของงานทดแทนจะเกิดอะไรขึ้น ที่ใดที่การสื่อสารหยุดชะงัก และระยะเวลาอาจเป็นเท่าใด โครงร่างนี้ไม่ได้ใช้โปรโตคอล STP เนื่องจากความกว้างของแผนผังในกรณีนี้มีขนาดใหญ่และการบรรจบกันของโปรโตคอลจะเพิ่มขึ้นแบบทวีคูณตามจำนวนอุปกรณ์และลิงก์ระหว่างอุปกรณ์เหล่านั้น

อุปกรณ์ทั้งหมดที่เชื่อมต่อด้วยลิงก์คู่จะสร้างสแต็ก คู่ MLAG หรือแฟบริคอีเทอร์เน็ต VCS สำหรับเราเตอร์ L3VPN หนึ่งคู่ เทคโนโลยีดังกล่าวจะไม่ถูกนำมาใช้เนื่องจากไม่จำเป็นต้องมีการสำรองข้อมูล L2 เพียงพอแล้วที่จะมีการเชื่อมต่อ L2 ระหว่างกันผ่านสวิตช์การรวมกลุ่ม

ตัวเลือกการดำเนินงาน

เมื่อวิเคราะห์ตัวเลือกสำหรับเหตุการณ์เพิ่มเติม เราพบว่ามีหลายวิธีในการดำเนินงานนี้ ตั้งแต่การหยุดทั่วโลกบนเครือข่ายท้องถิ่นทั้งหมด ไปจนถึงการหยุดพักเพียง 1-2 วินาทีเล็กๆ น้อยๆ ในบางส่วนของเครือข่าย

เน็ตเวิร์ก หยุด! สวิตช์ เปลี่ยนมันซะ!

วิธีที่ง่ายที่สุดคือการประกาศการสื่อสารทั่วโลกหยุดบน POD ทั้งหมดและบริการ DCI ทั้งหมด และสลับลิงก์ทั้งหมดจากสวิตช์ А เพื่อสวิตช์ N.

เรื่องราวของสวิตช์ตัวหนึ่ง
นอกเหนือจากการหยุดชะงัก เวลาที่เราไม่สามารถคาดเดาได้อย่างน่าเชื่อถือ (ใช่ เราทราบจำนวนลิงก์ แต่เราไม่รู้ว่าจะมีข้อผิดพลาดเกิดขึ้นกี่ครั้ง - จากสายแพทช์ที่ชำรุดหรือตัวเชื่อมต่อที่เสียหายไปยังพอร์ตหรือตัวรับส่งสัญญาณที่ผิดพลาด ) เรายังไม่สามารถคาดเดาล่วงหน้าได้ว่าความยาวของสายแพทช์คอด DAC, AOC ที่เชื่อมต่อกับสวิตช์ A เก่าจะเพียงพอที่จะไปถึงสวิตช์ N ใหม่แม้จะยืนอยู่ข้างๆ แต่ก็ยังเล็กน้อยถึง ด้านข้าง และดูว่าตัวรับส่งสัญญาณเดียวกันจะทำงาน /DAC/AOC จากสวิตช์ Brocade ไปเป็นสวิตช์ Arista หรือไม่

และทั้งหมดนี้ภายใต้เงื่อนไขของแรงกดดันอย่างรุนแรงจากลูกค้าและการสนับสนุนทางเทคนิค (“นาตาชา ลุกขึ้น! นาตาชา ทุกอย่างใช้งานไม่ได้ที่นั่น! นาตาชา เราได้เขียนถึงฝ่ายสนับสนุนด้านเทคนิคแล้ว พูดตามตรง! นาตาชา พวกเขาทิ้งทุกอย่างไปแล้ว ! นาตาชา มันจะไม่ทำงานอีกสักเท่าไร นาตาชา เมื่อไหร่มันจะได้ผล!") แม้จะมีการหยุดและการแจ้งเตือนลูกค้าที่ประกาศไว้ล่วงหน้า แต่คำขอที่หลั่งไหลเข้ามาในช่วงเวลาดังกล่าวก็รับประกันได้

หยุด 1-2-3-4!

จะเป็นอย่างไรหากเราไม่ประกาศการหยุดทำงานทั่วโลก แต่เป็นการหยุดชะงักในการสื่อสารเล็กน้อยสำหรับบริการ POD และ DCI ในช่วงพักช่วงแรก ให้เปลี่ยนไปใช้สวิตช์ N เท่านั้น POD1ในครั้งที่สอง - ในอีกสองสามวัน - POD2แล้วอีกสองสามวัน POD3ฯลฯ พ็อด 4…[N]จากนั้น VXLAN จะสลับ จากนั้นเราเตอร์ L3VPN

เรื่องราวของสวิตช์ตัวหนึ่ง
ด้วยการสลับสับเปลี่ยนการทำงานนี้ เราจึงลดความซับซ้อนของการทำงานแบบครั้งเดียวและเพิ่มเวลาในการแก้ไขปัญหาหากมีสิ่งผิดปกติเกิดขึ้นกะทันหัน POD 1 ยังคงเชื่อมต่อกับ POD และ DCI อื่นๆ หลังจากการสลับ แต่งานเองก็ลากยาวต่อไปในระหว่างการทำงานในศูนย์ข้อมูลวิศวกรจะต้องทำการสลับทางกายภาพและในระหว่างการทำงาน (และงานดังกล่าวจะดำเนินการตามกฎในเวลากลางคืนตั้งแต่ 2 ถึง 5 น.) ต้องมีวิศวกรเครือข่ายออนไลน์อยู่ในคุณสมบัติระดับที่ค่อนข้างสูง แต่แล้วเราได้รับการหยุดชะงักในการสื่อสารสั้น ๆ ตามกฎแล้วงานสามารถดำเนินการได้ในช่วงเวลาครึ่งชั่วโมงโดยมีเวลาพักสูงสุด 2 นาที (ในทางปฏิบัติมักใช้เวลา 20-30 วินาทีกับพฤติกรรมที่คาดหวังของอุปกรณ์)

ในไคลเอนต์ตัวอย่าง S1 หรือลูกค้า S2 คุณจะต้องเตือนเกี่ยวกับงานที่มีการหยุดชะงักของการสื่อสารอย่างน้อยสามครั้ง - ครั้งแรกที่จะดำเนินการงานบน POD หนึ่งเครื่องซึ่งมีเซิร์ฟเวอร์ตัวใดตัวหนึ่งตั้งอยู่ ครั้งที่สอง - ในครั้งที่สองและครั้งที่สาม - เมื่อใด อุปกรณ์สวิตชิ่งสำหรับบริการ DCI

การสลับช่องทางการสื่อสารแบบรวม

เหตุใดเราจึงพูดถึงพฤติกรรมที่คาดหวังของอุปกรณ์ และวิธีที่สามารถเปลี่ยนช่องสัญญาณรวมในขณะที่ลดการหยุดชะงักของการสื่อสารได้อย่างไร ลองจินตนาการถึงภาพต่อไปนี้:

เรื่องราวของสวิตช์ตัวหนึ่ง
ด้านหนึ่งของลิงค์จะมีสวิตช์กระจาย POD - D1 и D2พวกเขาสร้างคู่ MLAG ซึ่งกันและกัน (สแต็ก, โรงงาน VCS, คู่ vPC) ในทางกลับกันมีสองลิงก์ - ลิงก์ 1 и ลิงก์ 2 - รวมอยู่ในคู่ MLAG ของสวิตช์การรวมตัวแบบเก่า А. ทางด้านสวิตช์ D อินเทอร์เฟซแบบรวมที่มีชื่อ พอร์ต-ช่อง Aที่ด้านข้างของสวิตช์การรวมกลุ่ม А - ส่วนต่อประสานรวมกับชื่อ พอร์ต-ช่อง D.

อินเทอร์เฟซแบบรวมใช้ LACP ในการดำเนินการ กล่าวคือ สวิตช์ทั้งสองด้านจะแลกเปลี่ยนแพ็กเก็ต LACPDU บนทั้งสองลิงก์เป็นประจำเพื่อให้แน่ใจว่าลิงก์:

  • ทำงาน;
  • รวมอยู่ในอุปกรณ์คู่เดียวที่รีโมท

เมื่อทำการแลกเปลี่ยนแพ็กเก็ต แพ็กเก็ตจะมีค่าอยู่ รหัสระบบระบุอุปกรณ์ที่มีลิงก์เหล่านี้รวมอยู่ด้วย สำหรับคู่ MLAG (สแต็ก โรงงาน ฯลฯ) ค่า system-id สำหรับอุปกรณ์ที่สร้างอินเทอร์เฟซแบบรวมจะเหมือนกัน สวิตช์ D1 ส่งไปที่ ลิงก์ 1 มูลค่า รหัสระบบ Dและสลับ D2 ส่งไปที่ ลิงก์ 2 มูลค่า รหัสระบบ D.

สวิตช์ A1 и A2 วิเคราะห์แพ็กเก็ต LACPDU ที่ได้รับผ่านอินเทอร์เฟซ Po D หนึ่งอินเทอร์เฟซ และตรวจสอบว่ารหัสระบบในนั้นตรงกันหรือไม่ หาก system-id ที่ได้รับจากลิงค์ใดลิงค์หนึ่งแตกต่างกะทันหัน จากมูลค่าการดำเนินงานในปัจจุบันจากนั้นลิงก์นี้จะถูกลบออกจากอินเทอร์เฟซแบบรวมจนกว่าสถานการณ์จะได้รับการแก้ไข ตอนนี้อยู่ที่ฝั่งสวิตช์ของเรา D ค่ารหัสระบบปัจจุบันจากพันธมิตร LACP - Aและด้านสวิตช์ А — ค่ารหัสระบบปัจจุบันจากพันธมิตร LACP — D.

หากเราจำเป็นต้องเปลี่ยนอินเทอร์เฟซแบบรวม เราสามารถทำได้สองวิธี:

วิธีที่ 1 - ง่าย
ปิดการใช้งานทั้งสองลิงค์จากสวิตช์ A. ในกรณีนี้ ช่องทางรวมจะไม่ทำงาน

เรื่องราวของสวิตช์ตัวหนึ่ง
เชื่อมต่อทั้งสองลิงก์ทีละตัวกับสวิตช์ Nจากนั้นพารามิเตอร์การทำงานของ LACP จะถูกเจรจาอีกครั้งและอินเทอร์เฟซจะถูกสร้างขึ้น พ็อด บนสวิตช์ N และการส่งผ่านค่าทางลิงค์ รหัสระบบ N.

เรื่องราวของสวิตช์ตัวหนึ่ง

วิธีที่ 2 - ลดการหยุดชะงักให้เหลือน้อยที่สุด
ยกเลิกการเชื่อมต่อลิงก์ 2 จากสวิตช์ A2. ขณะเดียวกันการจราจรระหว่าง А и D จะยังคงถูกส่งผ่านลิงก์ใดลิงก์หนึ่ง ซึ่งจะยังคงเป็นส่วนหนึ่งของอินเทอร์เฟซแบบรวม

เรื่องราวของสวิตช์ตัวหนึ่ง
เชื่อมต่อลิงก์ 2 เพื่อสลับ N2. บนสวิตช์ N อินเทอร์เฟซแบบรวมได้รับการกำหนดค่าแล้ว ปอ ดีเอ็นและสลับ N2 จะเริ่มส่งสัญญาณไปที่ LACPDU รหัสระบบ N. ในขั้นตอนนี้เราสามารถตรวจสอบสวิตช์ได้แล้ว N2 ทำงานอย่างถูกต้องกับตัวรับส่งสัญญาณที่ใช้ ลิงก์ 2ว่าพอร์ตเชื่อมต่อได้เข้าสู่สถานะแล้ว Upและไม่มีข้อผิดพลาดเกิดขึ้นบนพอร์ตการเชื่อมต่อเมื่อส่ง LACPDU

เรื่องราวของสวิตช์ตัวหนึ่ง
แต่ความจริงแล้วสวิตช์นั้น D2 สำหรับอินเทอร์เฟซแบบรวม ป.อ จากด้านข้าง ลิงก์ 2 ได้รับค่า system-id N ที่แตกต่างจากค่าระบบปฏิบัติการ-id A ปัจจุบัน, ไม่อนุญาตให้มีสวิตช์ D เข้าสู่ ลิงก์ 2 ส่วนหนึ่งของอินเทอร์เฟซแบบรวม ป.อ. สวิตช์ N ไม่สามารถเข้าได้ ลิงก์ 2 ในการใช้งาน เนื่องจากไม่ได้รับการยืนยันความสามารถในการทำงานจากพันธมิตร LACP ของสวิตช์ D2. ผลการสัญจรก็คือ ลิงก์ 2 ไม่ผ่าน

และตอนนี้เราปิดลิงก์ 1 จากสวิตช์ A1จึงเป็นการกีดกันสวิตช์ А и D อินเทอร์เฟซรวมการทำงาน ดังนั้นในด้านสวิตช์ D ค่ารหัสระบบการทำงานปัจจุบันสำหรับอินเทอร์เฟซจะหายไป ป.อ.

เรื่องราวของสวิตช์ตัวหนึ่ง
สิ่งนี้ทำให้สวิตช์ D и N ตกลงที่จะแลกเปลี่ยน system-id อัน บนอินเทอร์เฟซ ป.อ и ปอ ดีเอ็นเพื่อให้การรับส่งข้อมูลเริ่มส่งไปตามลิงก์ ลิงก์ 2. ในทางปฏิบัติการหยุดพักในกรณีนี้คือสูงสุด 2 วินาที

เรื่องราวของสวิตช์ตัวหนึ่ง
และตอนนี้เราสามารถสลับ Link 1 เพื่อสลับ N1 ได้อย่างง่ายดายคืนค่าความจุและระดับของความซ้ำซ้อนของอินเทอร์เฟซ ป.อ и ปอ ดีเอ็น. เนื่องจากเมื่อเชื่อมต่อลิงก์นี้ ค่า system-id ปัจจุบันจะไม่เปลี่ยนแปลงทั้งสองด้าน จึงไม่มีการหยุดชะงัก

เรื่องราวของสวิตช์ตัวหนึ่ง

ลิงค์เพิ่มเติม

แต่สวิตช์สามารถทำได้โดยไม่ต้องมีวิศวกรในขณะเปลี่ยน ในการดำเนินการนี้ เราจะต้องวางลิงก์เพิ่มเติมระหว่างสวิตช์การกระจายไว้ล่วงหน้า D และสวิตช์การรวมกลุ่มใหม่ N.

เรื่องราวของสวิตช์ตัวหนึ่ง
เรากำลังสร้างการเชื่อมโยงใหม่ระหว่างสวิตช์การรวมกลุ่ม N และสวิตช์กระจายสำหรับ POD ทั้งหมด ซึ่งจำเป็นต้องสั่งซื้อและวางสายแพตช์เพิ่มเติม และติดตั้งตัวรับส่งสัญญาณเพิ่มเติมเหมือนในนั้น N, และใน D. เราสามารถทำได้เพราะในสวิตช์ของเรา D POD แต่ละอันมีพอร์ตว่าง (หรือเราฟรีไว้ล่วงหน้า) เป็นผลให้แต่ละ POD เชื่อมต่อทางกายภาพด้วยสองลิงก์ไปยังสวิตช์ A เก่าและสวิตช์ N ใหม่

เรื่องราวของสวิตช์ตัวหนึ่ง
บนสวิตช์ D มีการสร้างอินเทอร์เฟซแบบรวมสองแบบ - ป.อ พร้อมลิงก์ ลิงก์ 1 и ลิงก์ 2และ ปอ เอ็น - พร้อมลิงค์ ลิงค์ N1 и ลิงค์ N2. ในขั้นตอนนี้ เราจะตรวจสอบการเชื่อมต่อที่ถูกต้องของอินเทอร์เฟซและลิงก์ ระดับของสัญญาณแสงที่ปลายทั้งสองด้านของลิงก์ (ผ่านข้อมูล DDM จากสวิตช์) เรายังสามารถตรวจสอบประสิทธิภาพของลิงก์ภายใต้โหลดหรือตรวจสอบสถานะของ สัญญาณแสงและอุณหภูมิตัวรับส่งสัญญาณเป็นเวลาสองสามวัน

การรับส่งข้อมูลยังคงส่งผ่านอินเทอร์เฟซ ป.อและอินเทอร์เฟซ ปอ เอ็น ไม่มีค่าใช้จ่ายการจราจร การตั้งค่าบนอินเทอร์เฟซเป็นดังนี้:

Interface Port-channel A
Switchport mode trunk
Switchport allowed vlan C1, C2

Interface Port-channel N
Switchport mode trunk
Switchport allowed vlan none

ตามกฎแล้วสวิตช์ D รองรับการกำหนดค่าเซสชันใหม่ โดยจะใช้สวิตช์รุ่นที่มีฟังก์ชันนี้ ดังนั้นเราจึงสามารถเปลี่ยนการตั้งค่าอินเทอร์เฟซ Po A และ Po N ได้ในขั้นตอนเดียว:

Configure session
Interface Port-channel A
Switchport allowed vlan none
Interface Port-channel N
Switchport allowed vlan C1, C2
Commit

จากนั้นการเปลี่ยนแปลงการกำหนดค่าจะเกิดขึ้นเร็วพอ และในทางปฏิบัติการหยุดพักจะไม่เกิน 5 วินาที

วิธีนี้ช่วยให้เราสามารถทำงานเตรียมการทั้งหมดให้เสร็จสิ้นล่วงหน้า ดำเนินการตรวจสอบที่จำเป็นทั้งหมด ประสานงานงานกับผู้เข้าร่วมในกระบวนการ คาดการณ์รายละเอียดการดำเนินการสำหรับการผลิตผลงาน โดยไม่ต้องเปลืองความคิดสร้างสรรค์เมื่อ “ทุกอย่างผิดพลาดไป” ” และมีแผนในการกลับไปสู่การกำหนดค่าก่อนหน้า งานตามแผนนี้ดำเนินการโดยวิศวกรเครือข่ายโดยไม่มีวิศวกรศูนย์ข้อมูลประจำไซต์งานซึ่งดำเนินการสวิตช์ทางกายภาพ

สิ่งที่สำคัญในวิธีการสลับนี้คือลิงก์ใหม่ทั้งหมดได้รับการตรวจสอบล่วงหน้าแล้ว ข้อผิดพลาด การรวมลิงก์ในหน่วย การโหลดลิงก์ - ข้อมูลที่จำเป็นทั้งหมดอยู่ในระบบการตรวจสอบแล้ว และสิ่งนี้ถูกวาดลงบนแผนที่แล้ว

D-Day

POD

เราเลือกเส้นทางการเปลี่ยนที่ยุ่งยากน้อยที่สุดสำหรับลูกค้า และสถานการณ์ที่ "มีข้อผิดพลาด" น้อยที่สุดพร้อมลิงก์เพิ่มเติม ดังนั้นเราจึงเปลี่ยน POD ทั้งหมดเป็นสวิตช์การรวมกลุ่มใหม่ภายในสองสามคืน

เรื่องราวของสวิตช์ตัวหนึ่ง
แต่สิ่งที่เหลืออยู่คือการเปลี่ยนอุปกรณ์ที่ให้บริการ DCI

L2

ในกรณีของอุปกรณ์ที่มีการเชื่อมต่อ L2 เราไม่สามารถทำงานที่คล้ายกันโดยใช้ลิงก์เพิ่มเติมได้ มีเหตุผลอย่างน้อยสองประการสำหรับสิ่งนี้:

  • ขาดพอร์ตว่างความเร็วที่ต้องการบนสวิตช์ VXLAN
  • ไม่มีฟังก์ชันการเปลี่ยนแปลงการกำหนดค่าเซสชันบนสวิตช์ VXLAN

เราไม่ได้สลับลิงก์ "ทีละครั้ง" โดยหยุดพักเฉพาะในขณะที่ยอมรับคู่รหัสระบบใหม่ เนื่องจากเราไม่มั่นใจ 100% ว่าขั้นตอนจะดำเนินไปอย่างถูกต้อง และการทดสอบในห้องปฏิบัติการแสดงให้เห็นว่าใน ในกรณีที่ “มีบางอย่างผิดพลาด” เรายังคงได้รับการเชื่อมต่อขัดข้อง และสิ่งที่เลวร้ายที่สุดไม่เพียงแต่สำหรับลูกค้าที่มีการเชื่อมต่อ L2 กับศูนย์ข้อมูลอื่นเท่านั้น แต่โดยทั่วไปสำหรับลูกค้าทั้งหมดของศูนย์ข้อมูลนี้

เราดำเนินการโฆษณาชวนเชื่อล่วงหน้าเกี่ยวกับการเปลี่ยนจากช่องทาง L2 ดังนั้นจำนวนลูกค้าที่ได้รับผลกระทบจากการทำงานบนสวิตช์ VXLAN จึงน้อยกว่าปีที่แล้วหลายเท่า ด้วยเหตุนี้ เราจึงตัดสินใจขัดจังหวะการสื่อสารผ่านบริการเชื่อมต่อ L2 โดยมีเงื่อนไขว่าเราจะคงการทำงานปกติของบริการเครือข่ายท้องถิ่นไว้ในศูนย์ข้อมูลแห่งเดียว นอกจากนี้ SLA สำหรับบริการนี้ยังให้ความเป็นไปได้ในการดำเนินงานตามกำหนดเวลาโดยมีการหยุดชะงัก

L3

เหตุใดเราจึงแนะนำให้ทุกคนเปลี่ยนไปใช้ L3VPN เมื่อจัดการบริการ DCI สาเหตุหนึ่งคือความสามารถในการทำงานบนเราเตอร์ตัวใดตัวหนึ่งที่ให้บริการนี้ เพียงแค่ลดระดับความซ้ำซ้อนลงเหลือ N+0 โดยไม่รบกวนการสื่อสาร

มาดูรูปแบบการให้บริการกันดีกว่า ในบริการนี้ เซ็กเมนต์ L2 จะเปลี่ยนจากเซิร์ฟเวอร์ไคลเอ็นต์ไปยังเราเตอร์ L3VPN Selectel เท่านั้น เครือข่ายไคลเอนต์ถูกยกเลิกบนเราเตอร์

เซิร์ฟเวอร์ไคลเอ็นต์แต่ละเครื่อง เช่น S2 и S3 ในแผนภาพด้านบน มีที่อยู่ IP ส่วนตัวของตัวเอง - 10.0.0.2/24 บนเซิร์ฟเวอร์ S2 и 10.0.0.3/24 บนเซิร์ฟเวอร์ S3. ที่อยู่ 10.0.0.252/24 и 10.0.0.253/24 กำหนดโดย Selectel ให้กับเราเตอร์ L3VPN-1 и L3VPN-2ตามลำดับ ที่อยู่ IP 10.0.0.254/24 เป็นที่อยู่ VRRP VIP บนเราเตอร์ Selectel

คุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับบริการ L3VPN อ่าน ในบล็อกของเรา

ก่อนสวิตช์ ทุกอย่างดูโดยประมาณตามแผนภาพ:

เรื่องราวของสวิตช์ตัวหนึ่ง
เราเตอร์สองตัว L3VPN-1 и L3VPN-2 เชื่อมต่อกับสวิตช์การรวมตัวแบบเก่า А. ต้นแบบสำหรับที่อยู่ VRRP VIP 10.0.0.254 คือเราเตอร์ L3VPN-1. มีลำดับความสำคัญสูงกว่าสำหรับที่อยู่นี้มากกว่าเราเตอร์ L3VPN-2.

unit 1006 {
    description C2;
    vlan-id 1006;
    family inet {       
        address 10.0.0.252/24 {
            vrrp-group 1 {
                priority 200;
                virtual-address 10.100.0.254;
                preempt {
                    hold-time 120;
                }
                accept-data;
            }
        }
    }
}

เซิร์ฟเวอร์ S2 ใช้เกตเวย์ 10.0.0.254 เพื่อสื่อสารกับเซิร์ฟเวอร์ในตำแหน่งอื่น ดังนั้น การยกเลิกการเชื่อมต่อเราเตอร์ L3VPN-2 จากเครือข่าย (แน่นอนว่า หากถูกตัดการเชื่อมต่อจากโดเมน MPLS เป็นครั้งแรก) จะไม่ส่งผลกระทบต่อการเชื่อมต่อเซิร์ฟเวอร์ของลูกค้า ณ จุดนี้ ระดับความซ้ำซ้อนของวงจรจะลดลงเพียงเล็กน้อย

เรื่องราวของสวิตช์ตัวหนึ่ง
หลังจากนี้เราสามารถเชื่อมต่อเราเตอร์อีกครั้งได้อย่างปลอดภัย L3VPN-2 ไปยังสวิตช์คู่หนึ่ง N. วางลิงค์ เปลี่ยนตัวรับส่งสัญญาณ อินเทอร์เฟซแบบลอจิคัลของเราเตอร์ซึ่งขึ้นอยู่กับการทำงานของบริการไคลเอ็นต์จะถูกปิดใช้งานจนกว่าจะได้รับการยืนยันว่าทุกอย่างทำงานตามที่ควร

หลังจากตรวจสอบลิงก์ ตัวรับส่งสัญญาณ ระดับสัญญาณ และระดับข้อผิดพลาดบนอินเทอร์เฟซแล้ว เราเตอร์ก็เริ่มทำงาน แต่ได้เชื่อมต่อกับสวิตช์คู่ใหม่แล้ว

เรื่องราวของสวิตช์ตัวหนึ่ง
ต่อไป เราจะลดลำดับความสำคัญ VRRP ของเราเตอร์ L3VPN-1 และที่อยู่ VIP 10.0.0.254 จะถูกย้ายไปยังเราเตอร์ L3VPN-2 งานเหล่านี้ยังดำเนินการโดยไม่หยุดชะงักของการสื่อสาร

เรื่องราวของสวิตช์ตัวหนึ่ง
การโอนที่อยู่ VIP 10.0.0.254 ไปยังเราเตอร์ L3VPN-2 อนุญาตให้คุณปิดการใช้งานเราเตอร์ L3VPN-1 โดยไม่หยุดชะงักการสื่อสารสำหรับไคลเอนต์และเชื่อมต่อกับสวิตช์การรวมคู่ใหม่ N.

เรื่องราวของสวิตช์ตัวหนึ่ง
การส่งคืน VRRP VIP ไปยังเราเตอร์ L3VPN-1 หรือไม่เป็นอีกคำถามหนึ่ง และแม้ว่าจะส่งคืนแล้วก็ตาม ก็ยังทำได้โดยไม่รบกวนการเชื่อมต่อ

เบ็ดเสร็จ

หลังจากขั้นตอนทั้งหมดนี้ เราได้เปลี่ยนสวิตช์การรวมกลุ่มในศูนย์ข้อมูลแห่งใดแห่งหนึ่งของเรา ขณะเดียวกันก็ลดการหยุดชะงักสำหรับลูกค้าของเราให้เหลือน้อยที่สุด

เรื่องราวของสวิตช์ตัวหนึ่ง
สิ่งที่เหลืออยู่คือการรื้อถอน การรื้อสวิตช์เก่า, การรื้อลิงค์เก่าระหว่างสวิตช์ A และ D, การรื้อตัวรับส่งสัญญาณจากลิงค์เหล่านี้, การแก้ไขการตรวจสอบ, การแก้ไขไดอะแกรมเครือข่ายในเอกสารประกอบและการตรวจสอบ

เราสามารถใช้สวิตช์, ตัวรับส่งสัญญาณ, สายแพทช์, AOC, DAC ที่เหลือหลังจากการสลับในโครงการอื่นหรือสำหรับการสลับอื่น ๆ ที่คล้ายกัน

“นาตาชา เราเปลี่ยนทุกอย่างแล้ว!”

ที่มา: will.com

เพิ่มความคิดเห็น