การโยกย้ายโครงสร้างพื้นฐานด้านไอทีที่ล้มเหลวส่งผลให้เกิดความเสียหายกับบันทึกลูกค้าธนาคาร 1,3 พันล้านรายการ ทั้งหมดนี้เกิดจากการทดสอบที่ไม่เพียงพอและทัศนคติที่ไม่ใส่ใจต่อระบบไอทีที่ซับซ้อน Cloud4Y บอกว่ามันเกิดขึ้นได้อย่างไร
ในปี 2018 ภาษาอังกฤษ
มีคนไม่กี่คนที่ชอบจ่ายเงินให้แฟนเก่า ดังนั้นในวันที่ 22 เมษายน 2018 เวลา 18:00 น. TSB จึงเริ่มขั้นตอนสุดท้ายของแผน 18 เดือนที่ควรจะเปลี่ยนทุกอย่าง มีการวางแผนที่จะถ่ายโอนบันทึกลูกค้าหลายพันล้านรายการไปยังระบบไอทีของบริษัท Banco Sabadell ของสเปน ซึ่งซื้อ TSB ในราคา 2,2 พันล้านดอลลาร์ในปี 2015
José Olu ซีอีโอของ Banco Sabadell พูดเกี่ยวกับงานที่จะเกิดขึ้น 2 สัปดาห์ก่อนวันคริสต์มาสปี 2017 ในระหว่างการประชุมพนักงานตามเทศกาลในห้องประชุมอันทรงเกียรติในบาร์เซโลนา เครื่องมือการย้ายข้อมูลที่สำคัญที่สุดคือการต้องเป็นเวอร์ชันใหม่ของระบบที่พัฒนาโดย Banco Sabadell: Proteo มันถูกเปลี่ยนชื่อเป็น Proteo4UK โดยเฉพาะสำหรับโครงการย้ายข้อมูล TSB
ในการนำเสนอของ Proteo4UK Jaime Guardiola Romojaro ผู้อำนวยการบริหารของ Banco Sabadell อวดว่าระบบใหม่นี้เป็นโครงการขนาดใหญ่ที่ไม่มีระบบอะนาล็อกในยุโรป ซึ่งมีผู้เชี่ยวชาญมากกว่า 1000 คนทำงาน และการนำไปปฏิบัติจะช่วยส่งเสริมการเติบโตของ Banco Sabadell ในสหราชอาณาจักรอย่างมีนัยสำคัญ
กำหนดให้วันที่ 22 เมษายน 2018 เป็นวันอพยพ เย็นวันอาทิตย์ในช่วงกลางฤดูใบไม้ผลิเป็นช่วงเย็นวันอาทิตย์ที่เงียบสงบ ระบบไอทีของธนาคารล่มเนื่องจากมีการโอนบันทึกจากระบบหนึ่งไปยังอีกระบบหนึ่ง ด้วยการเข้าถึงบัญชีธนาคารของสาธารณะที่ได้รับการกู้คืนในช่วงดึกของวันอาทิตย์ ใครๆ ก็คาดหวังว่าธนาคารจะกลับมาให้บริการได้อย่างช้าๆ และราบรื่น
แต่ในขณะที่ Olyu และ Guardiola Romojaro ออกอากาศอย่างมีความสุขจากเวทีเกี่ยวกับการดำเนินโครงการ Proteo4UK พนักงานที่รับผิดชอบกระบวนการย้ายถิ่นฐานกลับรู้สึกกังวลมาก โครงการนี้ใช้เวลาดำเนินการ 18 เดือน แต่ล่าช้ากว่ากำหนดและเกินงบประมาณอย่างมาก ไม่มีเวลาทำการทดสอบเพิ่มเติม แต่การถ่ายโอนข้อมูลทั้งหมดของบริษัท (ซึ่งโปรดจำไว้ว่าเป็นพันล้านบันทึก) ไปยังระบบอื่นถือเป็นงานหนัก
ปรากฎว่าวิศวกรรู้สึกกังวลด้วยเหตุผลที่ดี
ต้นขั้วบนเว็บไซต์ที่ลูกค้าเห็นนานเกินไป
20 นาทีหลังจากที่ TSB เปิดการเข้าถึงบัญชี โดยมั่นใจอย่างเต็มที่ว่าการย้ายข้อมูลดำเนินไปอย่างราบรื่น รายงานปัญหาชุดแรกก็มาถึง
เงินออมของประชาชนก็หายไปจากบัญชีทันที การซื้อจำนวนเล็กน้อยถูกบันทึกเป็นค่าใช้จ่ายหลายพันดอลลาร์อย่างไม่ถูกต้อง บางคนลงชื่อเข้าใช้บัญชีส่วนตัวและไม่เห็นบัญชีธนาคารของตน แต่เป็นบัญชีของบุคคลอื่นโดยสิ้นเชิง
เมื่อเวลา 21:00 น. ตัวแทนของ TSB แจ้งหน่วยงานกำกับดูแลทางการเงินในท้องถิ่น (UK Financial Conduct Authority, FCA) ว่าธนาคารกำลังประสบปัญหา แต่ FCA ได้สังเกตเห็นแล้ว: TSB เสียหายหนักมาก และลูกค้าก็กลายเป็นคนโง่เขลา และแน่นอนว่าพวกเขาเริ่มบ่นว่า
หลังจากเที่ยงคืนพวกเขาสามารถติดต่อกับตัวแทนธนาคารคนหนึ่งได้ และถามพวกเขาเพียงคำถามเดียวว่า “มันเกิดอะไรขึ้น?”
การทำความเข้าใจขนาดของโศกนาฏกรรมครั้งนี้ต้องใช้เวลาพอสมควร แต่ตอนนี้เราทราบแล้วว่าบันทึกข้อมูล 1,3 พันล้านรายการจากลูกค้า 5,4 ล้านรายได้รับความเสียหายระหว่างการย้ายข้อมูล เป็นเวลาอย่างน้อยหนึ่งสัปดาห์ที่ลูกค้าไม่สามารถจัดการเงินของตนจากคอมพิวเตอร์หรืออุปกรณ์มือถือของตนได้ พวกเขาไม่สามารถจ่ายเงินกู้ได้ และลูกค้าธนาคารหลายรายได้รับตำหนิเกี่ยวกับประวัติเครดิตตลอดจนค่าธรรมเนียมล่าช้า
นี่คือลักษณะของธนาคารออนไลน์ของลูกค้า TSB
เมื่อข้อบกพร่องเริ่มปรากฏขึ้น เกือบจะในทันทีหลังจากนั้น ตัวแทนธนาคารยืนยันว่าปัญหานั้น "เกิดขึ้นเป็นระยะๆ" สามวันต่อมามีแถลงการณ์ว่าระบบทั้งหมดเป็นปกติ แต่ลูกค้าก็ยังคงแจ้งปัญหาต่อไป จนกระทั่งวันที่ 26 เมษายน พ.ศ. 2018 พอล เพสเตอร์ ประธานเจ้าหน้าที่บริหารของธนาคาร ยอมรับว่า TSB กำลัง "คุกเข่าลง" เนื่องจากโครงสร้างพื้นฐานด้านไอทีของธนาคารยังคงมี "ปัญหาแบนด์วิธ" ซึ่งทำให้ลูกค้าราวล้านรายไม่สามารถเข้าถึงบริการธนาคารออนไลน์ได้
สองสัปดาห์หลังจากการย้ายข้อมูล แอปพลิเคชันธนาคารออนไลน์ยังคงรายงานว่าพบข้อผิดพลาดภายในที่เกี่ยวข้องกับฐานข้อมูล SQL
ความยากลำบากในการชำระเงิน โดยเฉพาะอย่างยิ่งกับธุรกิจและการจำนองบิล ดำเนินไปนานถึงสี่สัปดาห์ และนักข่าวที่แพร่หลายพบว่า TSB ปฏิเสธข้อเสนอความช่วยเหลือจาก Lloyds Banking Group ในช่วงเริ่มต้นของวิกฤตการย้ายถิ่นฐาน โดยทั่วไปปัญหาที่เกี่ยวข้องกับการเข้าสู่ระบบบริการออนไลน์และความสามารถในการโอนเงินถูกพบจนถึงวันที่ 3 กันยายน
บิตของประวัติศาสตร์
ตู้เอทีเอ็มเครื่องแรกเปิดเมื่อวันที่ 27 มิถุนายน พ.ศ. 1967 ใกล้กับบาร์เคลย์ในเอนฟิลด์
ระบบไอทีด้านการธนาคารมีความซับซ้อนมากขึ้นตามความต้องการและความคาดหวังของลูกค้าจากธนาคารที่เพิ่มขึ้น ประมาณ 40-60 ปีที่แล้ว เราคงจะยินดีมากที่ได้ไปที่สาขาธนาคารในพื้นที่ของเราในช่วงเวลาทำการเพื่อฝากเงินสดหรือถอนเงินผ่านพนักงานธนาคาร
จำนวนเงินในบัญชีเกี่ยวข้องโดยตรงกับเงินสดและเหรียญที่เรามอบให้กับธนาคาร การบัญชีที่บ้านของเราสามารถติดตามได้ด้วยปากกาและกระดาษ และระบบคอมพิวเตอร์ก็ไม่สามารถเข้าถึงได้สำหรับลูกค้า พนักงานธนาคารใส่ข้อมูลจากสมุดคู่ฝากและสื่ออื่นๆ ลงในอุปกรณ์ที่ใช้นับเงิน
แต่ในปี 1967 ทางตอนเหนือของลอนดอนเป็นครั้งแรก
ตู้เอทีเอ็มเป็นเพียงจุดเริ่มต้น ในไม่ช้า ผู้คนก็สามารถหลีกเลี่ยงการต่อแถวที่เครื่องบันทึกเงินสดได้เพียงแค่โทรหาธนาคารทางโทรศัพท์ จำเป็นต้องมีการ์ดพิเศษที่เสียบเข้าไปในเครื่องอ่านที่สามารถถอดรหัสสัญญาณดูอัลโทนหลายความถี่ (DTMF) ที่ส่งเมื่อผู้ใช้กดปุ่ม "1" (ถอนเงิน) หรือ "2" (เงินฝาก)
ธนาคารทางอินเทอร์เน็ตและมือถือช่วยให้ลูกค้าใกล้ชิดกับระบบหลักที่ธนาคารพลังงานมากขึ้น แม้ว่าจะมีข้อจำกัดและการตั้งค่าที่แตกต่างกัน แต่ระบบทั้งหมดเหล่านี้จะต้องมีปฏิสัมพันธ์อย่างมีประสิทธิภาพระหว่างกันและกับเมนเฟรมหลัก ดำเนินการตรวจสอบยอดเงินในบัญชี ทำการโอนเงิน และอื่นๆ
มีลูกค้าเพียงไม่กี่รายที่คิดว่าเส้นทางข้อมูลมีความซับซ้อนเพียงใด เช่น เมื่อคุณเข้าสู่ระบบธนาคารออนไลน์เพื่อดูหรืออัปเดตข้อมูลเกี่ยวกับเงินในบัญชีของคุณ เมื่อคุณเข้าสู่ระบบ ข้อมูลนี้จะถูกส่งผ่านชุดของเซิร์ฟเวอร์ เมื่อคุณทำธุรกรรม ระบบจะทำซ้ำข้อมูลนี้ในโครงสร้างพื้นฐานแบ็กเอนด์ ซึ่งจะเป็นการทำงานหนัก เช่น การโอนเงินจากบัญชีหนึ่งไปยังอีกบัญชีหนึ่งเพื่อชำระค่าใช้จ่าย ทำ การชำระเงินและสมัครสมาชิกต่อ
ตอนนี้คูณกระบวนการนี้ด้วยหลายพันล้าน ตามข้อมูลที่รวบรวมโดยธนาคารโลกด้วยความช่วยเหลือของมูลนิธิบิลและเมลินดาเกตส์
ระบบไอทีภายในจำนวนมากของธนาคารแห่งหนึ่ง (ธนาคารบนมือถือ ตู้เอทีเอ็ม ฯลฯ) จะต้องไม่โต้ตอบกันเพียงอย่างเดียว พวกเขาจำเป็นต้องโต้ตอบกับระบบธนาคารอื่นๆ ในบราซิล จีน และเยอรมนี ตู้ ATM ของฝรั่งเศสควรจะสามารถจ่ายเงินที่อยู่ในบัตรธนาคารที่ออกให้ที่ไหนสักแห่งในโบลิเวียได้
เงินมีอยู่ทั่วโลกมาโดยตลอด แต่ระบบไม่เคยซับซ้อนขนาดนี้มาก่อน วิธีใช้ระบบไอทีของธนาคารมีเพิ่มมากขึ้น แต่วิธีเก่ายังคงใช้อยู่ ความสำเร็จของธนาคารส่วนใหญ่ขึ้นอยู่กับว่าโครงสร้างพื้นฐานด้านไอที "สามารถบำรุงรักษา" ได้อย่างไร และธนาคารสามารถรับมือกับความล้มเหลวกะทันหันอันเนื่องมาจากระบบจะไม่ได้ใช้งานได้อย่างมีประสิทธิภาพเพียงใด
ไม่มีการทดสอบ - เตรียมพร้อมสำหรับปัญหา
Jaime Guardiola ซีอีโอของ Banco de Sabadell (ซ้าย) มั่นใจว่าทุกอย่างจะราบรื่น ไม่ได้ผล
ระบบคอมพิวเตอร์ของ TSB ไม่สามารถแก้ปัญหาได้อย่างรวดเร็ว แน่นอนว่ามีข้อผิดพลาดของซอฟต์แวร์ แต่ในความเป็นจริงแล้ว ธนาคาร "พัง" เนื่องจากระบบไอทีมีความซับซ้อนมากเกินไป ตามรายงานซึ่งจัดทำขึ้นในช่วงแรกๆ ของการหยุดทำงานครั้งใหญ่ “การรวมกันของแอปพลิเคชันใหม่ การใช้งานไมโครเซอร์วิสที่เพิ่มขึ้น รวมกับการใช้ศูนย์ข้อมูล Active/Active สองแห่ง นำไปสู่ความเสี่ยงที่ซับซ้อนในการผลิต”
ธนาคารบางแห่ง เช่น HSBC ดำเนินงานทั่วโลก ดังนั้นจึงมีระบบที่เชื่อมโยงและซับซ้อนมาก แต่ได้รับการทดสอบ โยกย้าย และอัปเดตเป็นประจำ ตามที่ผู้จัดการฝ่ายไอทีของ HSBC ใน Lancaster กล่าว เขามองว่า HSBC เป็นต้นแบบว่าธนาคารอื่นๆ ควรจัดการระบบไอทีของตนอย่างไร โดยการทุ่มเทพนักงานและใช้เวลา แต่ในขณะเดียวกัน เขาก็ยอมรับว่าสำหรับธนาคารขนาดเล็ก โดยเฉพาะธนาคารที่ไม่มีประสบการณ์ในการโยกย้าย การดำเนินการอย่างถูกต้องถือเป็นงานที่ยากมาก
การโยกย้าย TSB เป็นเรื่องยาก และตามที่ผู้เชี่ยวชาญระบุว่า พนักงานธนาคารไม่สามารถเข้าถึงความซับซ้อนในระดับนี้ในแง่ของคุณสมบัติได้ นอกจากนี้ พวกเขาไม่สนใจที่จะตรวจสอบวิธีแก้ปัญหาหรือทดสอบการย้ายข้อมูลล่วงหน้าด้วยซ้ำ
ในระหว่างการกล่าวสุนทรพจน์ในรัฐสภาอังกฤษเกี่ยวกับปัญหาด้านการธนาคาร Andrew Bailey ผู้บริหารระดับสูงของ FCA ยืนยันข้อสงสัยนี้ รหัสที่ไม่ถูกต้องอาจก่อให้เกิดปัญหาเบื้องต้นที่ TSB เท่านั้น แต่ระบบที่เชื่อมโยงถึงกันของเครือข่ายการเงินทั่วโลกหมายความว่าข้อผิดพลาดจะคงอยู่ตลอดไปและไม่สามารถย้อนกลับได้ ธนาคารยังคงพบข้อผิดพลาดที่ไม่คาดคิดในส่วนอื่นของสถาปัตยกรรมไอที ลูกค้าได้รับข้อความที่ไม่มีความหมายหรือไม่เกี่ยวข้องกับปัญหาของตน
การทดสอบการถดถอยสามารถช่วยป้องกันความเสียหายโดยการตรวจจับโค้ดที่เสียหายก่อนที่จะเผยแพร่สู่การใช้งานจริง และทำให้เกิดความเสียหายโดยการสร้างข้อบกพร่องที่ไม่สามารถย้อนกลับได้ แต่ธนาคารตัดสินใจที่จะวิ่งผ่านเขตทุ่นระเบิดที่ธนาคารไม่รู้ด้วยซ้ำ ผลที่ตามมาสามารถคาดเดาได้ ปัญหาอีกประการหนึ่งคือ "การเพิ่มประสิทธิภาพ" ของต้นทุน มันแสดงออกมาได้อย่างไร? ความจริงก็คือก่อนหน้านี้มีการตัดสินใจที่จะยกเลิกสำเนาสำรองที่เก็บไว้ที่ Lloyds เนื่องจากพวกเขา "กิน" เงินมากเกินไป
ธนาคารในอังกฤษ (และธนาคารอื่นๆ ด้วย) มุ่งมั่นที่จะบรรลุระดับความพร้อมใช้งานสี่ในเก้า ซึ่งก็คือ 99,99% ในทางปฏิบัติ หมายความว่าระบบไอทีจะต้องพร้อมใช้งานตลอดเวลา โดยมีเวลาหยุดทำงานสูงสุด 52 นาทีต่อปี ระบบ “สามเก้า” 99,9% เมื่อมองแวบแรกไม่ได้แตกต่างกันมากนัก แต่ในความเป็นจริงแล้ว นี่หมายถึงการหยุดทำงานถึง 8 ชั่วโมงต่อปี สำหรับธนาคาร “สี่เก้า” เป็นสิ่งที่ดี แต่ “สามเก้า” ไม่ใช่
แต่ทุกครั้งที่บริษัททำการเปลี่ยนแปลงโครงสร้างพื้นฐานด้านไอที ย่อมมีความเสี่ยง ท้ายที่สุดมีบางอย่างผิดพลาดได้ การลดการเปลี่ยนแปลงสามารถช่วยหลีกเลี่ยงปัญหาได้ ในขณะที่การเปลี่ยนแปลงที่จำเป็นจำเป็นต้องได้รับการทดสอบอย่างรอบคอบ และหน่วยงานกำกับดูแลของอังกฤษได้มุ่งความสนใจไปที่ประเด็นนี้
บางทีวิธีที่ง่ายที่สุดในการหลีกเลี่ยงการหยุดทำงานคือทำการเปลี่ยนแปลงน้อยลง แต่ธนาคารทุกแห่งก็เหมือนกับบริษัทอื่น ๆ ที่ถูกบังคับให้แนะนำคุณสมบัติที่มีประโยชน์มากขึ้นเรื่อยๆ สำหรับลูกค้าและธุรกิจของตนเอง เพื่อให้สามารถแข่งขันได้ ในเวลาเดียวกัน ธนาคารยังคงมีหน้าที่ดูแลลูกค้า ปกป้องเงินออมและข้อมูลส่วนบุคคล มอบเงื่อนไขที่สะดวกสบายในการใช้บริการ ปรากฎว่าองค์กรต่างๆ ถูกบังคับให้ใช้เวลาและเงินจำนวนมากเพื่อรักษาสุขภาพของโครงสร้างพื้นฐานด้านไอทีของตน ขณะเดียวกันก็นำเสนอบริการใหม่ๆ ไปพร้อมๆ กัน
จำนวนความล้มเหลวทางเทคโนโลยีที่รายงานในภาคบริการทางการเงินในสหราชอาณาจักรเพิ่มขึ้น 187 เปอร์เซ็นต์ระหว่างปี 2017 ถึง 2018 ตามข้อมูลที่เผยแพร่โดย Financial Conduct Authority ของสหราชอาณาจักร สาเหตุส่วนใหญ่ของความล้มเหลวคือปัญหาในการใช้งานฟังก์ชันใหม่ ในเวลาเดียวกัน ถือเป็นสิ่งสำคัญสำหรับธนาคารที่จะต้องรับประกันการดำเนินงานบริการทั้งหมดอย่างต่อเนื่องและการรายงานธุรกรรมแทบจะในทันที ลูกค้าจะรู้สึกกังวลใจเสมอเมื่อเงินของพวกเขาไปอยู่ที่ไหนสักแห่ง และลูกค้าที่กังวลเรื่องเงินก็มักจะเป็นสัญญาณของปัญหาเสมอ
ไม่กี่เดือนหลังจากความล้มเหลวที่ TSB (ถึงเวลาที่ CEO ของธนาคารลาออก) หน่วยงานกำกับดูแลทางการเงินของสหราชอาณาจักร และ Bank of England
เอกสารนี้ยังเสนอให้มีการเปลี่ยนแปลงกฎหมายอีกด้วย เป็นเรื่องเกี่ยวกับการให้คนในบริษัทรับผิดชอบต่อสิ่งที่ผิดพลาดในระบบไอทีของบริษัทนั้น สมาชิกรัฐสภาอังกฤษอธิบายดังนี้: “เมื่อคุณมีความรับผิดชอบส่วนตัว และคุณสามารถล้มละลายหรือติดคุกได้ สิ่งนี้จะเปลี่ยนทัศนคติต่อการทำงานอย่างมาก รวมถึงการเพิ่มระยะเวลาที่ทุ่มเทให้กับประเด็นความน่าเชื่อถือและความปลอดภัย”
ผลของการ
การอัปเดตและแพตช์ทุกรายการเกี่ยวข้องกับการบริหารความเสี่ยง โดยเฉพาะอย่างยิ่งเมื่อมีเงินหลายร้อยล้านดอลลาร์เข้ามาเกี่ยวข้อง ท้ายที่สุดแล้ว หากมีสิ่งผิดปกติเกิดขึ้น อาจต้องเสียค่าใช้จ่ายทั้งในด้านเงินและชื่อเสียง มันจะดูเหมือนเป็นสิ่งที่ชัดเจน และความล้มเหลวของธนาคารในระหว่างการโยกย้ายน่าจะสอนพวกเขามากมาย
มี. แต่เขาไม่ได้สอนฉัน ในเดือนพฤศจิกายน 2019 TSB ซึ่งประสบความสำเร็จในการทำกำไรอีกครั้งและค่อยๆ ปรับปรุงชื่อเสียงของบริษัท ทำให้ลูกค้า “พอใจ”
ความเหนียวแน่นกับไอทีต้องแลกมาด้วยต้นทุนในที่สุด TSB รายงานผลขาดทุน 134 ล้านดอลลาร์ในปี 2018 เทียบกับกำไร 206 ล้านดอลลาร์ในปี 2017 ค่าใช้จ่ายหลังการย้ายข้อมูล รวมถึงการชดเชยลูกค้า การแก้ไขธุรกรรมฉ้อโกง (ซึ่งเพิ่มขึ้นอย่างรวดเร็วในช่วงความวุ่นวายของธนาคาร) และความช่วยเหลือจากบุคคลที่สาม มีมูลค่ารวมทั้งสิ้น 419 ล้านดอลลาร์ ผู้ให้บริการด้านไอทีของธนาคารยังถูกเรียกเก็บเงิน 194 ล้านดอลลาร์สำหรับบทบาทของตนในภาวะวิกฤติ
อย่างไรก็ตาม ไม่ว่าจะเรียนรู้บทเรียนอะไรจากความล้มเหลวของธนาคาร TSB ความหยุดชะงักก็ยังคงเกิดขึ้น พวกเขาหลีกเลี่ยงไม่ได้ แต่ด้วยการทดสอบและโค้ดที่ดี ปัญหาข้อขัดข้องและการหยุดทำงานสามารถลดลงได้อย่างมาก Cloud4Y ซึ่งมักจะช่วยให้บริษัทขนาดใหญ่ย้ายไปยังโครงสร้างพื้นฐานระบบคลาวด์ เข้าใจถึงความสำคัญของการย้ายจากระบบหนึ่งไปอีกระบบหนึ่งอย่างรวดเร็ว ดังนั้นเราจึงสามารถทำการทดสอบโหลดและใช้ระบบสำรองข้อมูลหลายระดับ รวมถึงตัวเลือกอื่น ๆ ที่ช่วยให้คุณตรวจสอบทุกสิ่งที่เป็นไปได้ก่อนเริ่มการย้าย
คุณสามารถอ่านอะไรได้อีกในบล็อก
→
→
→
→
→
สมัครสมาชิกของเรา
ที่มา: will.com