[ซูเปอร์คอมพิวเตอร์ 2019]. ที่เก็บข้อมูลมัลติคลาวด์เป็นพื้นที่ใช้งานสำหรับไดรฟ์ Kingston DC1000M ใหม่

ลองจินตนาการว่าคุณกำลังเปิดตัวธุรกิจทางการแพทย์ที่เป็นนวัตกรรมใหม่ - การเลือกยาแต่ละชนิดโดยอิงจากการวิเคราะห์จีโนมมนุษย์ ผู้ป่วยแต่ละรายมีคู่ยีน 3 พันล้านคู่ และเซิร์ฟเวอร์ปกติบนโปรเซสเซอร์ x86 จะใช้เวลาหลายวันในการคำนวณ คุณรู้ว่าคุณสามารถเพิ่มความเร็วกระบวนการบนเซิร์ฟเวอร์ได้ด้วยโปรเซสเซอร์ FPGA ที่ทำการคำนวณแบบขนานในหลายพันเธรด การคำนวณจีโนมจะเสร็จสิ้นภายในเวลาประมาณหนึ่งชั่วโมง เซิร์ฟเวอร์ดังกล่าวสามารถเช่าได้จาก Amazon Web Services (AWS) แต่ประเด็นสำคัญก็คือ ลูกค้า ซึ่งก็คือโรงพยาบาล ไม่เห็นด้วยกับการวางข้อมูลทางพันธุกรรมในระบบคลาวด์ของผู้ให้บริการอย่างเด็ดขาด ฉันควรทำอย่างไรดี? Kingston และสตาร์ทอัพระบบคลาวด์จัดแสดงสถาปัตยกรรมที่นิทรรศการ Supercomputing-2019 ที่เก็บข้อมูล MultiCloud ส่วนตัว (PMCS)ซึ่งช่วยแก้ปัญหานี้ได้

[ซูเปอร์คอมพิวเตอร์ 2019]. ที่เก็บข้อมูลมัลติคลาวด์เป็นพื้นที่ใช้งานสำหรับไดรฟ์ Kingston DC1000M ใหม่

เงื่อนไขสามประการสำหรับการประมวลผลประสิทธิภาพสูง

การคำนวณจีโนมมนุษย์ไม่ใช่งานเดียวในด้านการประมวลผลประสิทธิภาพสูง (HPC, คอมพิวเตอร์ประสิทธิภาพสูง) นักวิทยาศาสตร์คำนวณสนามทางกายภาพ วิศวกรคำนวณชิ้นส่วนเครื่องบิน นักการเงินคำนวณแบบจำลองทางเศรษฐกิจ และร่วมกันวิเคราะห์ข้อมูลขนาดใหญ่ สร้างโครงข่ายประสาทเทียม และทำการคำนวณที่ซับซ้อนอื่นๆ อีกมากมาย

เงื่อนไขสามประการของ HPC คือพลังการประมวลผลมหาศาล พื้นที่จัดเก็บข้อมูลขนาดใหญ่และรวดเร็วมาก และปริมาณงานเครือข่ายที่สูง ดังนั้นแนวทางปฏิบัติมาตรฐานสำหรับการดำเนินการคำนวณ LPC จึงอยู่ในศูนย์ข้อมูลของบริษัท (ภายในองค์กร) หรือที่ผู้ให้บริการในระบบคลาวด์

แต่ไม่ใช่ทุกบริษัทที่มีศูนย์ข้อมูลเป็นของตัวเอง และบริษัทที่มักจะด้อยกว่าศูนย์ข้อมูลเชิงพาณิชย์ในแง่ของประสิทธิภาพของทรัพยากร (ต้องใช้เงินลงทุนในการซื้อและอัปเดตฮาร์ดแวร์และซอฟต์แวร์ จ่ายค่าบุคลากรที่มีคุณสมบัติสูง ฯลฯ) ในทางกลับกัน ผู้ให้บริการคลาวด์จะนำเสนอทรัพยากรด้านไอทีตามรูปแบบต้นทุนการดำเนินงานแบบ “จ่ายตามการใช้งาน” กล่าวคือ ค่าเช่าจะคิดตามระยะเวลาการใช้งานเท่านั้น เมื่อการคำนวณเสร็จสิ้น เซิร์ฟเวอร์จะถูกลบออกจากบัญชี ซึ่งจะช่วยประหยัดงบประมาณด้านไอที แต่หากมีการห้ามทางกฎหมายหรือองค์กรในการถ่ายโอนข้อมูลไปยังผู้ให้บริการ การประมวลผล HPC ในระบบคลาวด์จะไม่สามารถใช้งานได้

ที่เก็บข้อมูล MultiCloud ส่วนตัว

สถาปัตยกรรม Private MultiCloud Storage ได้รับการออกแบบมาเพื่อให้สามารถเข้าถึงบริการคลาวด์ในขณะที่ทิ้งข้อมูลไว้บนไซต์องค์กรหรือในส่วนที่ปลอดภัยแยกต่างหากของศูนย์ข้อมูลโดยใช้บริการโคโลเคชั่น โดยพื้นฐานแล้ว มันเป็นโมเดลการประมวลผลแบบกระจายที่เน้นข้อมูลเป็นหลัก ซึ่งเซิร์ฟเวอร์คลาวด์ทำงานร่วมกับระบบจัดเก็บข้อมูลระยะไกลจากคลาวด์ส่วนตัว ดังนั้น เมื่อใช้ที่จัดเก็บข้อมูลภายในเครื่องเดียวกัน คุณสามารถทำงานกับบริการคลาวด์จากผู้ให้บริการรายใหญ่ที่สุดได้: AWS, MS Azure, Google Cloud Platform‎ เป็นต้น

แสดงตัวอย่างการใช้งาน PMCS ที่นิทรรศการ Supercomputing-2019 Kingston นำเสนอตัวอย่างระบบจัดเก็บข้อมูลประสิทธิภาพสูง (SSD) ที่ใช้ไดรฟ์ DC1000M SSD และหนึ่งในบริษัทสตาร์ทอัพระบบคลาวด์นำเสนอซอฟต์แวร์การจัดการ StorOne S1 สำหรับซอฟต์แวร์ พื้นที่จัดเก็บข้อมูลที่กำหนดและช่องทางการสื่อสารเฉพาะกับผู้ให้บริการระบบคลาวด์รายใหญ่

ควรสังเกตว่า PMCS ซึ่งเป็นรูปแบบการทำงานของการประมวลผลบนคลาวด์พร้อมพื้นที่เก็บข้อมูลส่วนตัว ได้รับการออกแบบมาสำหรับตลาดอเมริกาเหนือด้วยการเชื่อมต่อเครือข่ายที่พัฒนาแล้วระหว่างศูนย์ข้อมูลที่รองรับโครงสร้างพื้นฐาน AT&T และ Equinix ดังนั้น การ Ping ระหว่างระบบจัดเก็บข้อมูลแบบโคโลเคชั่นในโหนด Equinix Cloud Exchange และ AWS Cloud จึงน้อยกว่า 1 มิลลิวินาที (ที่มา: ไอทีโปรทูเดย์).

ในการสาธิตสถาปัตยกรรม PMCS ที่แสดงในนิทรรศการ ระบบจัดเก็บข้อมูลบนดิสก์ DC1000M NVMe อยู่ในตำแหน่งร่วม และเครื่องเสมือนได้รับการติดตั้งในระบบคลาวด์ AWS, MS Azure และ Google Cloud Platform ซึ่งส่ง Ping ซึ่งกันและกัน แอปพลิเคชันไคลเอนต์-เซิร์ฟเวอร์ทำงานร่วมกับระบบจัดเก็บข้อมูลของ Kingston และเซิร์ฟเวอร์ HP DL380 ในศูนย์ข้อมูลจากระยะไกล และเข้าถึงแพลตฟอร์มคลาวด์ของผู้ให้บริการรายใหญ่ดังที่กล่าวข้างต้นผ่านโครงสร้างพื้นฐานช่องทางการสื่อสาร Equinix

[ซูเปอร์คอมพิวเตอร์ 2019]. ที่เก็บข้อมูลมัลติคลาวด์เป็นพื้นที่ใช้งานสำหรับไดรฟ์ Kingston DC1000M ใหม่

สไลด์การนำเสนอ Private MultiCloud Storage ที่นิทรรศการ Supercomputing-2019 ที่มา: คิงส์ตัน

ซอฟต์แวร์ที่มีฟังก์ชันการทำงานคล้ายกันสำหรับการจัดการสถาปัตยกรรมของที่เก็บข้อมูลมัลติคลาวด์ส่วนตัวมีให้บริการโดยบริษัทต่างๆ ข้อกำหนดสำหรับสถาปัตยกรรมนี้อาจฟังดูแตกต่างออกไป - Private MultiCloud Storage หรือ Private Storage for Cloud

“ซูเปอร์คอมพิวเตอร์ในปัจจุบันใช้งานแอปพลิเคชัน HPC ที่หลากหลายซึ่งอยู่ในระดับแนวหน้าของความก้าวหน้า ตั้งแต่การสำรวจน้ำมันและก๊าซไปจนถึงการพยากรณ์อากาศ ตลาดการเงิน และการพัฒนาเทคโนโลยีใหม่” Keith Shimmenti ผู้จัดการฝ่ายการจัดการ SSD ระดับองค์กรของ Kingston กล่าว “แอปพลิเคชัน HPC เหล่านี้ต้องการความสอดคล้องกันที่มากขึ้นระหว่างประสิทธิภาพของโปรเซสเซอร์และความเร็ว I/O เราภูมิใจที่จะแบ่งปันว่าโซลูชันของ Kingston ช่วยขับเคลื่อนความก้าวหน้าในด้านการประมวลผล โดยมอบประสิทธิภาพที่จำเป็นในสภาพแวดล้อมการประมวลผลและแอพพลิเคชั่นที่หนักหน่วงที่สุดในโลกได้อย่างไร”

ไดรฟ์ DC1000M และตัวอย่างระบบจัดเก็บข้อมูลที่ใช้

DC1000M U.2 NVMe SSD ออกแบบโดย Kingston สำหรับศูนย์ข้อมูล และได้รับการออกแบบมาโดยเฉพาะสำหรับแอปพลิเคชันที่ใช้ข้อมูลจำนวนมากและ HPC เช่น แอปพลิเคชันปัญญาประดิษฐ์ (AI) และการเรียนรู้ของเครื่อง (ML)

[ซูเปอร์คอมพิวเตอร์ 2019]. ที่เก็บข้อมูลมัลติคลาวด์เป็นพื้นที่ใช้งานสำหรับไดรฟ์ Kingston DC1000M ใหม่

ไดรฟ์ DC1000M U.2 NVMe 3.84TB ที่มา: คิงส์ตัน

ไดรฟ์ DC1000M U.2 ใช้หน่วยความจำ Intel 96D NAND 3 เลเยอร์ ควบคุมโดยตัวควบคุม Silicon Motion SM2270 (PCIe 3.0 และ NVMe 3.0) Silicon Motion SM2270 คือตัวควบคุม NVMe ระดับองค์กร 16 เลนพร้อมอินเทอร์เฟซ PCIe 3.0 x8, บัสข้อมูล DRAM 32 บิตคู่ และโปรเซสเซอร์คู่ ARM Cortex R5 สามตัว

DC1000M มีความจุที่แตกต่างกันสำหรับการเปิดตัว: ตั้งแต่ 0.96 ถึง 7.68 TB (ความจุยอดนิยมที่สุดเชื่อว่าคือ 3.84 และ 7.68 TB) ประสิทธิภาพของไดรฟ์อยู่ที่ประมาณ 800 IOPS

[ซูเปอร์คอมพิวเตอร์ 2019]. ที่เก็บข้อมูลมัลติคลาวด์เป็นพื้นที่ใช้งานสำหรับไดรฟ์ Kingston DC1000M ใหม่

ระบบจัดเก็บข้อมูลพร้อม 10x DC1000M U.2 NVMe 7.68 TB ที่มา: คิงส์ตัน

เพื่อเป็นตัวอย่างของระบบจัดเก็บข้อมูลสำหรับแอปพลิเคชัน HPC Kingston นำเสนอโซลูชันแบบแร็คที่งาน Supercomputing 2019 พร้อมไดรฟ์ DC10M U.1000 NVMe จำนวน 2 ตัว โดยแต่ละตัวมีความจุ 7.68 TB ระบบจัดเก็บข้อมูลใช้ SB122A-PH ซึ่งเป็นแพลตฟอร์มฟอร์มแฟคเตอร์ 1U จาก AIC โปรเซสเซอร์: 2x Intel Xeon CPU E5-2660, Kingston DRAM 128 GB (8x16 GB) DDR4-2400 (หมายเลขชิ้นส่วน: KSM24RS4/16HAI) ระบบปฏิบัติการที่ติดตั้งคือ Ubuntu 18.04.3 LTS, Linux kernel เวอร์ชัน 5.0.0-31 การทดสอบ gfio v3.13 (เครื่องทดสอบ I/O แบบยืดหยุ่น) แสดงประสิทธิภาพการอ่าน 5.8 ล้าน IOPS พร้อมทรูพุต 23.8 Gbps

ระบบจัดเก็บข้อมูลที่นำเสนอแสดงให้เห็นคุณลักษณะที่น่าประทับใจในแง่ของการอ่านที่เสถียรถึง 5,8 ล้าน IOPS (การดำเนินการอินพุต-เอาต์พุตต่อวินาที) ซึ่งเร็วกว่า SSD สำหรับระบบตลาดมวลชนถึงสองเท่า ความเร็วในการอ่านนี้จำเป็นสำหรับแอปพลิเคชัน HPC ที่ทำงานบนโปรเซสเซอร์พิเศษ

Cloud Computing HPC พร้อมพื้นที่เก็บข้อมูลส่วนตัวในรัสเซีย

งานในการดำเนินการประมวลผลประสิทธิภาพสูงที่ผู้ให้บริการ แต่จัดเก็บข้อมูลทางกายภาพภายในองค์กรก็เกี่ยวข้องกับบริษัทในรัสเซียเช่นกัน อีกกรณีทั่วไปในธุรกิจในประเทศคือเมื่อใช้บริการคลาวด์ต่างประเทศ ข้อมูลจะต้องอยู่ในอาณาเขตของสหพันธรัฐรัสเซีย เราขอความคิดเห็นเกี่ยวกับสถานการณ์เหล่านี้ในนามของผู้ให้บริการระบบคลาวด์ Selectel ในฐานะพันธมิตรที่มีมายาวนานของ Kingston

“ในรัสเซีย เป็นไปได้ที่จะสร้างสถาปัตยกรรมที่คล้ายกัน โดยให้บริการเป็นภาษารัสเซียและเอกสารการรายงานทั้งหมดสำหรับแผนกบัญชีของลูกค้า หากบริษัทจำเป็นต้องดำเนินการประมวลผลประสิทธิภาพสูงโดยใช้ระบบจัดเก็บข้อมูลในองค์กร พวกเราที่ Selectel ให้เช่าเซิร์ฟเวอร์พร้อมโปรเซสเซอร์ประเภทต่างๆ รวมถึง FPGA, GPU หรือซีพียูแบบมัลติคอร์ นอกจากนี้ เรายังจัดระเบียบการวางช่องสัญญาณออปติคัลเฉพาะระหว่างสำนักงานของลูกค้าและศูนย์ข้อมูลของเราผ่านพันธมิตร” Alexander Tugov ผู้อำนวยการฝ่ายพัฒนาบริการของ Selectel ให้ความเห็น — ลูกค้ายังสามารถวางระบบจัดเก็บข้อมูลของเขาบนโคโลเคชั่นในห้องคอมพิวเตอร์ที่มีโหมดการเข้าถึงพิเศษและเรียกใช้แอปพลิเคชันทั้งบนเซิร์ฟเวอร์ของเราและในระบบคลาวด์ของผู้ให้บริการระดับโลก AWS, MS Azure, Google Cloud แน่นอนว่าความล่าช้าของสัญญาณในกรณีหลังจะสูงกว่าหากระบบจัดเก็บข้อมูลของลูกค้าตั้งอยู่ในสหรัฐอเมริกา แต่จะมีการเชื่อมต่อบรอดแบนด์มัลติคลาวด์”

ในบทความถัดไป เราจะพูดถึงโซลูชันอื่นของ Kingston ซึ่งนำเสนอที่นิทรรศการ Supercomputing 2019 (เดนเวอร์ โคโลราโด สหรัฐอเมริกา) และมีไว้สำหรับแอปพลิเคชันการเรียนรู้ของเครื่องและการวิเคราะห์ข้อมูลขนาดใหญ่โดยใช้ GPU นี่คือเทคโนโลยี GPUDirect Storage ซึ่งให้การถ่ายโอนข้อมูลโดยตรงระหว่างที่จัดเก็บข้อมูล NVMe และหน่วยความจำโปรเซสเซอร์ GPU นอกจากนี้ เราจะอธิบายวิธีที่เราจัดการเพื่อให้ได้ความเร็วในการอ่านข้อมูลที่ 5.8 ล้าน IOPS ในระบบจัดเก็บข้อมูลแบบแร็คบนดิสก์ NVMe

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับผลิตภัณฑ์ของ Kingston Technology โปรดเข้าไปที่ เว็บไซต์ของบริษัท.

ที่มา: will.com

เพิ่มความคิดเห็น