Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Guten Tag, liebe Chabrowsk-Bewohner!

Ich möchte Ihnen eine lange und hoffentlich faszinierende und vielleicht nützliche Geschichte über den Zusammenbau eines „Dorf-Supercomputers“ aus einem Dell-Server-Node-Board, einer Nvidia-Tesla-K20-GPU und dem, was hier und da in verschiedenen Online-Shops oder in gekauft wurde, erzählen Computergeschäfte in Ihrer Stadt.

Die Geschichte begann, als ein befreundeter Programmierer, der auch Astronom ist, begann, neuronale Netze zu studieren. Ihr „Vollzeitspezialist“ kündigte und das Problem wurde dem „nächsten Spezialisten“ zugewiesen. Ich selbst bin kein Programmierer, sondern nur „Funkmechaniker für die Reparatur von Computergeräten (mit) meinem Diplom“, daher ist der Zusammenbau aller möglichen interessanten Computerhardware für mich eine interessante und unterhaltsame Tätigkeit. Leider arbeite ich in einem anderen Bereich.

Um die Aufgabe klarer zu formulieren, habe ich im Forum „Iron Ghosts of the Past“ ein Thema erstellt, in dem es ziemlich lange diskutiert wurde. Anfangs gab es eine eher naive Idee „einen 4-Wege-SLI auf einer GTX 580 3Gb zu bauen“, die sich nach und nach in die Einsicht verwandelte – man muss einen Server bauen! Die Preise für Server-Motherboards waren unverschämt hoch, bis ich auf Youtube auf ein interessantes Video über die Einführung eines chinesischen Server-Mainboards mit zwei nicht standardmäßigen Prozessorformaten stieß.

Hier ist ein Video:


Besonders gefreut hat mich der günstige Preis des Systems in diesem Video.

Die Beratung mit sachkundigeren Kameraden, die mit chinesischen Servern zu tun hatten, überzeugte mich jedoch: „Wir brauchen kein chinesisches Glück!“ Ihren Bewertungen zufolge waren chinesische Server schlichtweg ungeheuer unzuverlässig. Und ich fing an, bei Avito nach Optionen für Dell-Server-Mainboards zu suchen. Ich habe zwei Laptops dieser Firma und habe nur positive Eindrücke davon. Sehr zuverlässige Technologie.

Auf Avito habe ich ein Dell PowerEdge C6220-Serverknotenboard gefunden, als ich mit dem Verkäufer kommunizierte. Er empfahl mir eine ausgezeichnete Website, auf der es eine Veröffentlichung darüber gab, wie ein Handwerker ein solches Board auf den Markt brachte. Hier ist der Link. Und es gab einen Link zu einem amerikanischen Forum, wo leistungsstarke Workstations auf solchen Platinen aufgebaut wurden. Dieses Thema ist hier.

Ich habe das gesamte Thema von Anfang bis Ende gelesen und mich für Ziele, Vorgaben und Wege zu deren Erreichung entschieden. Die Aufgabe wurde wie folgt formuliert: „Bauen Sie einen Dual-Prozessor-Server auf einem Dell PowerEdge C8220-Knotenboard mit einer Tesla K10- oder K20-GPU zusammen.“ Die Entscheidung für spezialisierte GPUs fiel nach einem Gespräch mit der Person, für die das System eigentlich zusammengestellt werden sollte – da er über „Karten“ verfügte, die Langzeitberechnungen mit doppelter Präzision und Kontrolle von ECC-Speicherfehlern durchführen konnten, konnte er sie für seine wissenschaftlichen Zwecke nutzen Aktivitäten, und zwar nicht nur zum Training neuronaler Netze. Worüber er sich eigentlich sehr gefreut hat.

Um die Geschichte des Montageprozesses im Forum „Iron Ghosts of the Past“ zu diskutieren und aufzuzeichnen, habe ich ein entsprechendes Thema erstellt, in dem ich tatsächlich über den Prozess geschrieben und Fotos gepostet habe. Interessierte können sich informieren.

Die Aufgabe war gestellt und ich begann mit der Suche nach Komponenten. Zu dem Zeitpunkt, als alles begann, hatte ich noch keine Registrierung bei eBay und die benötigten Ersatzteile wurden zunächst von meinen Freunden gekauft, denen ich die Kosten für Kauf und Versand bezahlte. Später habe ich mich dort selbst registriert und direkt mit dem Kauf begonnen, obwohl ich manchmal diejenigen um Hilfe bitten muss, die Konten bei Shopotam und ähnlichen Diensten haben. Nicht alle benötigten Ersatzteile werden direkt aus den USA nach Russland verschickt.
Das erste Motherboard, das ich bei eBay gekauft habe, war das Dell PowerEdge C8220 0083N0. Laut Dell-Dokumentation gehörte es zur Board-Version 1.2 und verfügte über 3 PCI-E 16x-Steckplätze. Es gibt zwei reguläre in der Nähe des Power-Buttons und einen dritten auf der anderen Seite der Platine, der nicht dem Standard entspricht, für den sogenannten GPGPU-Riser, der im sogenannten Edge Slot enthalten war.

Foto der Platine, das gleiche 0083N0, Foto von eBay.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Und das ist mein Foto, an der Tafel ist ein Lineal angebracht, um den Maßstab zu verstehen.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Zu diesem Zeitpunkt war auch ein Riser für GPGPU im selben Edge-Slot bei mir eingetroffen.

Hier ist ein Foto, auf dem es zum Testen an seinen regulären Platz angeschlossen ist.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Gleichzeitig wurde bei eBay ein Netzteil gekauft, von ATX auf diesen C6100-Stromanschluss. Bei eBay werden zwei Arten davon verkauft: 12 und 18 Pins. Wir benötigen Letzteres und auch einen DC-DC-Boost, um +5VSB vom ATX-Netzteil in +12VSB des Dell-Servers umzuwandeln. Und natürlich ist die Buchse im Anschluss zum Installieren des Jumpers erforderlich, um die Platine zu starten und das PS_ON-Signal von ihr auszugeben. Es hat übrigens einen nicht standardmäßigen Kontaktabstand von 2.0 mm. Natürlich können verzweifelte Kerle einen Schraubenzieher oder einen Nagel direkt in den Platinenstecker stecken, aber ich habe es vorgezogen, alles höflich zu machen.

Um das Board zu testen, kauften wir außerdem den günstigsten Xeon E5-2604 V1 bei Aliexpress und ein Paar DDR3 ECC REG-Speichersticks bei eBay, die als kompatibel mit dem Dell PowerEdge C8220 verkauft wurden. Zunächst habe ich Alpine 20 Plus C0-Kühler für LGA 2011 verwendet, die modifiziert werden mussten – ihre auf den Speicherslots aufliegenden Kanten wurden mit einer Schleifmaschine gefeilt, Federscheiben wurden von den Befestigungsschrauben entfernt und ein Paar Muttern entfernt auf die Gewinde geschraubt - um die Schrauben nicht zu tief einzudrehen und das Brett nicht zu zerbrechen. LGA 2011-Serversockel sind etwas anders konstruiert als normale Sockel und die Gewinde der Kühlkörperschrauben sollten kurz sein. Die Kühler funktionierten übrigens gut, obwohl sie aus reinem Aluminium bestanden.

Und so kam der Moment, als die Prozessoren ankamen und ich ihre Installation als Erinnerung auf einem Foto festhielt.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Und hier sind die gleichen Alpine-Aluminiumkühler verbaut.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

Zusammengebautes und lauffähiges System.

Die Geschichte des Zusammenbaus eines „Dorf-Supercomputers“ aus Ersatzteilen von eBay, Aliexpress und einem Computerladen. Teil 1

An das System wurde mein altes treues Chieftek 550 W-Netzteil angeschlossen, ein USB-Hub für 4 Geräte, darunter eine Tastatur, eine Maus und ein Flash-Laufwerk mit Ubuntu, an den Anschluss für einen USB-Kartenleser wurde ein Kartenleser angeschlossen An die Platine, an die ich ein chinesisches USB-Audiogerät angeschlossen habe, habe ich außerdem einen VGA-Monitor und ein Patchkabel an den 100-Mbit-IPMI-Port angeschlossen, der Delicated-NIC genannt wird. Daneben befinden sich zwei 10-Gbe-Ports, die über normales Twisted-Pair-Kupfer betrieben werden und ein normales 100/1000-Netzwerk vollständig unterstützen.

Das System wurde in dieser Form gestartet und es stellte sich heraus, dass das Board beim Start sehr lange den Speicher überprüfte. Und im BIOS-Begrüßungsbildschirm nannte es sich Dell DCS 6220.

An dieser Stelle beende ich den ersten Teil meiner Geschichte, um dankbare Leser nicht zu langweilen.

Link zu Teil 2: habr.com/en/post/454448

Source: habr.com

Kommentar hinzufügen