Benchmark ġdid - rekord ġdid: NVIDIA kkonfermat il-pożizzjoni ta 'tmexxija tagħha fl-Inferenza MLPerf

NVIDIA ppubblikat riżultati ġodda, saħansitra aktar impressjonanti fil-qasam tal-ħidma ma 'mudelli lingwistiċi kbar (LLM) fil-benchmark MLPerf Inference 4.0. Matul l-aħħar sitt xhur, ir-riżultati diġà għoljin murija mill-arkitettura Hopper f'xenarji ta 'inferenza tjiebu kważi tliet darbiet. Riżultat impressjonanti bħal dan inkiseb grazzi kemm għat-titjib tal-ħardwer fl-aċċeleraturi H200 kif ukoll għall-ottimizzazzjonijiet tas-softwer. L-AI ġenerattiva litteralment splodiet l-industrija: matul l-aħħar għaxar snin, is-saħħa tal-kompjuters minfuqa fuq it-taħriġ ta 'netwerks newrali kibret b'sitt ordnijiet ta' kobor, u LLMs b'parametri triljun m'għadhomx mhux tas-soltu. Madankollu, l-inferenza ta 'mudelli bħal dawn hija wkoll biċċa xogħol diffiċli, li NVIDIA tavviċina b'mod komprensiv, billi tuża, fi kliemha stess, "ottimizzazzjoni multidimensjonali".
Sors: 3dnews.ru

Żid kumment