NVIDIA on julkaissut uusia, vieläkin vaikuttavampia tuloksia suurten kielimallien (LLM) kanssa työskentelyn alalla MLPerf Inference 4.0 -vertailussa. Viimeisen puolen vuoden aikana Hopper-arkkitehtuurin jo ennestään korkeat tulokset päättelyskenaarioissa on parantunut lähes kolminkertaisiksi. Tällainen vaikuttava tulos saavutettiin sekä H200-kiihdyttimien laitteistoparannusten että ohjelmistojen optimoinnin ansiosta. Generatiivinen tekoäly on kirjaimellisesti räjähtänyt alaa: viimeisen kymmenen vuoden aikana neuroverkkojen koulutukseen käytetty laskentateho on kasvanut kuusi suuruusluokkaa, eivätkä biljoonan parametrin LLM:t ole enää epätavallisia. Tällaisten mallien päättäminen on kuitenkin myös vaikea tehtävä, jota NVIDIA lähestyy kokonaisvaltaisesti käyttämällä omin sanoin "moniulotteista optimointia".
Lähde: 3dnews.ru