Googlen uusi hermoverkko on huomattavasti tarkempi ja nopeampi kuin suositut analogit

Ihmisen visuaalisen aivokuoren biologisista prosesseista inspiroimat konvoluutiohermoverkot (CNN) soveltuvat hyvin esimerkiksi esineiden ja kasvojen tunnistamiseen, mutta niiden tarkkuuden parantaminen vaatii työlästä ja hienosäätöä. Tästä syystä Google AI Researchin tutkijat tutkivat uusia malleja, jotka skaalauttavat CNN:itä "strukturoidummin". He julkaisivat työnsä tulokset vuonna статье "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", julkaistu tieteellisessä portaalissa Arxiv.org sekä Julkaisu blogissasi. Tekijät väittävät, että tekoälyjärjestelmien perhe, nimeltään EfficientNets, ylittää tavallisten CNN-verkkojen tarkkuuden ja lisää hermoverkon tehokkuutta jopa 10 kertaa.

Googlen uusi hermoverkko on huomattavasti tarkempi ja nopeampi kuin suositut analogit

"Yleinen skaalausmallien käytäntö on lisätä mielivaltaisesti CNN:n syvyyttä tai leveyttä ja käyttää korkeampaa syöttökuvan resoluutiota koulutukseen ja arviointiin", kirjoittaa henkilöstön ohjelmistoinsinööri Mingxing Tan ja Googlen tekoälyn johtava tutkija Quoc V .Le. "Toisin kuin perinteiset lähestymistavat, jotka skaalaavat mielivaltaisesti verkkoparametreja, kuten leveyttä, syvyyttä ja tuloresoluutiota, menetelmämme skaalaa jokaisen ulottuvuuden tasaisesti kiinteillä skaalauskertoimilla."

Suorituksen parantamiseksi entisestään tutkijat suosittelevat uuden runkoverkon käyttöä, mobiili käänteistä pullonkaulakonvoluutiota (MBConv), joka toimii pohjana EfficientNets-malliperheelle.

Testeissä EfficientNets on osoittanut sekä paremman tarkkuuden että paremman tehokkuuden kuin nykyiset CNN:t, mikä pienensi parametrien kokoa ja laskentaresurssien vaatimuksia suuruusluokkaa. Yksi malleista, EfficientNet-B7, osoitti 8,4 kertaa pienemmän koon ja 6,1 kertaa paremman suorituskyvyn kuin kuuluisa CNN Gpipe, ja saavutti myös 84,4 % ja 97,1 % tarkkuuden (Top-1 ja Top-5). 50 tulos) testattaessa ImageNet-sarja. Verrattuna suosittuun CNN ResNet-4:een, toinen EfficientNet-malli, EfficientNet-B82,6, käyttää samanlaisia ​​resursseja, saavutti 76,3 %:n tarkkuuden ja ResNet-50:n XNUMX %.

EfficientNets-mallit suoriutuivat hyvin muissa tietojoukoissa ja saavuttivat korkean tarkkuuden viidellä kahdeksasta vertailuarvosta, mukaan lukien CIFAR-100-tietosarja (91,7 %:n tarkkuus) ja Kukat (98,8%).

Googlen uusi hermoverkko on huomattavasti tarkempi ja nopeampi kuin suositut analogit

"Tarjoamalla merkittäviä parannuksia hermomallien tehokkuuteen odotamme, että EfficientNets voi toimia uutena viitekehyksenä tuleville tietokonenäkötehtäville", Tan ja Li kirjoittavat.

Lähdekoodi ja koulutusskriptit Googlen pilvi tensorinkäsittelyyksiköille (TPU) ovat vapaasti saatavilla osoitteessa Github.



Lähde: 3dnews.ru

Lisää kommentti