Ihmisen visuaalisen aivokuoren biologisista prosesseista inspiroimat konvoluutiohermoverkot (CNN) soveltuvat hyvin esimerkiksi esineiden ja kasvojen tunnistamiseen, mutta niiden tarkkuuden parantaminen vaatii työlästä ja hienosäätöä. Tästä syystä Google AI Researchin tutkijat tutkivat uusia malleja, jotka skaalauttavat CNN:itä "strukturoidummin". He julkaisivat työnsä tulokset vuonna
"Yleinen skaalausmallien käytäntö on lisätä mielivaltaisesti CNN:n syvyyttä tai leveyttä ja käyttää korkeampaa syöttökuvan resoluutiota koulutukseen ja arviointiin", kirjoittaa henkilöstön ohjelmistoinsinööri Mingxing Tan ja Googlen tekoälyn johtava tutkija Quoc V .Le. "Toisin kuin perinteiset lähestymistavat, jotka skaalaavat mielivaltaisesti verkkoparametreja, kuten leveyttä, syvyyttä ja tuloresoluutiota, menetelmämme skaalaa jokaisen ulottuvuuden tasaisesti kiinteillä skaalauskertoimilla."
Suorituksen parantamiseksi entisestään tutkijat suosittelevat uuden runkoverkon käyttöä, mobiili käänteistä pullonkaulakonvoluutiota (MBConv), joka toimii pohjana EfficientNets-malliperheelle.
Testeissä EfficientNets on osoittanut sekä paremman tarkkuuden että paremman tehokkuuden kuin nykyiset CNN:t, mikä pienensi parametrien kokoa ja laskentaresurssien vaatimuksia suuruusluokkaa. Yksi malleista, EfficientNet-B7, osoitti 8,4 kertaa pienemmän koon ja 6,1 kertaa paremman suorituskyvyn kuin kuuluisa CNN Gpipe, ja saavutti myös 84,4 % ja 97,1 % tarkkuuden (Top-1 ja Top-5). 50 tulos) testattaessa ImageNet-sarja. Verrattuna suosittuun CNN ResNet-4:een, toinen EfficientNet-malli, EfficientNet-B82,6, käyttää samanlaisia resursseja, saavutti 76,3 %:n tarkkuuden ja ResNet-50:n XNUMX %.
EfficientNets-mallit suoriutuivat hyvin muissa tietojoukoissa ja saavuttivat korkean tarkkuuden viidellä kahdeksasta vertailuarvosta, mukaan lukien CIFAR-100-tietosarja (91,7 %:n tarkkuus) ja
"Tarjoamalla merkittäviä parannuksia hermomallien tehokkuuteen odotamme, että EfficientNets voi toimia uutena viitekehyksenä tuleville tietokonenäkötehtäville", Tan ja Li kirjoittavat.
Lähdekoodi ja koulutusskriptit Googlen pilvi tensorinkäsittelyyksiköille (TPU) ovat vapaasti saatavilla osoitteessa
Lähde: 3dnews.ru