La nova neŭrala reto de Google estas multe pli preciza kaj pli rapida ol popularaj ekvivalentoj

Konvoluciaj neŭralaj retoj (CNN), inspiritaj per biologiaj procezoj en la homa vidkortekso, estas bone konvenitaj por taskoj kiel ekzemple objekto kaj vizaĝrekono, sed plibonigi ilian precizecon postulas tedan kaj fajnan agordon. Tial sciencistoj ĉe Google AI Research esploras novajn modelojn, kiuj "skalas" CNN-ojn en "pli strukturita" maniero. Ili publikigis la rezulton de sia laboro en artikolo "EfficientNet: Repensado de Modelo-Skalado por Konvoluciaj Neŭralaj Retoj", gastigita fare de la scienca portalo Arxiv.org, same kiel en publikigadoj sur via blogo. La kunaŭtoroj asertas, ke la familio de sistemoj de artefarita inteligenteco, nomita EfficientNets, superas la precizecon de normaj CNN-oj kaj plibonigas la efikecon de neŭrala reto ĝis 10 fojojn.

La nova neŭrala reto de Google estas multe pli preciza kaj pli rapida ol popularaj ekvivalentoj

"Ofta praktiko por grimpi modelojn estas arbitre pliigi la profundon aŭ larĝon de la CNN, kaj ankaŭ uzi pli altan rezolucion de la eniga bildo por trejnado kaj taksado," skribas endoma softvaristo Mingxing Tan kaj ĉefa sciencisto ĉe Google AI. Quoc Li (Quoc V .le). "Malsame al tradiciaj aliroj, kiuj arbitre skalas retajn parametrojn kiel larĝon, profundon kaj envenantan rezolucion, nia metodo unuforme skalas ĉiun dimension kun fiksa aro de skalaj faktoroj."

Por plu plibonigi rendimenton, la esploristoj rekomendas la uzon de nova kernreto, la movebla inversa botelkolo-konvolucio (MBConv), kiu funkcias kiel la bazo por la familio EfficientNets de modeloj.

En testoj, EfficientNets montris kaj pli altan precizecon kaj pli bonan efikecon ol ekzistantaj CNNoj, reduktante la postulon por parametrograndeco kaj komputilaj resursoj je grandordo. Unu el la modeloj, EfficientNet-B7, montris 8,4 fojojn pli malgrandan grandecon kaj 6,1 fojojn pli bonan rendimenton ol la konata CNN Gpipe, kaj ankaŭ atingis 84,4% kaj 97,1% precizecon (Supra-1 kaj Top-5 rezulto) en testado sur la ImageNet aro. Kompare kun la populara CNN ResNet-50, alia EfficientNet-modelo, EfficientNet-B4, uzante similajn rimedojn, montris precizecon de 82,6% kontraŭ 76,3% por ResNet-50.

La EfficientNets-modeloj rezultis bone sur aliaj datumaroj, atingante altan precizecon en kvin el ok testoj, inkluzive de la CIFAR-100 (91,7% precizeco) kaj floroj (98,8%).

La nova neŭrala reto de Google estas multe pli preciza kaj pli rapida ol popularaj ekvivalentoj

"Liverante signifajn plibonigojn en la agado de neŭralaj modeloj, ni atendas ke EfficientNets eble servos kiel nova fundamento por estontaj komputilvidaj defioj," Tan kaj Li skribas.

La fontkodo kaj lernilaj skriptoj por Google Cloud Tensor Processing Units (TPUoj) estas libere haveblaj ĉe GitHub.



fonto: 3dnews.ru

Aldoni komenton