Konvoluciaj neŭralaj retoj (CNN), inspiritaj per biologiaj procezoj en la homa vidkortekso, estas bone konvenitaj por taskoj kiel ekzemple objekto kaj vizaĝrekono, sed plibonigi ilian precizecon postulas tedan kaj fajnan agordon. Tial sciencistoj ĉe Google AI Research esploras novajn modelojn, kiuj "skalas" CNN-ojn en "pli strukturita" maniero. Ili publikigis la rezulton de sia laboro en
"Ofta praktiko por grimpi modelojn estas arbitre pliigi la profundon aŭ larĝon de la CNN, kaj ankaŭ uzi pli altan rezolucion de la eniga bildo por trejnado kaj taksado," skribas endoma softvaristo Mingxing Tan kaj ĉefa sciencisto ĉe Google AI. Quoc Li (Quoc V .le). "Malsame al tradiciaj aliroj, kiuj arbitre skalas retajn parametrojn kiel larĝon, profundon kaj envenantan rezolucion, nia metodo unuforme skalas ĉiun dimension kun fiksa aro de skalaj faktoroj."
Por plu plibonigi rendimenton, la esploristoj rekomendas la uzon de nova kernreto, la movebla inversa botelkolo-konvolucio (MBConv), kiu funkcias kiel la bazo por la familio EfficientNets de modeloj.
En testoj, EfficientNets montris kaj pli altan precizecon kaj pli bonan efikecon ol ekzistantaj CNNoj, reduktante la postulon por parametrograndeco kaj komputilaj resursoj je grandordo. Unu el la modeloj, EfficientNet-B7, montris 8,4 fojojn pli malgrandan grandecon kaj 6,1 fojojn pli bonan rendimenton ol la konata CNN Gpipe, kaj ankaŭ atingis 84,4% kaj 97,1% precizecon (Supra-1 kaj Top-5 rezulto) en testado sur la ImageNet aro. Kompare kun la populara CNN ResNet-50, alia EfficientNet-modelo, EfficientNet-B4, uzante similajn rimedojn, montris precizecon de 82,6% kontraŭ 76,3% por ResNet-50.
La EfficientNets-modeloj rezultis bone sur aliaj datumaroj, atingante altan precizecon en kvin el ok testoj, inkluzive de la CIFAR-100 (91,7% precizeco) kaj
"Liverante signifajn plibonigojn en la agado de neŭralaj modeloj, ni atendas ke EfficientNets eble servos kiel nova fundamento por estontaj komputilvidaj defioj," Tan kaj Li skribas.
La fontkodo kaj lernilaj skriptoj por Google Cloud Tensor Processing Units (TPUoj) estas libere haveblaj ĉe
fonto: 3dnews.ru