Konvolusionele neurale netwerke (CNN's), geïnspireer deur biologiese prosesse in die menslike visuele korteks, is goed geskik vir take soos objek- en gesigherkenning, maar om hul akkuraatheid te verbeter verg vervelig en fyn instel. Dit is hoekom wetenskaplikes by Google AI Research nuwe modelle ondersoek wat CNN's op 'n "meer gestruktureerde" manier skaal. Hulle het die resultate van hul werk gepubliseer in
"Die algemene praktyk van skaalmodelle is om die diepte of breedte van die CNN arbitrêr te vergroot, en om hoër resolusie van die insetbeeld vir opleiding en evaluering te gebruik," skryf personeelsagteware-ingenieur Mingxing Tan en Google AI hoofwetenskaplike Quoc V .Le). "Anders as tradisionele benaderings wat netwerkparameters soos breedte, diepte en insetresolusie arbitrêr skaal, skaal ons metode elke dimensie eenvormig met 'n vaste stel skaalfaktore."
Om prestasie verder te verbeter, bepleit die navorsers die gebruik van 'n nuwe ruggraatnetwerk, mobiele omgekeerde bottelnek-konvolusie (MBConv), wat dien as die basis vir die EfficientNets-familie van modelle.
In toetse het EfficientNets beide hoër akkuraatheid en beter doeltreffendheid getoon as bestaande CNN's, wat parametergrootte en berekeningshulpbronvereistes met 'n orde van grootte verminder het. Een van die modelle, EfficientNet-B7, het 8,4 keer kleiner grootte en 6,1 keer beter werkverrigting as die bekende CNN Gpipe getoon, en het ook 84,4% en 97,1% akkuraatheid (Top-1 en Top-5). 50 resultate behaal in toetsing op die ImageNet-stel. In vergelyking met die gewilde CNN ResNet-4, het 'n ander EfficientNet-model, EfficientNet-B82,6, wat soortgelyke hulpbronne gebruik het, 'n akkuraatheid van 76,3% teenoor 50% vir ResNet-XNUMX behaal.
EfficientNets-modelle het goed gevaar op ander datastelle, en het hoë akkuraatheid op vyf van agt maatstawwe behaal, insluitend die CIFAR-100-datastel (91,7% akkuraatheid) en
"Deur aansienlike verbeterings in die doeltreffendheid van neurale modelle te verskaf, verwag ons dat EfficientNets die potensiaal het om as 'n nuwe grondslag vir toekomstige rekenaarvisie-take te dien," skryf Tan en Li.
Bronkode en opleidingsskrifte vir Google se wolktensorverwerkingseenhede (TPU's) is vrylik beskikbaar op
Bron: 3dnews.ru