Googleova nova neuronska mreža je mnogo preciznija i brža od popularnih kolega

Konvolucione neuronske mreže (CNN), inspirisane biološkim procesima u ljudskom vizuelnom korteksu, veoma su prikladne za zadatke kao što su prepoznavanje objekata i lica, ali poboljšanje njihove tačnosti zahteva zamorno i fino podešavanje. Zbog toga naučnici iz Google AI Research-a istražuju nove modele koji "skaliraju" CNN-ove na "strukturiraniji" način. Rezultate svog rada objavili su u članak "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks", čiji je domaćin naučni portal Arxiv.org, kao i u publikacije na vašem blogu. Koautori tvrde da porodica sistema veštačke inteligencije, nazvana EfficientNets, premašuje tačnost standardnih CNN-a i poboljšava efikasnost neuronske mreže do 10 puta.

Googleova nova neuronska mreža je mnogo preciznija i brža od popularnih kolega

"Uobičajena praksa za skaliranje modela je proizvoljno povećanje dubine ili širine CNN-a, kao i korištenje veće rezolucije ulazne slike za obuku i evaluaciju", piše softverski inženjer Mingxing Tan i vodeći naučnik u Google AI. Quoc Li (Quoc V.le). "Za razliku od tradicionalnih pristupa koji proizvoljno skaliraju mrežne parametre kao što su širina, dubina i ulazna rezolucija, naša metoda ujednačeno mjeri svaku dimenziju s fiksnim skupom faktora skaliranja."

Da bi se dalje poboljšale performanse, istraživači zagovaraju upotrebu nove jezgrene mreže, mobilne invertirane konvolucije uskog grla (MBConv), koja služi kao osnova za EfficientNets porodicu modela.

U testovima, EfficientNets je pokazao i veću tačnost i bolju efikasnost od postojećih CNN-a, smanjujući zahtjeve za veličinom parametara i računskim resursima za red veličine. Jedan od modela, EfficientNet-B7, pokazao je 8,4 puta manju veličinu i 6,1 puta bolje performanse od dobro poznatog CNN Gpipea, a postigao je i 84,4% i 97,1% tačnosti (Top-1 i Top-5 rezultat) u testiranju na ImageNet set. U poređenju sa popularnim CNN ResNet-50, drugi EfficientNet model, EfficientNet-B4, koristeći slične resurse, pokazao je tačnost od 82,6% naspram 76,3% za ResNet-50.

EfficientNets modeli su se dobro pokazali na drugim skupovima podataka, postigavši ​​visoku preciznost u pet od osam testova, uključujući CIFAR-100 (91,7% tačnosti) i cvijeće (98,8%).

Googleova nova neuronska mreža je mnogo preciznija i brža od popularnih kolega

„Pružajući značajna poboljšanja u performansama neuronskih modela, očekujemo da EfficientNets potencijalno posluži kao nova osnova za buduće izazove kompjuterskog vida“, pišu Tan i Li.

Izvorni kod i skripte vodiča za Google Cloud Tensor Processing Units (TPU) su besplatno dostupni na GitHub.



izvor: 3dnews.ru

Dodajte komentar